• Esbuild Bundler HMR


    Esbuild 虽然 bundler 非常快,但是其没有提供 HMR 的能力,在开发过程中只能采用 live-reload 的方案,一有代码改动,页面就需要全量 reload ,这极大降低开发体验。为此添加 HMR 功能至关重要。

    经过调研,社区内目前存在两种 HMR 方案,分别是 Webpack/ Parcel 为代表的 Bundler HMR 和 Vite 为代表的 Bundlerless HMR。经过考量,我们决定实现 Bundler HMR,在实现过程中遇到一些问题,做了一些记录,希望大家有所了解。

    前端自习课

    每日清晨,享受一篇前端优秀文章。

    137篇原创内容

    公众号

    ModuleLoader 模块加载器

    Esbuild 本身具有 Scope hosting 的功能,这是生产模式经常会开启的优化,会提高代码的执行速度,但是这模糊了模块的边界,无法区分代码具体来自于哪个模块,针对模块的 HMR 更无法谈起,为此需要先禁用掉 Scope hosting 功能。由于 Esbuild 未提供开关,我们只能舍弃其 Bundler 结果,自行 Bundler。

    受 Webpack 启发,我们将模块内的代码转换为 Common JS,再 wrapper 到我们自己的 Moduler loader 运行时,其中循环依赖的情况需要提前导出 module.exports 需要注意一下。

    转换为 Common JS 目前是使用 Esbuild 自带的 transform,但需要注意几个问题。

    • Esbuild dynamic import 遵循 浏览器 target 无法直接转换 require,目前是通过正则替换 hack。

    • Esbuild 转出的代码包含一些运行时代码,不是很干净。

    • 代码内的宏(process.env.NODE_ENV 等)需要注意进行替换。

    比如下面的模块代码的转换结果:

    1. // a.ts
    2. import { value } from 'b'
    3. // transformed to 
    4.  moduleLoader.registerLoader('a'/* /path/to/a */(requiremoduleexports) => {
    5.   const { value } = require('b');
    6. });
    • Cjs 动态导出模块的特性。

    1. export function name(a) {
    2.     return a + 1
    3. }
    4. const a = name(2)
    5. export default a

    如上模块转换后结果如下:

    1. var __defProp = Object.defineProperty;
    2. var __export = (target, all) => {
    3.   for (var name2 in all)
    4.     __defProp(target, name2, { get: all[name2], enumerabletrue });
    5. };
    6. var __copyProps = (to, from, except, desc) => {};
    7. var __toCommonJS = (mod) => __copyProps(__defProp({}, "__esModule", { valuetrue }), mod);
    8. var entry_exports = {};
    9. // 注意这里
    10. __export(entry_exports, {
    11.   default() => entry_default,
    12.   name() => name
    13. });
    14. module.exports = __toCommonJS(entry_exports);
    15. function name(a2) {
    16.   return a2 + 1;
    17. }
    18. var a = name(2);
    19. var entry_default = a;

    注意两部分:

    1. 第 7 行代码可以看到,ESM 转 CJS 后会给模块加上 __esModule 标记。

    2. 第 10 行代码中可以看到,CJS 的导出是 computed 的, module.exports 赋值时需要保留 computed 导出。

    ModuleLoader 的实现注意兼容此行为,伪代码如下:

    1. class Module {
    2.     _exports = {}
    3.     get exports() {
    4.         return this._exports
    5.     }
    6.     set exports(value) {
    7.         if(typeof value === 'object' && value) {
    8.             if (value.__esModule) {
    9.                 this._exports.__esModule = true;
    10.             }
    11.             for (const key in value) {
    12.                 Object.defineProperty(this._exports, key, {
    13.                   get() => value[key],
    14.                   enumerabletrue,
    15.                 });
    16.             }
    17.         }
    18.     }
    19. }

    由于 Scope Hosting 的禁用,在 bundler 期间无法对模块的导入导出进行检查,只能得到在运行期间的代码报错,Webpack 也存在此问题。




    Module Resolver

    虽然对模块进行了转换,但无法识别 alias,node_modules 等模块。

    如下面例子, node 模块 b 无法被执行,因为其注册时是 /path/to/b

    1. // a.ts
    2. import { value } from 'b'

    另外,由于 HMR API 接受子模块更新也需要识别模块。

    module.hot.accpet('b'() => {})
    

    有两种方案来解决:

    1. Module URL Rewrite

    Webpack/Vite 等都采用的是此方案,对模块导入路径进行改写。

    1. 注册映射表

    由于 Module Rerewrite 需要对 import 模块需要分析,会有一部分开销和工作量,为此采用注册映射表,在运行时进行映射。如下:

    1. moduleLoader.registerLoader('a'/* /path/to/a */(requiremoduleexports) => {
    2.   const { value } = require('b');
    3.   expect(value).equal(1);
    4. });
    5. moduleLoader.registerResolver('a'/* /path/to/a */, {
    6.    'b''/path/to/b'
    7.  });

    HMR

    当某个模块发生变化时,不用刷新页面就可以更新对应的模块。

    首先看个 HMR API 使用的例子:

    1. // bar.js
    2. import foo from './foo.js'
    3. foo()
    4. if (module.hot) {
    5.   module.hot.accept('./foo.js' ,(newFoo) => {
    6.     newFoo.foo()
    7.   })
    8. }

    在上面例子中,bar.js 是 ./foo.js 的 HMR Boundary ,即接受更新的模块。如果./foo.js 发生更新,只要重新执行 ./foo.js 并且执行第七行的 callback 即可完成更新。

    具体的实现如下:

    1. 构建模块依赖图。

    在 ModuleLoader 过程中,执行模块的同时记录了模块之间的依赖关系。

    img

    如果模块中含有 module.hot.accept 的 HMR API 调用则将模块标记成 boundary。

    img

    1. 当模块发生变更时,会重新生成此模块相关的最小 HMR Bundle,并且将其通过 websocket 消息告知浏览器此模块发生变更,浏览器端依据模块依赖图寻找 boundaries,并且开始重新执行模块更新以及相应的 calllback。

    img

    注意 HMR API 分为 接受子模块的更新 和 接受自更新 ,在查找  HMR Boundray 的过程需要注意区分。

    目前,只在 ModulerLoader 层面支持了 accpet dispose API。

    Bundle

    由于模块转换后没有先后关系,我们可以直接把代码进行合并即可,但是这样会缺少 sourcemap。

    为此,进行了两种方案的尝试:

    1. Magic-string Bundle + remapping

    伪代码如下:

    1. import MagicString from 'magic-string';
    2. import remapping from '@ampproject/remapping';
    3. const module1 = new MagicString('code1')
    4. const module1Map = {}
    5. const module2 = new MagicString('code2')
    6. const module2Map = {}
    7. function bundle() {
    8.     const bundle = new MagicString.Bundle();
    9.     bundle.addSource({
    10.       filename'module1.js',
    11.       content: module1
    12.     });
    13.     bundle.addSource({
    14.       filename'module2.js',
    15.       content: module2
    16.     });
    17.     const map = bundle.generateMap({
    18.       file'bundle.js',
    19.       includeContenttrue,
    20.       hirestrue
    21.     });
    22.     remapping(map, (file) => {
    23.         if(file === 'module1.js'return module1Map
    24.         if(file === 'module2.js'return module2Map
    25.         return null
    26.     })
    27.     return {
    28.         code: bundle.toString(),
    29.         map
    30.     }
    31. }

    实现过后发现二次构建存在显著的性能瓶颈,remapping 没有 cache 。

    1. Webpack-source

    伪代码如下:

    1. import { ConcatSource, CachedSource, SourceMapSource } from 'webpack-sources';
    2. const module1Map = {}
    3. const module1 = new CachedSource(new SourceMapSource('code1'), 'module1.js', module1Map)
    4. const module2 = new CachedSource(new SourceMapSource('code2'), 'module2.js', module1Map)
    5. function bundle(){
    6.     const concatSource = new ConcatSource();
    7.     concatSource.add(module1)
    8.     concatSource.add(module2)
    9.     const { source, map } = concatSource.sourceAndMap();
    10.     return {
    11.       code: source,
    12.       map,
    13.     };
    14. }

    其 CacheModule 有每个模块的 sourcemap cache,内部的 remapping 开销很小,二次构建是方案一的数十倍性能提升。

    另外,由于 esbuild 因为开启了生产模式的优化,metafile.inputs 中并不是全部的模块,其中没有可执行代码的模块会缺失,所以合并代码时需要从模块图中查找全部的模块。

    Lazy Compiler(未实现)

    页面中经常会包含 dynamic import 的模块,这些模块不一定被页面首屏使用,但是也被 Bundler,因此 Webpack 提出了 Lazy Compiler 。Vite 利用 ESM Loader 的 unbundler 天生避免了此问题。

    React Refresh

    What is React Refresh and how to integrate it .

    和介绍的一样,分为两个过程。

    1. 将源代码通过 react-refresh/babel 插件进行转换,如下:

    1. function FunctionDefault() {
    2.   return <h1>Default Export Functionh1>;
    3. }
    4. export default FunctionDefault;

    转换结果如下:

    1. var _jsxDevRuntime = require("node_modules/react/jsx-dev-runtime.js");
    2. function FunctionDefault() {
    3.     return (0, _jsxDevRuntime).jsxDEV("h1", {
    4.         children"Default Export Function"
    5.     }, void 0false, {
    6.         fileName"",
    7.         lineNumber2,
    8.         columnNumber10
    9.     }, this);
    10. }
    11. _c = FunctionDefault;
    12. var _default = FunctionDefault;
    13. exports.default = _default;
    14. var _c;
    15. $RefreshReg$(_c, "FunctionDefault");

    依据 bundler hmr 实现加入一些 runtime。

    1. var prevRefreshReg = window.$RefreshReg$;
    2. var prevRefreshSig = window.$RefreshSig$;
    3. var RefreshRuntime = require('react-refresh/runtime');
    4. window.$RefreshReg$ = (type, id) => {
    5.   RefreshRuntime.register(type, fullId);
    6. window.$RefreshSig$ = RefreshRuntime.createSignatureFunctionForTransform;
    7. // source code
    8. window.$RefreshReg$ = prevRefreshReg;
    9. window.$RefreshSig$ = prevRefreshSig;
    10. // accept self update
    11. module.hot.accept();
    12. const runtime = require('react-refresh/runtime');
    13. let enqueueUpdate = debounce(runtime.performReactRefresh30);
    14. enqueueUpdate();
    1. Entry 加入下列代码。

    1.  const runtime = require('react-refresh/runtime');
    2.   runtime.injectIntoGlobalHook(window);
    3.   window.$RefreshReg$ = () => {};
    4.   window.$RefreshSig$ = () => type => type;

    注意这些代码需要运行在 react-dom 之前。

  • 相关阅读:
    【支付宝生态质量验收与检测技术】
    开发跨端微信小程序框架选型指南
    Python实现可存储的学生信息管理系统(文件+Excel)
    CompletableFuture方法介绍及代码示例
    分布式系统幂等解决方案
    Hbase Java API原理介绍
    2023最新SSM计算机毕业设计选题大全(附源码+LW)之java高校教学过程管理系统34085
    linux安装oracle jdk
    elasticsearch7.12 agg分组聚合分页同段同句查询
    【三】kubernetes kuboard部署分布式系统
  • 原文地址:https://blog.csdn.net/qq_41581588/article/details/126027833