node的模块加载

模块实现

依照CommonJS的模块规范,使用require()引入模块的api,使用exports导出模块的方法、变量;其中module对象代表模块本身,exports是它的属性

优点: 每个模块有独立的空间、不必考虑变量污染

Node引入模块通过路径分析、文件定位、编译执行,会对引入的模块缓存其编译和执行后的对象,加载时缓存优先其后只核心模块。加载自定义模块(第三方包)最慢,要向上逐级递归查找node_modules目录

因为允许require()中不含文件拓展名,Node会按照.js、.node、.json的次序补足,依次尝试,并且需要调用fs模块同步阻塞判断文件是否存在,会因为Node单线程引起性能问题,对于.node、.json文件带上拓展名能快些

分析目录和包

require()通过分析文件拓展名后仍然没有查到文件、但取到一个目录,此时Node会将目录当做包来处理。

  1. 在当前目录下查找package.json(CommonJS规定的包描述文件)
  2. 通过JSON.parse()解析,取出main属性指定的文件名,若无拓展名就遍历拓展名

如果mian属性指定文件名错误、没有package.json文件,Node会把index.当做默认文件名,依次查找、遍历拓展名。

如果分析目录后没有定位成功,就进入下一个模块路径查找,模块路径都都遍历完了还没找到就抛错。

模块编译

.js 通过fs同步读取文件后编译执行 ,Node对获取的js文件内容进行了头尾包装

(function(exports,require,module,__filename,__dirname){//头尾包装
  var math=require('math');
});

如此每个模块都有作作用域隔离,包装后的代码通过vm原生模块runInThisContext()执行,返回一个function对象,再将当前模块对象的exports属性、require()、module、文件的完整路径和文件目录作为参数传给function()。最后调用方拿到了exports属性

**exports和module.exports 的区别 **exports对象是以形参形式传入的,直接赋值不会改变作用域外的值。所以需要对module.exports对象赋值,对exports属性赋值则无碍

var change = function(a) {
    a = 100;
    console.log(a); // => 100
};
var a = 10;
change(a);
console.log(a); // => 10

.node 这是用c/c++编写的拓展文件,通过dlopen()加载再编译 在windows、*nix有不同的实现,通过libuv兼容层封装,实际不用编译,它是c/c++编译生成的,只要加载、执行,exports对象直接和.node联系,执行效率高

.json 通过fs读取,使用JSON.parse()解析,再赋值给exports ,对于JSON文件直接用require()比fs高效

将编译后的模块,以文件路径为索引缓存在Module.cache对象上

核心模块

  • 将核心模块中纯用c/c++写的称为建内模块,因为通常不被用户调用
  • 部分模块通过c/c++编写核心部分,js实现包装、导出来提高性能

Node使用v8的js2c.py将所有内置js转成c++里的数组,生成node_natives.sh头文件,在Node启动时加入内存,然后再根据require()加载、执行;也要经历头尾包装,缓存在NativeModule._cache对象上

NPM

package.json 包描述文件 dependencies npm根据这个自动加载依赖的包,scripts 用于包管理器来安装、编译、测试和卸载包(钩子命令,preinstall之类的) devDependencies 开发时的依赖包,bin 命令行工具

全局安装 -g 将包变成全局可用的执行命令,不是require()到

其他方式安装包 npm install 指定package.json的位置,npm install [pg] --registry=http://registry.url 或者直接采用镜像源 npm config set registry http://registry.url

局域NPM

你可能感兴趣的:(node的模块加载)