其实,学习一个库的源码,最重要的就是先理清它的基本架构,jQuery 是这样,Underscore 也应该是这样。
Underscore 这个库提供力很多有用的函数,这些函数部分已经在 es5 或 es6 中支持了,比如我们常用的 map、reduce、each,还有 es6 中的 keys 方法等,因为这些方法比较好用,所以被 javascript 的制定者采纳了。
先过一遍源码
我看的版本是 1.8.3,网上很多旧版本的,貌似有很多函数都已经启用或改变了,有点不一样啦。
打开源码,会看到函数的基本架构:
(function(){
...
}.call(this))
这和我们常见的闭包不太一样啊,但是功能都是类似的,在函数内执行,防止对全局变量进行污染,然后在函数的最后调用 call 函数,把 函数内部的 this 和全局的 this 进行绑定。如果在浏览器里执行,this 会指向 window,在 node 环境下,会指向全局的 global。当厌倦使用闭包的时候,这种方法也是一种不错的体验。
那么接着向下看:
(function(){
var root = this; // 用 root 来保存当前的 this
var previousUnderscore = root._; // 万一 _ 之前被占用了,先备份
// 下面是一些原型,包括 数组,对象和函数
var ArrayProto = Array.prototype, ObjProto = Object.prototype, FuncProto = Function.prototype;
var
push = ArrayProto.push,
slice = ArrayProto.slice,
toString = ObjProto.toString,
hasOwnProperty = ObjProto.hasOwnProperty;
var
nativeIsArray = Array.isArray,
nativeKeys = Object.keys,
nativeBind = FuncProto.bind,
nativeCreate = Object.create;
}.call(this))
在源码中搜索 previousUnderscore
,可以找到两处,另外一处就是:
_.noConflict = function() {
root._ = previousUnderscore;
return this;
};
noConflict
函数的用法是可以让用户自定义变量来替代 _
,并且把之前保存的 _
给还原,比如:
// 测试使用
var _ = 'Hello World'; // _ 已经被占用
...
var us = _.noConflict();
us // 指向 underscore
_ // ‘Hello World'
像 push slice 这些函数,原生都已经支持了,源码里面直接把他们拿过来使用。
来看看 _ 是如何定义的
_
在 underscore 地位是非常核心的,而它的本质实际上还是函数,同样也是一个对象:
var _ = function(obj) {
if (obj instanceof _) return obj;
if (!(this instanceof _)) return new _(obj);
this._wrapped = obj;
};
_.VERSION = '1.8.3';
_.map = _.collect = function(){...};
_.each = _.forEach = function(){...};
_
是一个函数,但是在源码中,它是被当作对象来使用,所有的属性和函数都是直接绑定到 _
对象上面的,所有最终的调用都是通过:
_.each([22,33,44], console.log);
// 22 0 [22, 33, 44]
// 33 1 [22, 33, 44]
// 44 2 [22, 33, 44]
最终的返回值是处理的那个数组,而不是 _
自己,下面将会讨论,这个涉及到链式调用。
那如果,我就想通过函数来生成,这也是支持的:
_([1,2,3]).each(console.log)
// 返回的结果都是一样的
这个时候,就会疑惑,_
的原型呢?我们再来搜索一下 _.prototype
:
_.mixin = function(obj) {
_.each(_.functions(obj), function(name) { // 调用 each 对每一个函数对象处理
var func = _[name] = obj[name]; // 绑定到 _ 上
_.prototype[name] = function() { // 绑定到 _ 的原型上
var args = [this._wrapped];
push.apply(args, arguments); // 参数对齐
return result(this, func.apply(_, args)); // 调用 result 查看是否链式
};
});
};
_.mixin(_); // 执行
// 相关的一些方法
_.functions = _.methods = function(obj) {
var names = [];
for (var key in obj) {
if (_.isFunction(obj[key])) names.push(key);
}
return names.sort();
};
_.isFunction = function(obj){
return typeof obj == 'function' || false;
}
_.functions
是一个获取目标所有函数对象的方法,并把这些方法浅拷贝传递给 _
和 _
的原型,因为原型方法,处理对象已经在 _wrapped
中了,而这些常用的方法参数都是固定的,如果直接调用,参数会出问题,所以:
var args = [this._wrapped];
push.apply(args, arguments);// args 已经拼接完成
func.apply(_, args);
那么 result 函数是用来做什么的?因为 underscore 有两种调用方式,一种是通过 _.each(obj, func)
,另一种是通过 _(obj).each(func)
。第一种方法很好理解,返回值要么是 obj 本身,要么是处理后的结果,而第二种调用方法和 jQuery 很像,先生成一个 new 实体,对实体的进行调用,也就有了上面的参数校准问题。
不过这样子又回带来另一个问题,对于 each、map 函数,函数返回什么不重要,主要是处理过程,可以支持链式调用,对于 reduce 函数,返回的是处理后的结果,可以不用链式,所以 result 函数就是来判断是否需要链式,而对返回值进行处理。
介绍 result 之前,先来看一下 chain 函数:
_.chain = function(obj) {
var instance = _(obj);
instance._chain = true; // 设置一个 _chain 属性,后面用于判断链式
return instance;
};
返回一个新的 _(obj)
,并且多了一个 _chain
属性,且为 true,所以 result 函数:
var result = function(instance, obj) {
return instance._chain ? _(obj).chain() : obj;
};
如果当前是允许链式的,可以进行链式调用,不允许链式,就直接返回处理结果,比如:
var arr = [22, 33, 44];
_.chain(arr)
.map(function(v){ return v + 1 })
.reduce(function(p, n){ return p + n }, 0)
.value() // 102
// 如果不允许链式,返回结果是处理后的数组
_(arr)
.map(function(v){ return v + 1 }) // [23, 34, 45]
现在返回来看一下 _
函数,也非常的有意思,_(obj)
实际上是执行两次的,第二次才用到了 new:
var _ = function(obj) {
if (obj instanceof _) return obj; // 如果 obj 继承于 _,直接返回
if (!(this instanceof _)) return new _(obj); // 如果 this 不继承 _,返回一个 new
this._wrapped = obj; // 保存 obj 的值
};
现在应该就非常的明朗了吧。当调用 _([22,33,44])
的时候,发现 obj 并不是继承与 _
,会用 new 来生成,又会重新跑一遍 _
函数,然后将 _wrapped
属性指向 obj。
由于在之前已经 root = this
,Underscore 在不同的环境中都可以运行,需要将 _
放到不同的环境中:
if (typeof exports !== 'undefined') { // nodejs 模块
if (typeof module !== 'undefined' && module.exports) {
exports = module.exports = _;
}
exports._ = _;
} else { // window
root._ = _;
}
接着看源码
源码再往下看,是一个 optimizeCb 函数,用来优化回调函数:
var optimizeCb = function(func, context, argCount) {
// 这里没有用 undefined,而是用 void 0
if (context === void 0) return func; // 只有一个参数,直接返回回调函数
switch (argCount == null ? 3 : argCount) { // call 比 apply 好?
case 1: return function(value) {
return func.call(context, value);
};
case 2: return function(value, other) {
return func.call(context, value, other);
};
case 3: return function(value, index, collection) {
return func.call(context, value, index, collection);
};
case 4: return function(accumulator, value, index, collection) {
return func.call(context, accumulator, value, index, collection);
};
}
// 最后走 apply 函数
return function() {
return func.apply(context, arguments);
};
};
所谓优化版的回调函数,就是用 call 来固定参数,1 个参数,2 个参数,3 个参数,4 个参数的时候,由于 apply 可以不用考虑参数,但是在性能上面貌似没有 call 好。
然后后面还有一个 cb 函数,也是用来作为回调函数的。
var cb = function(value, context, argCount) {
if (value == null) return _.identity;
if (_.isFunction(value)) return optimizeCb(value, context, argCount);
if (_.isObject(value)) return _.matcher(value);
return _.property(value);
};
_.iteratee = function(value, context) {
return cb(value, context, Infinity);
};
iteratee 可以用来对函数进行处理,给一个函数绑定 this 等等,最总还是调用到 cb,其实 cb 本身就很复杂,要么是一个 identity 函数,要么是一个优化到回调函数,要么是一个 property 获取属性函数。
再往下就是 createAssigner
,搜了一下,发现全文有三处用到此函数,分别是 extend、extendOwn、default,可以看出来,此函数主要到作用是用来实现拷贝,算是拷贝到辅助函数吧,把拷贝公共到部分抽离出来:
var createAssigner = function(keysFunc, undefinedOnly) {
return function(obj) {
var length = arguments.length;
if (length < 2 || obj == null) return obj;
// 将第二个参数及以后的 object 拷贝到第一个 obj 上
for (var index = 1; index < length; index++) {
var source = arguments[index],
// keysFunc 是点睛所在
// 不同的 keysFunc 获得的 keys 集合不同
// 分为两种,所有 keys(包括继承),自身 keys
keys = keysFunc(source),
l = keys.length;
for (var i = 0; i < l; i++) {
var key = keys[i];
// underfinedOnly 表示是否覆盖原有
if (!undefinedOnly || obj[key] === void 0) obj[key] = source[key];
}
}
return obj;
};
};
所以当 keyFunc 函数获得所有 keys 时,包括继承来的,这个时候就对应于 _.extend
函数,非继承 keys 时,对应于 _.extendOwn
。如果 underfinedOnly 设置为 true,则实现的是不替换原有属性的继承 _.defaults
。
在 Underscore 中,原型的继承用 baseCreate 函数:
var Ctor = function(){};
var baseCreate = function(prototype) {
if (!_.isObject(prototype)) return {};
if (nativeCreate) return nativeCreate(prototype);
Ctor.prototype = prototype;
var result = new Ctor;
Ctor.prototype = null;
return result;
};
nativeCreate
之前已经介绍来,就是 Object.create
,所以,如果浏览器不支持,下面实现的功能就是在实现这个函数,方法也很常规,用了一个空函数 Ctor 主要是防止 new 带来的多余属性问题。
property
函数也是一个比较有意思的函数,使用了闭包的思路,比如判断一个对象是否为类似数组结构的时候就用到了这个函数:
var property = function(key) {
return function(obj) {
return obj == null ? void 0 : obj[key];
};
};
var MAX_ARRAY_INDEX = Math.pow(2, 53) - 1;
var getLength = property('length'); // 返回一个闭包韩式,用来检测对象是非有 length 参数
var isArrayLike = function(collection) {
var length = getLength(collection);
return typeof length == 'number' && length >= 0 && length <= MAX_ARRAY_INDEX;
};
而且我搜索了一下,发现 getLength 函数使用的地方还是挺多的。
总结
总的来说,这些开源的库,都保持着自己的一种风格,jQuery 是这样,Underscore 也是这样,从 Underscore 的总体架构可以发现,它主要封装了一些好用的方法。
参考
Underscore.js (1.8.3) 中文文档
Underscore源码解析(一)
中文版 underscore 代码注释
欢迎来我的博客交流。