彻底理解js闭包

本文主要参考MDN手册和Learning Advanced JavaScript

在文章开头,我先放出MDN给出的定义:

闭包是指那些能够访问独立(自由)变量的函数 (变量在本地使用,但定义在一个封闭的作用域中)。换句话说,这些函数可以“记忆”它被创建时候的环境。

现在不需要看懂它,我会在第一个例子中解释清楚它的意思。让我们开始吧!

2018.3.20更新:现在MDN上的定义已经改为:"A closure is the combination of a function and the lexical environment within which that function was declared."


要理解函数闭包,就要先知道这两条特性:

  1. 函数外部的代码无法访问函数体内部的变量,而函数体内部的代码可以访问函数外部的变量。
  2. 即使函数已经执行完毕,在执行期间创建的变量也不会被销毁,因此每运行一次函数就会在内存中留下一组变量。(js当然会有垃圾回收机制,不过如果它发现你正在使用闭包,则不会清理可能会用到的变量)

使用闭包能产生类似于对象的一组变量集合,看个例子:

function outter() {
  var private= "I am private";
  function show() {
    console.log(private);
  }
  return show;
}

var ref = outter();
// console.log(private); // 尝试直接访问private会报错:private is not defined
ref(); // 打印I am private

我们调用了一次outter函数,产生了一组变量:private和show。要不是我们在outter最后一句返回了show,这两个变量就永远没办法被访问到了(因为函数外部的代码无法访问函数体内部的变量)。但是我们现在返回了show,并且ref是show的引用,这样我们就可以在函数体外部调用show了,而show又可以访问到private。
这不就像是一个C++或JAVA中的对象吗?private就是它的私有成员,尝试从外部直接访问它就会收到报错;show就是它的公有成员,所以我们可以在外部访问到它,并且它可以访问私有成员name。使用闭包能产生类似于对象的一组变量集合。

现在我们对照着这个例子来理解闭包的定义:

闭包是指那些能够访问独立(自由)变量的函数 (变量在本地使用,但定义在一个封闭的作用域中)。换句话说,这些函数可以“记忆”它被创建时候的环境。

我初学的时候犯了一个错误,就是认为outter是闭包函数(因为我以为将整个闭包结构“包”起来的函数就是闭包函数),但其实根据定义,被返回的show才是闭包函数,也就是那个可以在外部访问“私有成员”的函数。

  • 定义中的“独立(自由)变量”其实就是我们刚才说的私有成员,它们是独立(自由)的,是因为定义它的函数已经死了(执行完毕)!
  • “变量在本地使用,但定义在一个封闭的作用域中”的意思是,自由变量可以在闭包函数中使用,但是自由变量并不是在闭包中定义的。
  • “闭包函数可以“记忆”它被创建时候的环境”的意思是,outter执行的过程产生了一组变量,这些变量就是show被声明时候的环境。show可以记住这个环境(变量private),即使show离开了outter(被return到外部),它依然记得如何访问这个环境里的变量。

让我们再看一个例子

function makeAdder(x) {
  return function(y) {
    return x + y;
  };
}

var add5 = makeAdder(5);
var add10 = makeAdder(10);

console.log(add5(2));  // 7
console.log(add10(2)); // 12

这一次,makeAdder创建了一个闭包结构,传入的参数x就是执行期间创建的临时变量,它就相当于是私有成员(自由变量)。而公有成员是一个匿名函数,这个函数接受一个参数y,并将这个参数与闭包的私有成员x相加,返回结果。

这个例子有意思的地方在于:makeAdder调用了两次!每运行一次makeAdder就会在内存中产生一组变量(也就是一个“环境”),每一个“环境”虽然结构相同,都有私有成员x和公有成员函数,但是这两个“环境”是互不干涉的。在这个例子中,第一个环境中x=5,第二个环境中x=10。

利用闭包的特性,可以实现模块模式。用一个闭包函数包裹模块的代码,将不需要暴露的变量隐藏起来(好处是不会污染全局变量空间),将别人要调用的方法return出去,就可以实现模块化了。实际上Node.js就是这么做的,看我的另一篇文章。


经典面试题

让我们再看一个常见的错误:在循环中创建闭包

...
  1. 第一项
  2. 第二项
  3. 第三项
  4. 第四项
... window.onload = function() { // 函数1 var lis = document.getElementsByTagName('li'); for (var i = 0; i < lis.length; i++) { lis[i].onclick = function() { // 函数2 alert(i); } } }

不管我们点击哪一个li元素,都会显示3,而不是分别显示0到3的数字。这是为什么呢?
这是因为,函数2被声明了4次没错,但它们是在同一个环境中被声明的(都是在执行函数1的环境)!因此这四个函数2“记住”的是同一个i!当我们点击li元素时,循环早已完成,i停在了3。因此,我们不管点击哪一个li元素,总是会显示3。
既然我们已经知道了错误的原因,那么修改的思路也很明确了:四个onclick函数必须有自己“声明环境”!既然要产生4个“环境”,那么就说明必须有一个函数在for循环内运行,总共运行4次,每次的环境中都有一个变量private_i,分别等于0、1、2、3。

修改后:

...
  1. 第一项
  2. 第二项
  3. 第三项
  4. 第四项
... window.onload = function() { // 函数1 var lis = document.getElementsByTagName('li'); for (var i = 0; i < lis.length; i++) { lis[i].onclick = (function(private_i) { // 函数2 return function() { // 函数3 alert(private_i); } })(i); // 这里将i作为参数,调用函数2 } }

注意赋值给onclick的并不是函数2,而是函数2的执行结果,也就是函数3。函数3内的private_i是函数2调用时所产生的,而函数2总共调用了4次,为4个函数3都分别留下了一个“环境”private_i,四个private_i分别是0、1、2、3。因此,点击4个li元素就会显示出4个不同的数字了。


不要随便在函数中创建函数

除非明确你知道你自己需要使用闭包,否则,不要在函数中创建另一个函数,这样会造成速度和性能的浪费。
看一个MDN上的例子:

function MyObject(name, message) {
  this.name = name.toString();
  this.message = message.toString();
  this.getName = function() {
    return this.name;
  };
  this.getMessage = function() {
    return this.message;
  };
}
var obj1 = new MyObject("name1", "message1");
var obj2 = new MyObject("name2", "message2");

每次执行MyObject,都会在内存中创建出两个函数,每次创建的getName函数都是一样的,getMessage函数也是一样,造成了不必要的浪费。

实际上,如果我们要让对象都有一样的方法,只需要在它们的prototype上定义这个方法就行了:

function MyObject(name, message) {
  this.name = name.toString();
  this.message = message.toString();
}
MyObject.prototype.getName = function() {
  return this.name;
};
MyObject.prototype.getMessage = function() {
  return this.message;
};
var obj1 = new MyObject("name1", "message1");
var obj2 = new MyObject("name2", "message2");

这样,函数只创建了一次,而obj1和obj2都能继承到getName和getMessage方法。
有关原型继承的细节,请阅读我的另一篇文章《彻底理解js的原型链》


闭包函数究竟是怎么“记住”创建时期的环境的?如果你对其原理感到好奇的话,可以看看我的这两篇文章:
js的执行上下文,以及其中的变量对象
彻底理解js的作用域链

你可能感兴趣的:(彻底理解js闭包)