Javascript垃圾回收机制

简介

JS自带一套内存管理引擎,负责创建对象、销毁对象,以及垃圾回收。这期探讨一下垃圾回收机制。垃圾回收机制主要是由一个叫垃圾收集器(garbage collector,简称GC)的后台进程负责监控、清理对象,并及时回收空闲内存。

可达性(Reachability)

GC的最主要职责是监控数据的可达性(reachability);哪些数据是所谓的可达的呢?

  1. 所有显示调用,被称为,包括

    • 全局对象
    • 正被调用的函数的局部变量和参数
    • 相关嵌套函数里的变量和参数
    • 其他(引擎内部调用的一些变量)
  2. 所有从根引用或引用链访问的对象

举个简单的例子

let user = {
    name: 'Onion'
}

这里全局变量user指向内存里的对象{name: 'Onion'},我们称其为引用。这时对象Onion(以下均以名字简称)是所谓可达的

Javascript垃圾回收机制_第1张图片
user reference

将user置为null后,引用丢失,Onion对象就变成不可达了。最终GC会将它从内存中清除。

user = null
Javascript垃圾回收机制_第2张图片
unreachable

再举一个复杂一点的例子:

function marry(man, woman) {
  woman.husband = man;
  man.wife = woman;

  return {
    father: man,
    mother: woman,
  }
}

let family = marry({
  name: "Onion"
}, {
  name: "Garlic"
});

如图,现阶段所有对象都是可达的。

Javascript垃圾回收机制_第3张图片
family reachable

现在我们删除一些对Onion的引用

delete family.father
delete family.mother.husband

如图,尽管Onion还有对Garlic的引用,但是它本身已不可达,所以很快就会被GC发现并回收。

Javascript垃圾回收机制_第4张图片
onion clean

回收算法

最基本的垃圾回收算法被称为标记清除法(mark-and-sweep)。有这么几步:

  1. GC标记所有的变量

    Javascript垃圾回收机制_第5张图片
    mark root
  2. 访问所有变量的引用,并标记它们

    Javascript垃圾回收机制_第6张图片
    mark reference
  3. 标记所有引用链上的对象,已标记的对象不再被访问

    Javascript垃圾回收机制_第7张图片
    mark reference chain
  4. 最后删除所有未被标记的对象(:并非未被引用的对象,如图右)

    Javascript垃圾回收机制_第8张图片
    sweep unreachable

现代的GC引擎自然比这个复杂得多,很多优化手段早已被用到各大厂家中,比如V8的分代回收(Generational collection)、增量回收(Incremental collection)、空闲时回收(Idle-time collection)等等。不过,这些手段已超出了本文的范畴,不再深入探讨。

内存泄漏

内存泄漏指申请的内存一直得不到释放,GC回收不了。一般在项目中就是,你创建的对象一直保存在内存中,可达但你把它的引用地址搞丢了结果没法操作它,而GC又不会回收这块内存。内存泄漏的危害就是堆积耗尽系统所有内存。

常见的有这么几种泄漏方式:

  1. 意外的全局变量

    function foo() {
        bar = "等价于创建global变量window.bar";
    }
    
  2. 忘记清空计时器

    let someResource = {...};
    setInterval(function cb() {
        let node = document.getElementById('Node');
        if(node) {
            // 若不清空计时器,node和someResource将长期驻留内存
            node.innerHTML = JSON.stringify(someResource);
        }
    }, 1000);
    
  3. 闭包里的循环引用

    
    function assignHandler(){
        let element = $('id');
        let id = elment.id; // 引用element变量id
    
        element.onclick = function(){
            alert(id); // 引用assignHandler变量id
        };
    }
    
  4. 其他

    在ie等老旧浏览器里还有许多匪夷所思的内存泄漏,比如自动类型装箱转换,一些不经意的DOM操作,甚至闭包本身就会泄漏;这类泄漏需要专人特别关注,这里不再一一赘述了。

小结

今天简单接受了一下Javascript的GC机制,由于功力有限我只能浅尝则止。不过还是有几点概念性的总结:

  1. GC机制是自动完成的,但我们可以强制启动它,或是关闭它。
  2. 只要是可达的,对象就会常驻内存,所以需要特别注意内存泄漏问题
  3. 引用与可达的是不一样的,有些引用链可能根本无法在内存中驻留

你可能感兴趣的:(Javascript垃圾回收机制)