本文是 重温基础 系列文章的第二十二篇。
今日感受:优化学习方法。
系列目录:
本章节复习的是JS中的内存管理,这对于我们开发非常有帮助。
前置知识
绝大多数的程序语言,他们的内存生命周期基本一致:
对于所有的编程语言,第二部分都是明确的。而第一和第三部分在底层语言中是明确的。
但在像JavaScript
这些高级语言中,大部分都是隐含的,因为JavaScript
具有自动垃圾回收机制(Garbage collected)。
因此在做JavaScript
开发时,不需要关心内存的使用问题,所需内存分配和无用内存回收,都完全实现自动管理。
像C语言这样的高级语言一般都有底层的内存管理接口,比如
malloc()
和free()
。另一方面,JavaScript创建变量(对象,字符串等)时分配内存,并且在不再使用它们时“自动”释放。 后一个过程称为垃圾回收。这个“自动”是混乱的根源,并让JavaScript(和其他高级语言)开发者感觉他们可以不关心内存管理。 这是错误的。
——《MDN JavaScript 内存管理》
MDN中的介绍告诉我们,作为JavaScript
开发者,还是需要去了解内存管理,虽然JavaScript
已经给我们做好自动管理。
在做JavaScript
开发时,我们定义变量的时候,JavaScript
便为我们完成了内存分配:
var num = 100; // 为数值变量分配内存
var str = 'pingan'; // 为字符串变量分配内存
var obj = {
name : 'pingan'
}; // 为对象变量及其包含的值分配内存
var arr = [1, null, 'hi']; // 为数组变量及其包含的值分配内存
function fun(num){
return num + 2;
}; // 为函数(可调用的对象)分配内存
// 函数表达式也能分配一个对象
someElement.addEventListener('click', function(){
someElement.style.backgroundColor = 'blue';
}, false);
另外,通过调用函数,也会分配内存:
// 类型1. 分配对象内存
var date = new Date(); // 分配一个Date对象
var elem = document.createElement('div'); // 分配一个DOM元素
// 类型2. 分配新变量或者新对象
var str1 = "pingan";
var str2 = str1.substr(0, 3); // str2 是一个新的字符串
var arr1 = ["hi", "pingan"];
var arr2 = ["hi", "leo"];
var arr3 = arr1.concat(arr2); // arr3 是一个新的数组(arr1和arr2连接的结果)
使用内存的过程实际上是对分配的内存进行读取与写入的操作。
通常表现就是使用定义的值。
读取与写入可能是写入一个变量或者一个对象的属性值,甚至传递函数的参数。
var num = 1;
num ++; // 使用已经定义的变量,做递增操作
当我们前面定义好的变量或函数(分配的内存)已经不需要使用的时候,便需要释放掉这些内存。这也是内存管理中最难的任务,因为我们不知道什么时候这些内存不使用。
很好的是,在高级语言解释器中,已经嵌入“垃圾回收器”,用来跟踪内存的分配和使用,以便在内存不使用时自动释放(这并不是百分百跟踪到,只是个近似过程)。
就像前面提到的,“垃圾回收器”只能解决一般情况,接下来我们需要了解主要的垃圾回收算法和它们局限性。
垃圾回收算法主要依赖于引用的概念。
即在内存管理环境中,一个对象如果有权限访问另一个对象,不论显式还是隐式,称为一个对象引用另一个对象。
例如:一个JS对象具有对它原型的引用(隐式引用)和对它属性的引用(显式引用)。
注意:
这里的对象,不仅包含JS对象,也包含函数作用域(或全局词法作用域)。
这个算法,把“对象是否不再需要”定义为:当一个对象没有被其他对象所引用的时候,回收该对象。这是最初级的垃圾收集算法。
var obj = {
leo : {
age : 18
};
};
这里创建2个对象,一个作为leo
的属性被引用,另一个被分配给变量obj
。
// 省略上面的代码
/*
我们将前面的
{
leo : {
age : 18
};
};
称为“这个对象”
*/
var obj2 = obj; // obj2变量是第二个对“这个对象”的引用
obj = 'pingan'; // 将“这个对象”的原始是引用obj换成obj2
var leo2 = obj2.leo; // 引用“这个对象”的leo属性
可以看出,现在的“这个对象”已经有2个引用,一个是obj2
,另一个是leo2
。
obj2 = 'hi';
// 将obj2变成零引用,因此,obj2可以被垃圾回收
// 但是它的属性leo还在被leo2对象引用,所以还不能回收
leo2 = null;
// 将leo变成零引用,这样obj2和leo2都可以被垃圾回收
这个算法有个限制:
无法处理循环引用。即两个对象创建时相互引用形成一个循环。
function fun(){
var obj1 = {}, obj2 = {};
obj1.leo = obj2; // obj1引用obj2
obj2.leo = obj1; // obj2引用obj1
return 'hi pingan';
}
fun();
可以看出,它们被调用之后,会离开函数作用域,已经没有用了可以被回收,然而引用计数算法考虑到它们之间相互至少引用一次,所以它们不会被回收。
实际案例:
在IE6,7中,使用引用计数方式对DOM对象进行垃圾回收,常常造成对象被循环引用导致内存泄露:
var obj;
window.onload = function(){
obj = document.getElementById('myId');
obj.leo = obj;
obj.data = new Array(100000).join('');
};
可以看出,DOM元素obj
中的leo
属性引用了自己obj
,造成循环引用,若该属性(leo
)没有移除或设置为null
,垃圾回收器总是且至少有一个引用,并一直占用内存,即使从DOM树删除,如果这个DOM元素含大量数据(如data
属性)则会导致占用内存永远无法释放,出现内存泄露。
这个算法,将“对象是否不再需要”定义为:对象是否可以获得。
标记清除算法,是假定设置一个根对象(root),在JS中是全局对象。垃圾回收器定时找所有从根开始引用的对象,然后再找这些对象引用的对象…直到找到所有可以获得的对象和搜集所有不能获得的对象。
它比引用计数垃圾收集更好,因为“有零引用的对象”总是不可获得的,但是相反却不一定,参考“循环引用”。
循环引用不再是问题:
function fun(){
var obj1 = {}, obj2 = {};
obj1.leo = obj2; // obj1引用obj2
obj2.leo = obj1; // obj2引用obj1
return 'hi pingan';
}
fun();
还是这个代码,可以看出,使用标记清除算法来看,函数调用之后,两个对象无法从全局对象获取,因此将被回收。相同的,下面案例,一旦 obj
和其事件处理无法从根获取到,他们将会被垃圾回收器回收。
var obj;
window.onload = function(){
obj = document.getElementById('myId');
obj.leo = obj;
obj.data = new Array(100000).join('');
};
注意: 那些无法从根对象查询到的对象都将被清除。
在日常开发中,应该注意及时切断需要回收对象与根的联系,虽然标记清除算法已经足够强壮,就像下面代码:
var obj,ele=document.getElementById('myId');
obj.div = document.createElement('div');
ele.appendChild(obj.div);
// 删除DOM元素
ele.removeChild(obj.div);
如果我们只是做小型项目开发,JS用的比较少的话,内存管理可以不用太在意,但是如果是大项目(SPA,服务器或桌面应用),那就需要考虑好内存管理问题了。
在计算机科学中,内存泄漏指由于疏忽或错误造成程序未能释放已经不再使用的内存。内存泄漏并非指内存在物理上的消失,而是应用程序分配某段内存后,由于设计错误,导致在释放该段内存之前就失去了对该段内存的控制,从而造成了内存的浪费。 ——维基百科
其实简单理解:一些不再使用的内存无法被释放。
当内存占用越来越多,不仅影响系统性能,严重的还会导致进程奔溃。
未定义的变量,会被定义到全局,当页面关闭才会销毁,这样就造成内存泄露。如下:
function fun(){
name = 'pingan';
};
var data = {};
setInterval(function(){
var render = document.getElementById('myId');
if(render){
render.innderHTML = JSON.stringify(data);
}
}, 1000);
var str = null;
var fun = function(){
var str2 = str;
var unused = function(){
if(str2) console.log('is unused');
};
str = {
my_str = new Array(100000).join('--');
my_fun = function(){
console.log('is my_fun');
};
};
};
setInterval(fun, 1000);
定时器中每次调用fun
,str
都会获得一个包含巨大的数组和一个对于新闭包my_fun
的对象,并且unused
是一个引用了str2
的闭包。
整个案例中,闭包之间共享作用域,尽管unused
可能一直没有调用,但my_fun
可能被调用,就会导致内存无法回收,内存增长导致泄露。
var ele = {
img : document.getElementById('my_img')
};
function fun(){
ele.img.src = "http://www.baidu.com/1.png";
};
function foo(){
document.body.removeChild(document.getElementById('my_img'));
};
即使foo
方法将my_img
元素移除,但fun
仍有引用,无法回收。
通过Chrome浏览器查看内存占用:
步骤如下:
如果内存占用基本平稳,接近水平,就说明不存在内存泄漏。
反之,就是内存泄漏了。
命令行可以使用 Node 提供的process.memoryUsage
方法。
console.log(process.memoryUsage());
// { rss: 27709440,
// heapTotal: 5685248,
// heapUsed: 3449392,
// external: 8772 }
process.memoryUsage
返回一个对象,包含了 Node 进程的内存占用信息。该对象包含四个字段,单位是字节,含义如下。
rss(resident set size)
:所有内存占用,包括指令区和堆栈。heapTotal
:"堆"占用的内存,包括用到的和没用到的。heapUsed
:用到的堆的部分。external
: V8 引擎内部的 C++ 对象占用的内存。判断内存泄漏,以heapUsed
字段为准。
本部分内容到这结束
Author | 王平安 |
---|---|
[email protected] | |
博 客 | www.pingan8787.com |
微 信 | pingan8787 |
每日文章推荐 | https://github.com/pingan8787/Leo_Reading/issues |
JS小册 | js.pingan8787.com |
微信公众号 | 前端自习课 |