最近看到《深入浅出node》这本书,里面正好有内存控制, 加上最近看到一篇文章,也是讲了内存管理和垃圾回收机制。
由于自己曾经做过一个ssl接口,导致node服务经常重启,我潜意识就怀疑是内存管理出现了问题,所以这次来专门学习这块知识点,下面是自己的一些分享。
简短知识点如下:
首先,需要搞清楚,哪些数据如何存储的?
基本数据类型,也就是我们常说的,number,Boolean,null,undefined,string,这些数据类型是存储在栈中。(注意:null类型是对象类型,但是存储在栈中)
而通常object存储在堆中。
堆和栈的区别如下表:
栈(先进后出) | 堆(无规律) | |
---|---|---|
速度 | 快 | 慢 |
空间管理 | 高效,不会产生碎片 | 会产生内存碎片 |
访问权限 | 只能局部变量 | 可以访问全局变量 |
空间大小限制 | 操作系统限制 | 没有特定的限制 |
内存分配 | 连续 | 随机分配 |
分配和释放 | 编译器指令自动管理 | 程序员手动管理 |
开销 | 低 | 高 |
主要问题 | 空间小 | 内存碎片 |
灵活性 | 固定大小 | 可以resize |
那我们常听到的内存泄露?是怎么产生的?是堆内存?还是栈内存呢?
栈的空间由操作系统负责管理,开发者无需过于关心;堆的空间由 V8 引擎进行管理,可能由于代码问题出现内存泄漏,或者长时间运行后,垃圾回收导致程序运行速度变慢。
没有使用 var/let/const 声明的变量会直接绑定在 Global 对象上(Node.js 中)或者 Windows 对象上(浏览器中),哪怕不再使用,仍不会被自动回收。
接下来主要讲解Node堆内存
在后端开发语言中,在基本的内存上几乎没有限制,然而在Node中通过JavaScript使用内存就会发现只能使用部分内存,在这种限制下,将会导致Node无法直接操作大内存对象。
Node基于v8构建,所以Node中使用JavaScript对象基本上是都是通过V8引擎来分配和管理。
当我们在代码中声明变量并赋值时,所使用的对象的内存就分配在堆中。如果已申请的堆空间内存不够分配新的对象,将继续申请堆内存,直到堆的大小超过V8限制为止。
为什么V8要限制堆的大小?V8的限制最初只是为浏览器而设计的,不太可能遇到大量内存的场景。对于网页来说,V8的限制值已经绰绰有余。深层原因是V8的垃圾回收机制的限制。
V8中内存使用的查询方式
node
process.memoryUsage()
以1.5GB的垃圾回收堆内存为例,V8做一次小的垃圾回收需要50毫秒以上,做一次非增量式的垃圾回收机制甚至要1秒以上。这是垃圾回收中引起JavaScript线程短暂执行的时间,在这样的花销下,应用的性能和响应能力都会直线下降。这样的情况不仅仅后端服务无法接收,前端浏览器也无法接受。因此在当时的考虑下,直接限制堆内存是一个最好的选择。
当然这个限制也不是不能打开,V8仍然提供了选项让我们使用更多的内存。Node启动时可以传递–max-old-space-size或者–max-new-space-size来调整内存限制大小。实例如下:
node --max-old-space-size=1700 test.js // 单位为MB
node --max-new-space-size=1024 test.js // 单位为MB
上述参数在V8初始化时生效,一旦生效就不能在动态改变。如果遇到Node无法分配足够内存给JavaScript对象的情况,可以用这个办法来放宽V8默认的内存限制,避免在执行过程中稍微多用一些内存就轻易崩溃。
接下来,我们深入了解一下V8的垃圾回收策略。
V8的垃圾回收策略主要基于分布式垃圾回收机制。在自动垃圾回收的演变中,人们发现没有一种垃圾回收算法能够胜任所有场景。因为在实际的应用中,对象的生命周期长短不一,不同的算法只能针对特定情况具有最好的效果。为此统计学在垃圾回收算法的发展中产生了较大的作用,现代的垃圾回收算法中按对象的存活时间将内存的垃圾回收进行不同的分代,然后分别对不同分代实施更加高效的算法。
v8的内存分代
将内存分为新生代和老生代两代。
V8的分代内存示意图如下:
V8堆的整体大小是新生代的所用空间加上老生代的内存空间。
前面提到的–max-old-space-size命令行参数就是设置老生代的内存空间的最大值,–max-new-space-size就是设置新生代的内存空间最大值。比较特别的是两个参数必须要在启动时就指定。这就意味着V8使用的内存没有办法根据使用情况自动扩充。当内存分配过程中超过极限值时,就会引起进程出错。
在默认设置中,如果一直分配内存,在64位的系统和32位的系统下分别只能使用28GB和1.4GB的大小。这个限制可以从V8源码中找到。
在 64 位系统下,Node.js 可以使用最大约 28GB 的内存(实际上还依赖于机器内存)。这是因为 V8 的 64 位版本使用 full 128-bit pointer.
在 32 位系统下,Node.js 可以使用最大约 1.4GB 的内存。这是因为 V8 的 32 位版本使用 smi pointer ,其中 30 位用于存储指针,能够寻址的内存空间为 2 的 30 次方,约 1.4GB。
总结:
用于存储新创建的对象,大小默认为 512MB 到 700MB 左右(以 128MB 为增量调整)。当新生代内存不足以存储新创建的对象时,会触发 Minor GC 进行内存回收。
用于存储经 Minor GC 后存活的对象,大小根据机器内存不同,可以达到 28GB(64位)或 1.4GB(32位)。当老生代内存不足时,会触发 Major GC 进行内存回收。
在分代的基础上,新生代的对象主要是通过Scavenge算法进行回收的。在Scavenge的具体实现中,主要采用Cheney算法,该算法由C.J.Cheney于1970年首次发表在ACM论文上。
Cheney算法是一种采用复制的方式实现的垃圾回收算法。它将堆内存一分为二,每一部分空间称为semispace。
在这两个semispace空间中,只有一个处于使用中,另一个处于闲置状态。处于使用状态的semispace空间称为From空间,处于闲置状态的空间称为To空间。当我们分配对象时,先是在From空间中进行分配。
当开始进行垃圾回收时,会检查From空间中的存活对象,这些存活对象将被复制到To空间中,而非存活对象占用的空间将会被释放。完成复制后,From空间和To空间的角色发生对换。
简而言之,在垃圾回收的过程中,就是通过将存活对象在两个semispace空间之间进行复制。
Scavenge的缺点是只能使用堆内存中的一半,这是由划分空间和复制机制所决定的。但Scavenge由于只复制存活的对象,并且对于生命周期短的场景存活对象只占少部分,所以它在时间效率上有优异的表现。
由于Scavenge是典型的牺牲空间换取时间的算法,所以无法大规模地应用到所有的垃圾回收中。但可以发现,Scavenge非常适合应用在新生代中,因为新生代中对象的生命周期较短,恰恰适合这个算法。
是故,V8的堆内存示意图应当如下图所示。
实际使用的堆内存是新生代中的两个semispace空间大小和老生代所用内存大小之和。
当一个对象经过多次复制依然存适时,它将会被认为是生命周期较长的对象。这种较长生命周期的对象随后会被移动到老生代中,采用新的算法进行管理。对象从新生代中移动到老生代中的过程称为晋升。
在单纯的Scavenge过程中,From空间中的存活对象会被复制到To空间中去,然后对From空间和To空间进行角色对换(又称翻转)。但在分代式垃圾回收的前提下,From空间中的存活对象在复制到To空间之前需要进行检查。在一定条件下,需要将存活周期长的对象移动到老生代中,也就是完成对象晋升。
对象晋升的条件主要有两个,一个是对象是否经历过Scavenge回收,一个是To空间的内存占用比超过限制。
在默认情况下,V8的对象分配主要集中在From空间中。对象从From空间中复制到To空间时,会检查它的内存地址来判断这个对象是否已经经历过一次Scavenge回收。如果已经经历过了,会将该对象从From空间复制到老生代空间中,如果没有,则复制到To空间中。这个晋升流程如下图所示。
另一个判断条件是To空间的内存占用比。当要从From空间复制一个对象到To空间时,如果
To空间已经使用了超过25%,则这个对象直接晋升到老生代空间中,这个晋升的判断示意图如下图
设置25%这个限制值的原因是当这次Scavenge回收完成后,这个To空间将变成From空间,接下来的内存分配将在这个空间中进行。如果占比过高,会影响后续的内存分配。
对象晋升后,将会在老生代空间中作为存活周期较长的对象来对待,接受新的回收算法处理。
对于老生代中的对象,由于存活对象占较大比重,再采用Scavenge的方式会有两个问题:一个是存活对象较多,复制存活对象的效率将会很低;另一个问题依然是浪费一半空间的问题。这两个问题导致应对生命周期较长的对象时Scavenge会显得捉襟见肘。为此,V8在老生代中主要采用了Mark-Sweep和Mark-Compact相结合的方式进行垃圾回收。
Mark-Sweep是标记清除的意思,它分为标记和清除两个阶段。
与Scavenge相比,Mark-Sweep并不将内存空间划分为两半,所以不存在浪费一半空间的行为。
与Scavenge复制活着的对象不同,Mark-Sweep在标记阶段遍历堆中的所有对象,并标记活着的对象,在随后的清除阶段中,只清除没有被标记的对象。可以看出,Scavenge中只复制活着的对象,而Mark-Sweep只清理死亡对象。活对象在新生代中只占较小部分,死对象在老生代中只占较小部分,这是两种回收方式能高效处理的原因。
下图为Mark-Sweep在老生代空间中标记后的示意图,红色部分标记为死亡的对象。
Mark-Sweep最大的问题是在进行一次标记清除回收后,内存空间会出现不连续的状态。这种内存碎片会对后续的内存分配造成问题,因为很可能出现需要分配一个大对象的情况,这时所有的碎片空间都无法完成此次分配,就会提前触发垃圾回收,而这次回收是不必要的。
为了解决Mark-Sweep的内存碎片问题,Mark-Compact被提出来。Mark-Compact是标记整理的意思,是在Mark-Sweep的基础上演变而来的。它们的差别在于对象在标记为死亡后,在整理的过程中,将活着的对象往一端移动,移动完成后,直接清理掉边界外的内存。下图为Mark-Compact完成标记并移动存活对象后的示意图,白色格子为存活对象,深色格子为死亡对象,浅色格子为存活对象移动后留下的空洞。
完成移动后,就可以直接清除最右边的存活对象后面的内存区域完成回收。
这里将Mark-Sweep和Mark-Compact结合着介绍不仅仅是因为两种策略是递进关系,在V8的
回收策略中两者是结合使用的。下表是目前介绍到的3种主要垃圾回收算法的简单对比。
回收算法 | Scavenge | Mark-Sweep | Mark-Compact |
---|---|---|---|
速度 | 最快 | 中等 | 最慢 |
空间开销 | 双倍空间(无碎片) | 少(有碎片) | 少(无碎片) |
是否移动对象 | 是 | 否 | 是 |
从表中可以看到,在Mark-Sweep和Mark-Compact之间,由于Mark-Compact需要移动对象,所以它的执行速度不可能很快,所以在取舍上,V8主要使用Mark-Sweep,在空间不足以对从新生代中晋升过来的对象进行分配时才使用Mark-Compact。
为了避免出现JavaScript应用逻辑与垃圾回收器看到的不一致的情况,垃圾回收的3种基本算法都需要将应用逻辑暂停下来,待执行完垃圾回收后再恢复执行应用逻辑,这种行为被称为“全停顿”(stop-the-world)。
在V8的分代式垃圾回收中,一次小垃圾回收只收集新生代,由于新生代默认配置得较小,且其中存活对象通常较少,所以即便它是全停顿的影响也不大。但V8的老生代通常配置得较大,且存活对象较多,全堆垃圾回收(full垃圾回收)的标记、清理、整理等动作造成的停顿就会比较可怕,需要设法改善。
为了降低全堆垃圾回收带来的停顿时间,V8先从标记阶段入手,将原本要一口气停顿完成的动作改为增量标记(incremental marking),也就是拆分为许多小“步进”,每做完一“步进”就让JavaScript应用逻辑执行一小会儿,垃圾回收与应用逻辑交替执行直到标记阶段完成。下图为增量标记示意图。
V8在经过增量标记的改进后,垃圾回收的最大停顿时间可以减少到原本的1/6左右。
V8后续还引人了延迟清理(lazy sweeping)与增量式整理(incremental compaction)、让清理与整理动作也变成增量式的。同时还计划引入并行标记与并行清理,进一步利用多核性能降低每次停顿的时间。
总结:
从V8的自动垃圾回收机制的设计角度可以看到,V8对内存使用进行限制的缘由。
新生代设计为一个较小的内存空间是合理的,而老生代空间过大对于垃圾回收并无特别意义。
V8对内存限制的设置对于Chrome浏览器这种每个选项卡页面使用一个V8实例而言,内存的便用是绰绰有余了。
对于Node编写的服务器端来说,内存限制也并不影响正常场景下的使用。但是对于V8的垃圾回收特点JavaScript在单线程上的执行情况,垃圾回收是影响性能的因素之一。想要高性能的执行效率,需要注意让垃圾回收尽量少地进行,尤其是全堆垃圾回收。
以Web服务器中的会话实现为例,一般通过内存来存储,但在访问量大的时候会导致老生代中的存活对象骤增,不仅造成清理/整理过程费时,还会造成内存紧张,甚至溢出。