话题:简单描述下jvm的垃圾回收策略,比如引用计数、标记清除等策略
从Java堆内存说起
堆是在JVm启动时候创建的,主要是维护运行时数据,如运行过程中创建的对象和数组都是基于这块内存空间。Java堆内存是非常重要的元素,如果我们动态创建的对象没有及时回收,持续堆积,最后会导致堆空间被占满,内存溢出。
因此,Java提供看一种垃圾回收机制,在后台创建一个收获线程。该线程在内存紧张的时候自动跳出来,把堆内存全部进行回收,从而保证程序的正常运行。
什么是垃圾
所谓“垃圾”,是指不再存活的对象们。常见的判断方法有2种:引用计数法和可达性分析
引用计数法
为每一个创建的对象分配一个引用计数器,用来存储该对象被引用的次数。次数为零,表示没有人在使用这个对象,可以认为“对象死亡”。但是,这种方案存在严重的问题,就是无法检测“循环引用”:当两个对象相互引用,即使他们不被外界任何东西引用,他们的计数都不为零,因此永远不会被回收。而实际上对于开发者而言,这两个对象已经完全没有用处。
可达性分析
基本思路是把所有引用的对象看成一棵树,从树的根节点出发,持续遍历查找所有连接的树枝对象,这些对象被称作可达对象或存活对象。其余的对象则被称为不可达对象或垃圾。
回收策略
1 、标记-清理
第一步,利用可达性遍历堆内存,把存活对象和“垃圾”进行标记。
第二步,再遍历一遍,把所有“垃圾”所占用的空间直接清空。
特点:简单方便,容易产生内存碎片
2 、标记-整理
在清理的时候,把所有存活对象扎堆到同个地方,让他们待在一起,这样就没有内存碎片。
这两种方案适合 存活对象多,垃圾少的情况,他只需要清理掉少量的垃圾,然后挪动下存活的对象即可。
3、复制
这种方案比较粗暴,直接把堆内存分成两部分,一段时间内只允许在其中一块内存上进行分配,当这块内存被分配完后,则进行垃圾回收,把所有存活的对象全部复制到另外一块内存上,当前内存则全部清空。
这种方案适合存活对象少,垃圾多的情况。这样在复制的时候就不需要复制多少对象过去,多数垃圾直接被清空处理。
Java的分代回收机制
Java是如何选择这三种回收算法呢?
Java的堆结构
一块Java堆空间一般分为三部分,这三部分可以用来存储三类数据:
- 刚刚创建的对象。在代码运行时候会不断地创建新的对象,这些对象会被统一放在一起。因为有很多局部变量在新创建后很快就会变成不可达的对象,快速死去,因此这块区域的特点是存活对象少,垃圾多。形容这块区域为:新生代;
- 存活了一段时间的对象。这些对象早早就被创建了,而且一直存活下来, 我们把这些存活时间比较长的对象放在一起,他们的特点是存活对象多,垃圾少。形容这块区域为:老年代;
- 永久存活的对象。比如一些静态文件,这些对象的特点是不需要垃圾回收,永远存活。形容这块区域为永久代。
结合新生代/老年代的存活特点和之前学习的几种垃圾回收算法,可以得到如下的回收方案:
新生代-复制回收机制
对于新生代区域,由于每次 GC 都会有大量新对象死去,只有少量存活。因此采用 复制 回收算法,GC 时把少量的存活对象复制过去即可。
那么如何设计这个 复制 算法比较好呢?有以下几种方式:
思路 1. 把内存均分成 1:1 两等份
每次只使用一半的内存,当这一半满了后,就进行垃圾回收,把存活的对象直接复制到另一半内存,并清空当前一半的内存。
这种分法的缺陷是相当于只有一半的可用内存,对于新生代而言,新对象持续不断地被创建,如果只有一半可用内存,那显然要持续不断地进行垃圾回收工作,反而影响到了正常程序的运行,得不偿失。
思路 2. 把内存按 9:1 分
既然上面的分法导致可用内存只剩一半,那么我做些调整,把 1:1变成9:1,
最开始在 9 的内存区使用,当 9 快要满时,执行复制回收,把 9 内仍然存活的对象复制到 1 区,并清空 9 区。
这样看起来是比上面的方法好了,但是它存在比较严重的问题。
当我们把 9 区存活对象复制到 1 区时,由于内存空间比例相差比较大,所以很有可能 1 区放不满,此时就不得不把对象移到 老年区 。而这就意味着,可能会有一部分 并不老 的 9 区对象由于 1 区放不下了而被放到了 老年区 ,可想而知,这破坏了 老年区 的规则。或者说,一定程度上的老年区 并不一定全是 老年对象。
那应该如何才能把真正比较老的对象挪到老年区 呢?
思路 3. 把内存按 8:1:1 分
既然 9:1 有可能把年轻对象放到老年区 ,那就换成 8:1:1,依次取名为 Eden、Survivor A、Survivor B 区,其中Eden 意为伊甸园,形容有很多新生对象在里面创建;Survivor区则为幸存者,即经历 GC 后仍然存活下来的对象。
工作原理如下:
首先,Eden区最大,对外提供堆内存。当 Eden区快要满了,则进行 Minor GC,把存活对象放入 Survivor A 区,清空 Eden 区;
Eden区被清空后,继续对外提供堆内存;
当 Eden 区再次被填满,此时对 Eden 区和 Survivor A 区同时进行 Minor GC,把存活对象放入 Survivor B 区,同时清空 Eden 区和Survivor A 区;
Eden区继续对外提供堆内存,并重复上述过程,即在 Eden 区填满后,把 Eden 区和某个 Survivor 区的存活对象放到另一个 Survivor 区;
当某个 Survivor 区被填满,且仍有对象未被复制完毕时,或者某些对象在反复 Survive15 次左右时,则把这部分剩余对象放到Old 区;
当 Old 区也被填满时,进行 Major GC,对 Old 区进行垃圾回收。
[注意,在真实的 JVM 环境里,可以通过参数 SurvivorRatio 手动配置 Eden 区和单个 Survivor 区的比例,默认为 8。]
那么,所谓的 Old 区垃圾回收,或称Major GC,应该如何执行呢?
老年代-标记整理回收机制
根据上面我们知道,老年代一般存放的是存活时间较久的对象,所以每一次 GC 时,存活对象比较较大,也就是说每次只有少部分对象被回收。
因此,根据不同回收机制的特点,这里选择 存活对象多,垃圾少的标记整理 回收机制,仅仅通过少量地移动对象就能清理垃圾,而且不存在内存碎片化。
至此,我们已经了解了Java堆内存的分代原理,并了解了不同代根据各自特点采用了不同的回收机制,即新生代采用复制回收机制,老年代采用标记整理 机制。