第三章 垃圾收集器与内存分配策略

垃圾对象判定

1.引用计数算法

给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加 1,当引用失效时,计数器值就减1,任何时刻计数器都为 0 的对象就是不可能再被使用的。

引用计数算法的实现简单,判定效率也很高,在大部分情况下它都是一个不错的选择,当 Java 语言并没有选择这种算法来进行垃圾回收,主要原因是它很难解决对象之间的相互循环引用问题。

2.可达性分析算法

这种算法的基本思路是通过一系列名为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到 GC Roots 没有任何引用链相连时,就证明此对象是不可用的。在 Java 语言里,可作为 GC Roots 的兑现包括下面几种:

(1)虚拟机栈(栈帧中的本地变量表)中引用的对象。

(2)方法区中的类静态属性引用的对象。

(3)方法区中的常量引用的对象。

(4)本地方法栈中 JNI(Native 方法)的引用对象。

要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行根搜索后发现没有与 GC Roots 相连接的引用链,那它会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行 finalize()方法。当对象没有覆盖 finalize()方法,或finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为没有必要执行。如果该对象被判定为有必要执行 finalize()方法,那么这个对象将会被放置在一个名为 F-Queue 队列中,并在稍后由一条由虚拟机自动建立的、低优先级的 Finalizer 线程去执行 finalize()方法。finalize()方法是对象逃脱死亡命运的最后一次机会(因为一个对象的 finalize()方法最多只会被系统自动调用一次),稍后 GC 将对 F-Queue 中的对象进行第二次小规模的标记,如果要在 finalize()方法中成功拯救自己,只要在 finalize()方法中让该对象重引用链上的任何一个对象建立关联即可。而如果对象这时还没有关联到任何链上的引用,那它就会被回收掉。

3.回收方法区

永久带的垃圾收集主要回收两部分内容:废弃常量和无用的类。

判定一个类是否是“无用的类”需要同时满足下面3个条件:

(1)该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何引用。

(2)加载该类的classloader已经被回收。

(3)该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

垃圾收集算法

1.标记-清除算法(Mark-Sweep)

标记—清除算法是最基础的收集算法,它分为“标记”和“清除”两个阶段:首先标记出所需回收的对象,在标记完成后统一回收掉所有被标记的对象,它的标记过程其实就是前面的根搜索算法中判定垃圾对象的标记过程。它有两个主要不足:一个是效率问题;另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,内存碎片太多可能导致以后再程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

2.复制算法

为了解决Mark-Sweep算法的缺陷,Copying算法就被提了出来。它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用的内存空间一次清理掉,这样一来就不容易出现内存碎片的问题。

3.标记-整理算法

复制算法比较适合于新生代,在老年代中,对象存活率比较高,如果执行较多的复制操作,效率将会变低,所以老年代一般会选用其他算法,如标记—整理算法。该算法标记的过程与标记—清除算法中的标记过程一样,但对标记后出的垃圾对象的处理情况有所不同,它不是直接对可回收对象进行清理,而是让所有的对象都向一端移动,然后直接清理掉端边界以外的内存。

4.分代收集算法

当前商业虚拟机的垃圾收集 都采用分代收集,它根据对象的存活周期的不同将内存划分为几块,一般是把 Java 堆分为新生代和老年代。在新生代中,每次垃圾收集时都会发现有大量对象死去,只有少量存活,因此可选用复制算法来完成收集,而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记—清除算法或标记—整理算法来进行回收。

垃圾收集器

1.CMS(Concurrent Mark Sweep)收集器

CMS收集器目标:获取最短回收停顿时间。基于“标记-清除”算法。
整个过程分为4个步骤:

(1)初始标记:

仅仅只是标记一下GC Roots能直接关联到的对象,速度很快。

(2)并发标记:

就是进行GC Roots Tracing的过程。在初始标记的基础上继续向下追溯标记。

(3)重新标记:

为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录。

CMS收集器有3个明显缺点:

1.CMS收集器对CPU资源非常敏感。

2.CMS收集器无法处理浮动垃圾,可能出现”Concurrent Mode Failure”失败而导致另一次Full GC的产生。
3.CMS是基于“标记-清除”算法实现的,可能发生收集结束时会有大量空间碎片产生。往往老年代还有很大空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前出发一次Full GC。

2.G1收集器

G1收集器具备如下特点:

1.并行与并发。

2.分代收集。

3.空间整合,G1从整体来看是基于“标记-整理”算法实现的收集器,从局部(两个Region之间)上来看是基于“复制”算法实现。

4.可预测的停顿。

使用G1收集器时,Java堆得内存布局就与其他收集器有很大区别,它将整个Java堆划分为多个大小相等的独立区域(Region),新生代和老年代不再是物理隔离的了,它们都是一部分region(不连续)的集合。

G1跟踪各个region里面的垃圾堆的价值大小(回收所获得的空间大小以及回收所需要的时间的经验值)

在G1收集器中,Region之间的对象引用以及其他收集器中的新生待与老年代之间的对象引用,虚拟机都是使用Remembered Set来避免全堆扫描的。G1中每个region都是有一个与之对应的
Remembered Set,虚拟机发现程序在对Reference类型的数据进行写操作时,会产生一个Write Barrier暂时中断写操作,检查Reference引用的对象是否处于不同的Region之中,如果是,便通过CardTable把相关引用信息记录到被引用对象所属的Region的Remembered Set中。

G1收集器可分为以下几个步骤:

1.初始标记:仅仅只是标记一下GC Roots能直接关联到的对象,并修改TAMS(Next Top at Mark Start)的值。需要停顿,时间短。

2.并发标记:从GC Root开始对堆中的对象进行可达性分析,找出存活的对象,耗时较长,但可以用户应用程序并行执行。

3.最终标记:
是为了修正在并发标记期间用户程序继续运行而导致标记产生变化的那一部分标记记录,虚拟机将这段时间对象变化记录在线程Remembered Set Logs里面,最终标记阶段需要把Remembered Set Logs的数据合并到Remembered Set中,需要停顿,但是可并行执行。

4.筛选回收:首先对各个region的回收价值和成本进行排序,根据用户期望的GC停顿时间来制定回收计划。

你可能感兴趣的:(读书,Java)