JVM学习笔记三【JVM的垃圾收集】

在本篇开始之前有几个问题需要大家思考一下：

垃圾收集的哪里？
哪些对象该被垃圾收集？
对象如何被回收？
对象的引用

垃圾收集的哪里？

我们知道JVM的运行时数据区分为：程序计数器，Java堆，Java虚拟机栈，本地方法栈，方法区(元数据区)；其中程序计数器，Java虚拟机栈，本地方法栈是线程私有的，他们伴着线程的创建而产生，同时也随着线程的销毁而回收；栈中的栈帧也随着方法的进入和退出，有条不紊的在栈中执行者入栈和出栈；这些空间的大小是有一定确定性的，而对于Java堆和方法区的大小有很大的不确定性，它们是动态的分配以及回收的，而垃圾回收关注的就是这部分内存空间。

所以垃圾回收针对的是Java堆和方法区；可能有人会对方法区有些疑问，JVM规范中指出方法区可以不回收，但是没有明确规定此区域不可以回收，只是此区域的回收效果相比于Java堆中新生代的回收的效率相差甚远。

哪些对象该被垃圾收集？

我们知道了回收的区域以后，那么那些对象该被回收呢？

垃圾收集器在回收Java堆中的对象时会首先判定这些对象是否已经“死了”，如何判断对象已死呢？

引用计数法

关于堆中的对象是否“死了”，你可能很快就会想到通过判断对象的引用，用一个计数器记录对象的引用次数，如引用则计数器加1，放弃引用则计数器减1，如果引用次数为0，那么这些对象就可以被回收；确实在大多数情况下这种方法效率很高；但是如果对象之间相互引用，并且这些对象已经不再被使用，这样的对象则无法被回收，是对内存空间一种极大的浪费。所以实际Java等商用语言常用的方法是可达性分析法

可达性分析法

以GC Roots作为一个引用链的起始位置，当一个对象到GC Roots没有任何引用链时，那么我们则认为这个对象不可达，那么它们就被判定为可以回收的对象。通常情况下我们把以下对象视为GC Roots：

虚拟机栈中引用的对象
本地方法栈中JNI引用的对象
方法区中类静态属性引用的对象
方法区中常量引用的对象

引用

无论是通过哪种策略判断对象的“存活”状态，都与对象的引用相关；但是“引用”的定义过于狭窄，描述的对象要么被引用，要么没有被引用；然而对于一些“食之无味，弃之可惜”的对象显得有些无能为力；所以Java在1.2之后，对于引用的概念做了扩展，分为：强引用，软引用，弱引用，虚引用(幻象引用)；引用强度依次减弱。

强引用：强引用在代码中是普遍存在的，类似于Object obj = new Object()；这类引用就是强引用

软引用：软引用是用来描述那些有用但是非必需的对象；在即将发生内存溢出之前，垃圾收集器会将这些对象列入可回收的范围进行二次回收；如果二次回收结束后，仍然没有足够的内存则抛出内存溢出异常。

弱引用：弱引用也是用来描述有用但非必须的对象，但是它比软引用还要弱一些，它只能生存到下次回收之前。

虚引用：虚引用是最弱的一种引用关系，一个对象是否有虚引用，不会影响其生存时间，而虚引用存在的引用的目的在于这个对象被回收时收到一个系统通知。

生存还是死亡

通过可达性分析法，被认为是“不可达”的对象也并非是非死不可，要宣告一个对象的死亡至少要经过两次标记；如果对象在通过可达性分析法以后发现没有GCRoots引用链，那么它会被第一次标记并进行一次筛选，筛选的条件是判断对象是否有必要执行finalize方法，如果对象没有覆盖finalize方法，或者已经执行过一次finalize方法，则会被认为没有必要执行。

如果有必要执行finalize方法，那么这个对象会被加入到一个F-Queue队列中，由虚拟机自动创建一个低优先级的线程Finalizer去执行，即调用队列中对象的finalize方法，但并不保证等它执行完成，因为如果一个对象的finalize方法调用阻塞过程时间，有可能导致整个队列的对象处于等待，甚至导致整个垃圾收集崩溃；finalize是对象最后一次自我救赎的机会，当它重新与GCRoots引用链中的对象建立联系时，它就会移除“即将回收的集合”，否则基本上它将被进行回收了。

方法区的回收

方法区的回收相比于堆中更加严格，当对象同时满足以下条件，才会被认为是“无用”的对象

堆中没有该类的任何实例，所有实例都被回收
该类的加载器已经被回收
没有该类的任何引用，任何地方无法通过反射访问该类的方法

对象如何被回收？

对象如何被回收呢，不同的JVM实现有不同的实现方法，我们无法一一进行详细描述，我们可以从算法思想的角度做一个大概的剖析。

标记-清除算法

顾名思义，标记-清除算法分为两个阶段，先是标记需要回收的对象，再是清除标记好的对象；这个算法的优点是简单，但是无论是标记阶段，还是清除阶段都比较耗时，其次是如果标记的对象是分散的，清除过后，仍无法提供连续的空间；当申请较大的内存空间时，有可能触发另一次回收。

复制算法

复制算法弥补了标记-清除算法的缺陷，它将内存空间分为两部分，一部分是已用，一部分未用，垃圾收集时它将已用区域存活下来的对象复制到未用区域，然后再清除已用区域；这样的算法缺陷是牺牲了一部分内存空间；在商用的JVM中此算法常用于回收新生代，新生代的对象一般朝生夕灭，合理配置已用和未用区域的比例，回收效率高，实现简单，减少内存的浪费；

标记-整理算法

复制算法在对象存活率较高的时，会进行比较多的复制，效率较低；所以根据老年代的特点有人提出了标记-整理的算法；标记过程类似于标记-清除算法的标记过程，不同的是在整理的过程，不是直接对可回收对象进行清理，而是让所有存活的对象向一端移动，随后清理端边界以外的区域。

分代回收算法

分代收集算法是根据存活对象的生命周期的不同，将内存分为几块。一般把Java堆分成新生代和老年代，然后根据其特征使用最恰当的垃圾回收算法。在新生代对象存活率低，使用复制算法效率更高；对于存活时间较长的老年代使用标记-清除算法或者标记-整理算法

总结

本文整理了垃圾收集针对的区域，垃圾收集针对的那些对象，以及垃圾收集涉及的算法做了说明；要对这些做到心中有数，面对问题时才能做到不慌不乱。