方法区中能够回收的内容主要是不再使用的类。我们知道类的生命周期有七个部分,最后一个就是卸载。
判定一个类可以被卸载,需要同时满足三个条件:
此类的所有实例对象都已经被回收了,也就是说在堆中已经不存在该类的实例对象以及子类对象了。
Class<?> clazz = loader.loadClass("com.zhj.A");
Object o = clazz.newInstance();
o = null;
加载该类的类加载器已经被回收了。
URLClassLoader loader = new URLClassLoader(new URL[]{new URL("file:D:\\lib\\")});
loader = null;
该类对应的 java.lang.Class
对象没有在任何地方被引用。
Class<?> clazz = loader.loadClass("com.zhj.A");
clazz = null;
我们知道,项目当中我们自己创建的类都是由应用程序类加载器来进行加载的,而应用程序类加载器是不会被置为null的,也就是说这个类无法被卸载。
但是在一些特定场景下还是会出现类加载器被置为null的情况,主要在如 OSGi、JSP 的热部署等应用场景中。 每个jsp文件对应一个唯一的类加载器,当一个jsp文件修改了,就直接卸载这个jsp类 加载器。重新创建类加载器,重新加载jsp文件。
引用计数法:Java中的对象是否能被回收,是根据对象是否被引用来决定的。如果对象被引用了,说明该对象还在使用,不允许被回收。引用计数法会为每个对象维护一个引用计数器,当对象被引用时加1,取消引用时减1。
优点:
缺点:
可达性分析算法:Java使用的是可达性分析算法来判断对象是否可以被回收。可达性分析将对象分为两类:垃圾回收的根对象(GC Root)和普通对象,对象与对象之间存在引用关系。
A到B再到C和D,形成了一个引用链,可达性分析算法指的是如果从某个到GC Root对象是可达的,对象就不可被回收。
也就是说,如果对象A到对象B的引用链断了,那么对象B,C,D都可以被垃圾回收了。
那么哪些对象可以被称之为GC Root呢?
main线程作为虚拟机栈中引用的对象可以作为GC Root,那么可以通过它去判断对象是否可以回收:
当 a1 b1 置为 null 时,也就表示栈内存中 a1 到堆内存中 A的实例对象的引用链断了,b1 到堆内存中 B的实例对象的引用链断了,所以线程对象根据引用链到不了AB的实例对象了,所以AB的实例对象就可以被垃圾回收了。
可达性分析算法中描述的对象引用,一般指的是强引用,即是GCRoot对象对普通对象有引用关系,只要这层关系存在,普通对象就不会被回收。
软引用相对于强引用是一种比较弱的引用关系,如果一个对象只有软引用关联到它,当程序内存不足时,就会将软 引用中的数据进行回收。
在JDK 1.2版之后提供了SoftReference类来实现软引用,软引用常用于缓存中。
软引用的执行过程如下:
将对象使用软引用包装起来。
byte[] bytes = new byte[1024 * 1024 * 100];
//将100m的数据放入软引用中
SoftReference<byte[]> softReference = new SoftReference<byte[]>(bytes);
内存不足时,虚拟机尝试垃圾回收。
如果垃圾回收仍不能解决内存不足的问题,则回收软引用中的对象。
如果内存依旧不足,则抛出OOM异常。
软引用中的对象如果在内存不足时回收,SoftReference对象本身也需要被回收,我们又如何在适当时机将它回收呢?
SoftReference提供了一套队列机制:
弱引用的整体机制和软引用基本一致,区别在于弱引用包含的对象在垃圾回收时,不管内存够不够都会直接被回收。
在JDK 1.2版之后提供了WeakReference类来实现弱引用,弱引用主要在ThreadLocal中使用。 弱引用对象本身也可以使用引用队列进行回收。
这两种引用在常规开发中是不会使用的。
垃圾回收要做的两件事:
Java垃圾回收过程通过单独的GC线程来完成,不管使用哪一种GC算法,都会有部分阶段需要停止所有的用户线程。这个过程被称之为 Stop The World
简称STW,如果STW时间过长则会影响用户的使用。
垃圾回收算法的评价标准
判断垃圾回收算法是否优秀,可从以下三个方面来考虑:
吞吐量:吞吐量指的是 CPU 用于执行用户代码的时间与 CPU 总执行时间的比值,即吞吐量 = 执行用户代码时间 / (执行用户代码时间 + GC时间)。吞吐量数值越高,垃圾回收的效率就越高。
最大暂停时间:最大暂停时间指的是所有在垃圾回收过程中的STW时间最大值。比如如下的图中,黄色部分的STW就是最 大暂停时间,显而易见上面的图比下面的图拥有更少的最大暂停时间。最大暂停时间越短,用户使用系统时受到的影响就越短。
堆使用率:不同垃圾回收算法,对堆内存的使用方式是不同的。比如标记清除算法,可以使用完整的堆内存。而复制算 法会将堆内存一分为二,每次只能使用一半内存。从堆使用效率上来说,标记清除算法要优于复制算法。
上面提到的三种评价标准:吞吐量,最大暂停时间,堆使用率不可兼得。
一般来说,堆内存越大,最大暂停时间就越长,想要减少最大暂停时间,就会降低吞吐量。所以说没有最好的算法,只有最适合不同场景的算法。
标记清除算法的核心思想分为两个阶段:
优点:
缺点:
造成内存碎片。由于内存是连续的,所以在对象被删除之后,内存中会出现很多细小的可用内存单元。如果我们需要的是一 个比较大的空间,很有可能这些内存单元的大小过小无法进行分配。
分配速度慢。由于内存碎片的存在, 需要维护一个空闲链表,极有可能发生每次需要遍历到链表的最后才能获得合适的内存空间。
复制算法的核心思想是:
优点:
缺点:
标记整理算法核心思想分为两个阶段:
优点:
现代优秀的垃圾回收算法,会将上述描述的算法组合使用,其中应用最广的就是分代垃圾回收算法。
分代垃圾回收将整个内存区域划分为年轻代和老年代。年轻代用来存放存活时间较短的对象,老年代用来存放存活时间较长的对象。
年轻代由有三部分组成:
调整内存区域大小
根据以下虚拟机参数,调整堆的大小并观察结果。注意加上 -XX:+UseSerialGC
分代垃圾回收流程:
分代回收时,创建出来的对象首先被放入Eden伊甸园区。
随着对象在Eden区越来越多,如果EDen区满了,新创建的对象无法放入,就会触发年轻代的GC,称之为Minor GC或者Young GC。Minor GC会把需要Eden中区中和From需要回收的对象回收,把没有回收的对象放入To区。
接下来,S0会变成To区,S1变成From区。当Eden区满时再往里放入对象,依然会发生Minor GC。此时回收Eden区和S1(From)中的对象,并把eden和from区中剩余对象放入S0(To)。(注意:每次 Minor GC都会为对象记录他的年龄,初始值为0,每次GC完加1)
如果Minor GC后对象的年龄达到阈值(最大15,默认值和垃圾回收器有关),对象就会被晋升至老年代。
当老年代中空间不足导致无法放入新对象时,会先尝试Minor GC(因为不是只有年龄到达15的对象会放入老年代,如果新生代中存放了很多年龄不大的兑现导致新生代中满了,年轻对象也会放入老年代),如果还是不足,就会触发Full GC,Full GC会对整个堆进行垃圾回收。如果Full GC依然无法回收掉老年代的对象,那么当对象继续放入老年代时就会抛出OOM异常。
分代GC算法将堆分成年轻代和老年代的主要原因有:
垃圾回收器是垃圾回收算法的具体实现。
由于垃圾回收器分为年轻代和老年代,除了G1之外其他垃圾回收器必须成对组合使用。
Serial是一种单线程串行回收年轻代的垃圾回收器。使用复制算法。
SerialOld是Serial垃圾回收器的老年代版本,采用单线程串行垃圾回收,使用标记整理算法。使用 -XX:+UseSerialGC
指令则年轻代和老年代都使用串行回收器。
ParNew垃圾回收器本质上是对Serial在多CPU下的优化,使用多线程进行垃圾回收,使用复制算法。 -XX:+UseParNewGC
年轻代使用ParNew垃圾回收器,老年代使用SerialOld垃圾回收器。
CMS垃圾回收器关注的是系统的暂停时间,允许用户线程和垃圾回收线程在某些步骤中同时执行,减少了用户线程的等待时间。使用标记清除算法。 -XX:+UseConcMarkSweepGC
CMS的执行步骤:
CMS的缺点:
-XX:CMSFullGCsBeforeCompaction=N
参数调整N(默认为0)次Full GC之后再整理。Parallel Scavenge垃圾回收器是jdk8默认的年轻代垃圾回收器,多线程并行回收,关注的是系统的吞吐量。具备自动调整堆内存大小的特点。使用复制算法。
Parallel Old是为Parallel Scavenge收集器设计的老年代版本,利用多线程并发收集。适用标记整理算法。
参数:-XX:+UseParallelGC
或者 -XX:+UseParallelOldGC
可以使用Parallel Scavenge + Parallel Old这种组合。
Parallel Scavenge允许手动设置最大暂停时间和吞吐量。Oracle官方建议在使用这个组合时,不要设置堆内存的最大值,垃圾回收器会根据最大暂停时间和吞吐量 自动调整内存大小。
-XX:MaxGCPauseMillis=n
设置每次垃圾回收时的最大停顿毫秒数-XX:GCTimeRatio=n
设置吞吐量为n(用户线程执行时间 = n/n + 1)-XX:+UseAdaptiveSizePolicy
设置 可以让垃圾回收器根据吞吐量和最大停顿的毫秒数自动调整内存大小参数1: -XX:+UseG1GC
打开G1的开关,JDK9之后默认不需要打开。参数2:-XX:MaxGCPauseMillis=毫秒值
最大暂停的时间。使用复制算法。
JDK9之后默认的垃圾回收器是G1(Garbage First)垃圾回收器。
Parallel Scavenge关注吞吐量,允许用户设置最大暂停时间,但是会减少年轻代可用空间的大小。
CMS关注暂停时间,但是吞吐量方面会下降。
而G1设计目标就是将上述两种垃圾回收器的优点融合(JDK9之后建议使用G1垃圾回收器):
在G1出现之前的垃圾回收器,内存结构一般是连续的,如下图所示:
而在G1中整个堆会被划分成多个大小相等的区域,称之为区Region,区域不要求是连续的。分为Eden、Survivor、 Old区。Region的大小通过堆空间大小/2048计算得到,也可以通过参数 -XX:G1HeapRegionSize=32m
指定(其中32m指定region大小为32M),Region size必须是2的指数幂,取值范围从1M到32M。
G1垃圾回收有两种方式:
年轻代回收(Young GC),回收Eden和Survivor区中不用的对象。会导致STW,G1中可以通过参数 -XX:MaxGCPauseMillis=n
(默认为200)设置每次垃圾回收时的最大暂停时间毫秒数,G1垃圾回收器会尽可能的保证暂停时间。
年轻代回收执行流程:
G1在进行Young GC的过程中会去记录每次垃圾回收时每个Eden区和Survivor区的平均耗时,以作为下次回收时的参考依据。这样就可以根据配置的最大暂停时间计算出本次回收时最多能回收多少个Region区域了。
比如 -XX:MaxGCPauseMillis=n
(默认200),每个Region回收耗时40ms,那么这次回收最多只能回收4个Region。
Humongous
区。比如堆内存是4G,每个Region是2M,只要一个大对象超过了1M就被放入Humongous区,如果对象过大会横跨多个Region。-XX:InitiatingHeapOccupancyPercent
默认45%)会触发混合回收MixedGC,回收所有年轻代和部分老年代的对象以及大对象区。采用复制算法来完成。**混合回收(Mixed GC)**分为:初始标记(initial mark),并发标记(concurrent mark),最终标记(remark或者Finalize Marking),并发清理(cleanup)。
G1对老年代的清理会选择存活度最低的区域来进行回收,这样可以保证回收效率最高,这也是G1(Garbage first)名称的由来。
最后清理阶段使用复制算法,不会产生内存碎片。
注意:如果清理过程中发现没有足够的空Region存放转移的对象,会出现Full GC。单线程执行标记-整理算法, 此时会导致用户线程的暂停。所以尽量保证应该用的堆内存有一定多余的空间。
JDK8及之前:
JDK9之后: