目录
1.串行垃圾收集器(Serial)
2.并行垃圾收集器
2.1.ParNew垃圾收集器
2.2.ParallelGC垃圾收集器
3.CMS垃圾收集器
4.G1垃圾收集器
4.1.原理
4.2.YOUNG GC
4.3.Mixed GC
4.5.测试
4.6.对于G1垃圾收集器优化建议
5.ZGC
5.1.内存布局
5.2.性能
5.3.染色指针技术
5.4.工作过程
本篇文章主要讲解一下java虚拟机里面所使用的垃圾收集器,由于当前比较流行的是G1和ZGC这两款垃圾收集器,因此侧重点是在G1和ZGC。
一般情况下,我们可以通过jmap 命令可以查看正在使用的收集器,例如
Mark Sweep Compact GC 是指 串行 GC ( Serial Old GC )。
在 HotSpot 虚拟机中,常见的集中垃圾收集器组合方式:
1.串行垃圾收集器(Serial)
串行垃圾收集器,是指使用单线程进行垃圾回收,垃圾回收时,只有一个线程在工作,并且 java 应用中的所有线程
都要暂停,等待垃圾回收的完成。这种现象称之为 STW ( Stop-The-World )。
对于交互性较强的应用而言,这种垃圾收集器是不能够接受的
2.并行垃圾收集器
并行垃圾收集器在串行垃圾收集器的基础之上做了改进,将单线程改为了多线程进行垃圾回收,这样可以缩短垃圾回收的时间。(这里是指,并行能力较强的机器)
当然了,并行垃圾收集器在收集的过程中也会暂停应用程序,这个和串行垃圾回收器是一样的,只是并行执行,速度更快些,暂停的时间更短一些。
2.1.ParNew 垃圾收集器
用于测试的代码
public class TestGC {
public static void main(String[] args) throws Exception {
List list = new ArrayList();
while (true){
int sleep = new Random().nextInt(100);
if(System.currentTimeMillis() % 2 ==0){
list.clear();
}else{
for (int i = 0; i < 10000; i++) {
Properties properties = new Properties();
properties.put("key-"+i, "value-" + System.currentTimeMillis() + i);
list.add(properties);
}
}
System.out.println("list长度为:" + list.size()); Thread.sleep(sleep);
}
}
}
ParNew 垃圾收集器是工作在年轻代上的,只是将串行的垃圾收集器改为了并行。
通过 -XX:+UseParNewGC 参数设置年轻代使用 ParNew 回收器,老年代使用的依然是串行收集器。
#参数
-XX:+UseParNewGC -XX:+PrintGCDetails -Xms16m -Xmx16m
#打印出的信息
[GC (Allocation Failure) [ParNew: 4416K->512K(4928K), 0.0032106 secs] 4416K- >1988K(15872K), 0.0032697 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
2.2.ParallelGC 垃圾收集器
ParallelGC 收集器工作机制和 ParNewGC 收集器一样,只是在此基础之上,新增了两个和系统吞吐量相关的参数, 使得其使用起来更加的灵活和高效。
相关参数如下:
-XX:+UseParallelGC
年轻代使用 ParallelGC 垃圾回收器,老年代使用串行回收器。
-XX:+UseParallelOldGC
年轻代使用 ParallelGC 垃圾回收器,老年代使用 ParallelOldGC 垃圾回收器。
-XX:MaxGCPauseMillis
设置最大的垃圾收集时的停顿时间,单位为毫秒
需要注意的时,ParallelGC 为了达到设置的停顿时间,可能会调整堆大小或其他的参数,如果堆的大小设置的较小,就会导致GC 工作变得很频繁,反而可能会影响到性能。
该参数使用需谨慎。
-XX:GCTimeRatio
设置垃圾回收时间占程序运行时间的百分比,公式为 1/(1+n) 。
它的值为 0~100 之间的数字,默认值为 99 ,也就是垃圾回收时间不能超过 1%
-XX:UseAdaptiveSizePolicy
自适应 GC 模式,垃圾回收器将自动调整年轻代、老年代等参数,达到吞吐量、堆大小、停顿时间之间的平衡。
一般用于,手动调整参数比较困难的场景,让收集器自动进行调整。
3.CMS 垃圾收集器
CMS 垃圾回收器的执行过程如下:
初始化标记 (CMS-initial-mark) , 标记 root ,会导致 stw ;
并发标记 (CMS-concurrent-mark) ,与用户线程同时运行;
预清理( CMS-concurrent-preclean ),与用户线程同时运行;
重新标记 (CMS-remark) ,会导致 stw ;
并发清除 (CMS-concurrent-sweep) ,与用户线程同时运行;
调整堆大小,设置 CMS 在清理之后进行内存压缩,目的是清理内存中的碎片;
并发重置状态等待下次 CMS 的触发 (CMS-concurrent-reset) ,与用户线程同时运行;
4.G1垃圾收集器
G1是在JDK7出现的垃圾收集器,并在JDK9被设置成默认的垃圾收集器,因此我们常用的JDK8想使用G1,需要设置一下垃圾收集器
G1 的设计原则就是简化 JVM 性能调优,开发人员只需要简单的三步即可完成调优:
1. 第一步,开启 G1 垃圾收集器
2. 第二步,设置堆的最大内存
3. 第三步,设置最大的停顿时间
G1 中提供了三种模式垃圾回收模式, Young GC 、 Mixed GC 和 Full GC ,在不同的条件下被触发。
4.1.原理
G1 垃圾收集器相对比其他收集器而言,最大的区别在于它取消了年轻代、老年代的物理划分,取而代之的是将堆划分为若干个区域(Region ),这些区域中包含了有逻辑上的年轻代、老年代区域。
这样做的好处就是,我们再也不用单独的空间对每个代进行设置了,不用担心每个代内存是否足够。
在 G1 划分的区域中,年轻代的垃圾收集依然采用暂停所有应用线程的方式,将存活对象拷贝到老年代或者 Survivor空间,G1 收集器通过将对象从一个区域复制到另外一个区域,完成了清理工作。
这就意味着,在正常的处理过程中, G1 完成了堆的压缩(至少是部分堆的压缩),这样也就不会有 cms 内存碎片问题的存在了。
在 G1 中,有一种特殊的区域,叫 Humongous 区域。
如果一个对象占用的空间超过了一个分区容量 50% 以上, G1 收集器就认为这是一个巨型对象。
这些巨型对象,默认直接会被分配在老年代,但是如果它是一个短期存在的巨型对象,就会对垃圾收集器造成负面影响。
为了解决这个问题, G1 划分了一个 Humongous 区,它用来专门存放巨型对象。如果一个 H 区装不下一个巨型对象,那么G1 会寻找连续的 H 分区来存储。为了能找到连续的 H 区,有时候不得不启动 Full GC 。
每个 Region 的大小可以通过参数 -XX : G1HeapRegionSize 设定,取值范围为 1MB ~ 32MB ,且应为 2 的 N 次幂。
4.2.YOUNG GC
Young GC 主要是对 Eden 区进行 GC ,它在 Eden 空间耗尽时会被触发。
Eden 空间的数据移动到 Survivor 空间中,如果 Survivor 空间不够, Eden 空间的部分数据会直接晋升到年老代空间。
Survivor 区的数据移动到新的 Survivor 区中,也有部分数据晋升到老年代空间中。
最终 Eden 空间的数据为空, GC 停止工作,应用线程继续执行。
大致逻辑如下:
4.2.1.Remembered Set (已记忆集合)
在 GC 年轻代的对象时,我们如何找到年轻代中对象的根对象呢?
根对象可能是在年轻代中,也可以在老年代中,那么老年代中的所有对象都是根么?
如果全量扫描老年代,那么这样扫描下来会耗费大量的时间。
于是, G1 引进了 RSet 的概念。它的全称是 Remembered Set ,其作用是跟踪指向某个堆内的对象引用。
每个 Region 初始化时,会初始化一个 RSet ,该集合用来记录并跟踪其它 Region 指向该 Region 中对象的引用,每个Region默认按照 512Kb 划分成多个 Card ,所以 RSet 需要记录的东西应该是 xx Region 的 xx Card 。
4.3.Mixed GC
当越来越多的对象晋升到老年代 old region 时,为了避免堆内存被耗尽,虚拟机会触发一个混合的垃圾收集器,即Mixed GC,该算法并不是一个 Old GC ,除了回收整个 Young Region ,还会回收一部分的 Old Region ,这里需要注意:是一部分老年代,而不是全部老年代,可以选择哪些old region 进行收集,从而可以对垃圾回收的耗时时间进行控制。也要注意的是Mixed GC 并不是 Full GC 。
MixedGC 什么时候触发?由参数 -XX:InitiatingHeapOccupancyPercent=n 决定。默认: 45% ,该参数的意思是:当老年代大小占整个堆大小百分比达到该阀值时触发。
它的 GC 步骤分 2 步:
全局并发标记( global concurrent marking )
拷贝存活对象( evacuation )
4.3.1. 全局并发标记
全局并发标记,执行过程分为五个步骤:
初始标记( initial mark , STW )
标记从根节点直接可达的对象,这个阶段会执行一次年轻代 GC ,会产生全局停顿。
根区域扫描( root region scan )
G1 GC 在初始标记的存活区扫描对老年代的引用,并标记被引用的对象。
该阶段与应用程序(非 STW )同时运行,并且只有完成该阶段后,才能开始下一次 STW 年轻代垃圾回收。
并发标记( Concurrent Marking )
G1 GC 在整个堆中查找可访问的(存活的)对象。该阶段与应用程序同时运行,可以被 STW 年轻代垃圾回收中断。
重新标记( Remark , STW )
该阶段是 STW 回收,因为程序在运行,针对上一次的标记进行修正。
清除垃圾( Cleanup , STW )
清点和重置标记状态,该阶段会 STW ,这个阶段并不会实际上去做垃圾的收集,等待 evacuation 阶段来回收。
4.3.2. 拷贝存活对象
Evacuation 阶段是全暂停的。该阶段把一部分 Region 里的活对象拷贝到另一部分 Region 中,从而实现垃圾的回收清理
4.4. G1 收集器相关参数
-XX:+UseG1GC
-XX:MaxGCPauseMillis
设置期望达到的最大 GC 停顿时间指标(会尽力实现,但不保证达到),默认值是 200 毫秒。
-XX:G1HeapRegionSize=n
设置的 G1 区域的大小。值是 2 的幂,范围是 1 MB 到 32 MB 之间。目标是根据最小的 Java 堆大小划分出约 2048 个区域。
默认是堆内存的 1/2000 。
-XX:ParallelGCThreads=n
设置 STW 工作线程数的值。将 n 的值设置为逻辑处理器的数量。 n 的值与逻辑处理器的数量相同,最多为 8 。
-XX:ConcGCThreads=n
设置并行标记的线程数。将 n 设置为并行垃圾回收线程数 (ParallelGCThreads) 的 1/4 左右。
-XX:InitiatingHeapOccupancyPercent=n
设置触发 Mixed GC 的 Java 堆占用率阈值。默认占用率是整个 Java 堆的 45% 。
4.5.测试
-XX:+UseG1GC -XX:MaxGCPauseMillis=100 -XX:+PrintGCDetails -Xmx256m
#日志
[GC pause (G1 Evacuation Pause) (young), 0.0029651 secs]
[Parallel Time: 2.6 ms, GC Workers: 8]
[GC Worker Start (ms): Min: 1562.6, Avg: 1562.7, Max: 1562.8, Diff: 0.2]
#根节点扫描
[Ext Root Scanning (ms): Min: 0.0, Avg: 0.1, Max: 0.2, Diff: 0.2, Sum: 0.9]
#更新RS区域消耗的时间
[Update RS (ms): Min: 0.0, Avg: 0.2, Max: 0.3, Diff: 0.3, Sum: 1.9]
[Processed Buffers: Min: 1, Avg: 1.1, Max: 2, Diff: 1, Sum: 9]
[Scan RS (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.0]
[Code Root Scanning (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.0]
#对象拷贝所消耗的时间
[Object Copy (ms): Min: 1.9, Avg: 2.1, Max: 2.3, Diff: 0.3, Sum: 16.4]
[Termination (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.2]
[Termination Attempts: Min: 94, Avg: 101.0, Max: 115, Diff: 21, Sum: 808]
[GC Worker Other (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.1]
[GC Worker Total (ms): Min: 2.3, Avg: 2.4, Max: 2.5, Diff: 0.2, Sum: 19.5]
[GC Worker End (ms): Min: 1565.1, Avg: 1565.1, Max: 1565.1, Diff: 0.0]
[Code Root Fixup: 0.0 ms]
[Code Root Purge: 0.0 ms]
#清空卡表
[Clear CT: 0.1 ms]
[Other: 0.3 ms]
#选择CSet
[Choose CSet: 0.0 ms]
#弱,软引用的处理耗时
[Ref Proc: 0.1 ms]
#弱,软引用的入队耗时
[Ref Enq: 0.0 ms]
[Redirty Cards: 0.1 ms]
#大对象注册
[Humongous Register: 0.0 ms]
#大对象回收
[Humongous Reclaim: 0.0 ms]
[Free CSet: 0.0 ms]
#年轻代的统计,包含Eden,Survivors空间
[Eden: 22.0M(22.0M)->0.0B(147.0M) Survivors: 3072.0K->4096.0K Heap: 39.9M(252.0M)->24.0M(252.0M)]
[Times: user=0.00 sys=0.00, real=0.00 secs]
4.6. 对于 G1 垃圾收集器优化建议
年轻代大小
避免使用 -Xmn 选项或 -XX:NewRatio 等其他相关选项显式设置年轻代大小。
固定年轻代的大小会覆盖暂停时间目标。
暂停时间目标不要太过严苛
G1 GC 的吞吐量目标是 90% 的应用程序时间和 10% 的垃圾回收时间。
评估 G1 GC 的吞吐量时,暂停时间目标不要太严苛。目标太过严苛表示您愿意承受更多的垃圾回收开销,而这会直接影响到吞吐量。
5.ZGC
ZGC 是一款在 JDK 11 中新加入的具有实验性质的低延迟垃圾收集器,是由 Oracle 公司研发的。
ZGC 的目标是希望在尽可能对吞吐量影响不太大的前提下,实现在任意堆内存大小下都可以把垃圾收集的停顿时间限制在10 毫秒以内的低延迟。
5.1. 内存布局
ZGC 的内存布局与 G1 一样,也采用基于 Region 的堆内存布局,但不同的是, ZGC 的 Page ( ZGC 中称之为页面,道理和Region 一样)具有动态性 —— 动态创建和销毁,以及动态的区域容量大小。在 x64 硬件平台下, ZGC 的 Page 可以具有大、中、小三类容量:
小型页面( Small Page ):容量固定为 2MB ,用于放置小于 256KB 的小对象。
中型页面( Medium Page ):容量固定为 32MB ,用于放置大于等于 256KB 但小于 4MB 的对象。
大型页面( Large Page ):容量不固定,可以动态变化,但必须为 2MB 的整数倍,用于放置 4MB 或以上的大对象。
每个大页面中只会存放一个大对象,这也预示着虽然名字叫作 “ 大型 Page” ,但它的实际容量完全有可能小于中型Page ,最小容量可低至 4MB 。
大型 Page 在 ZGC 的实现中是不会被重分配(重分配是 ZGC 的一种处理动作)的,因为复制一个大对象的代价非常高昂。
注:浅色是小型页面,中等色是中型页面,深色是大型页面
5.2.性能
从吞吐量和停顿时间来看都是优于G1和Parallel,是最优选择
5.3. 染色指针技术
ZGC 为了实现目标,新增了染色指针技术。取代G1的RSet方法
染色指针是一种直接将少量额外的信息存储在指针上的技术,在 64 位系统中,理论可以访问的内存高达 16EB ( 2 的64次幂)字节。实际上, 64 位的 Linux 则分别支持 47 位( 128TB )的进程虚拟地址空间和 46 位( 64TB )的物理地址空间,64 位的 Windows 系统甚至只支持 44 位( 16TB )的物理地址空间。
Linux 下 64 位指针的高 18 位不能用来寻址,但剩余的 46 位指针所能支持的 64TB 内存在今天仍然能够充分满足大型服务器的需要。
ZGC 的染色指针技术使用上了这剩下的 46 位指针宽度,将其高 4 位提取出来存储四个标志信息。分别是:
Finalizable bit - 该对象只能通过终结器来访问
M1:本次垃圾回收中识别的活跃对象
M0:前一次垃圾回收的标记阶段被标记过的活跃对象,对象在转移阶段未被转移,但是在本次垃圾回收中被识别为不活跃对象。
Remapped:前一次垃圾回收的转移阶段发生转移的对象或者是被应用程序线程访问的对象,但是在本次垃圾回收中被识别为不活跃对象。
由于这些标志位进一步压缩了原本就只有 46 位的地址空间,也直接导致 ZGC 能够管理的内存不可以超过 4TB ( 2 的42次幂)。
染色指针的好处:
染色指针可以使得一旦某个 Region 的存活对象被移走之后,这个 Region 立即就能够被释放和重用掉,而不必等待整个堆中所有指向该Region 的引用都被修正后才能清理。
染色指针可以大幅减少在垃圾收集过程中内存屏障的使用数量。
一般写屏障的目的通常是为了记录对象引用的变动情况,如果将这些信息直接维护在指针中,显然就可以省去一些专门的记录操作。
ZGC 都并未使用任何写屏障,只使用了读屏障。
染色指针可以作为一种可扩展的存储结构用来记录更多与对象标记、重定位过程相关的数据,以便日后进一步提高性能。
5.4. 工作过程
ZGC 的运作过程大致可划分为四个大的阶段,这四个阶段都是可以并发执行的。仅在开始标记,结束标记,开始重分配 阶段中会存在短暂的STW 。
并发标记( Concurrent Mark )
与 G1 一样,并发标记是遍历对象图做可达性分析的阶段,前后也要经过初始标记、最终标记的短暂停顿。
ZGC 的标记是在指针上而不是在对象上进行的,标记阶段会更新染色指针中的 Marked 0 、 Marked 1 标志位。
并发预备重分配( Concurrent Prepare for Relocate )
这个阶段需要根据特定的查询条件统计得出本次收集过程要清理哪些 Region ,将这些 Region 组成重分配集(Relocation Set )。
ZGC 每次回收都会扫描所有的 Region ,用范围更大的扫描成本换取省去 G1 中记忆集的维护成本。
ZGC 的重分配集只是决定了里面的存活对象会被重新复制到其他的 Region 中,里面的 Region 会被释放。
并发重分配( Concurrent Relocate )
重分配是 ZGC 执行过程中的核心阶段,这个过程要把重分配集中的存活对象复制到新的 Region 上,并为重分配集中的每个Region 维护一个转发表( Forward Table ),记录从旧对象到新对象的转向关系。
由于使用了染色指针的支持, ZGC 收集器能仅从引用上就明确得知一个对象是否处于重分配集之中,如果用户线程此时并发访问了位于重分配集中的对象,这次访问将会被预置的内存屏障(读屏障)所截获,然后立即根据Region 上的转发表记录将访问转发到新复制的对象上,并同时修正更新该引用的值,使其直接指向新对象 (这样子只有第一次访问时会变慢,后面的就可以不通过读屏障和转发表直接访问),ZGC 将这种行为称为指针的 “ 自愈 ” ( Self-Healing )能力。
并发重映射( Concurrent Remap )
重映射所做的就是修正整个堆中指向重分配集中旧对象的所有引用。
并发重映射并不是一个必须要 “ 迫切 ” 去完成的任务,但是当所有指针都被修正之后,原来记录新旧对象关系的转发表就可以释放掉了