深究JDK7和8 JVM垃圾回收机制原理

文章目录

    • 什么是垃圾回收
    • - CMS并发垃圾收集器
    • G1垃圾收集器

深究JDK7和8 JVM垃圾回收机制原理_第1张图片

深究JDK7和8 JVM垃圾回收机制原理_第2张图片

深究JDK7和8 JVM垃圾回收机制原理_第3张图片
-CMS垃圾回收器:
初始化标记(STW)-》并发标记-》预清理-》重新标记(STW)-》并发清除-》标记压缩
-G1
取消了年轻代,年老代物理上的划分,不用担心某个区域内存是否够用,将所有内存划分为若干个区域,当Eden区满了的时候,将存活对象拷贝到年老代或者survivor区域种,这样不存在碎片化。这里有个Humongous区,当有大对象时,放在这个区域。

什么是垃圾回收

程序运行必然要占用资源,无效的对象资源如果不及时处理就会一直占有内存,最终导致内存溢出,所以对内存的管理是非常重要的。
垃圾回收常见的算法

  • 引用计数法
    原理:假如有对象A,任何对象对A的引用,那么对象A的引用计数器加1,当引用失败,引用计数器-1,当对象A的计数器值为0的时候,对象A没有被引用了,可以被回收。

    优点:
    1,实时性较高,不用等到内存不够时候,才开始回收,运行时根据对象计数器是否为0就可以直接回收。
    2,垃圾回收时,应用无需挂起
    3,区域性。更新对象的计数器时,只影响该对象,不会全局扫描

    缺点:
    1,每次对象被引用时,都需要去更新计数器,有一点时间开销
    2,浪费cpu资源,即使内存够用,仍然运行内存计数器
    3,无法解决循环依赖(最大的缺点)
    循环依赖:

   class TestA{
        public TestB b;
    }
    class TestB{
        public TestA a;
    }
    class TestDemo{
        public static void main(String[] args) {
            TestA testA = new TestA();
            TestB testB = new TestB();
            testA.b=testB;
            testB.a=testA;
            testA=null;
            testB=null;
        }
    }
虽然a和b都是null,但是由于a和b存在循环引用,这样testA和testB永远都不会回收。
  • 标记清除法
    标记清除法,是将垃圾回收分为两个阶段,分别是标记和清除。
    标记:从根节点开始标记引用对象
    清除:未被标记的对象就是垃圾对象

    原理:
    深究JDK7和8 JVM垃圾回收机制原理_第4张图片
    这张图代表的是程序运行期间所有对象的状态,它们的标志位全部是0(也就是未标记, 以下默认0就是未标记,1为已标记),假设这会儿有效内存空间耗尽了,JVM将会停止应 用程序的运行并开启GC线程,然后开始进行标记工作,按照根搜索算法,标记完以后, 对象的状态如下所示。
    深究JDK7和8 JVM垃圾回收机制原理_第5张图片
    可以看到,按照根搜索算法,所有从root对象可达的对象就被标记为了存活的对象,此 时已经完成了第一阶段标记。接下来,就要执行第二阶段清除了,那么清除完以后,剩 下的对象如下图所示;
    深究JDK7和8 JVM垃圾回收机制原理_第6张图片
    标记清除解决了重复引用的问题。
    但是缺点也很明显:
    1,效率较低,标记和清除两个动作需要遍历所有的对象,并且在GC时需要停止引用程序,对于交互性要求高的运用程序体验感就会很差了。
    2,通过标记清除算法清理出来的内存,碎片化比较严重,因为被回收的对象可能存在于各个角落,所以清理出来的内存是不连贯的

  • 标记压缩法
    标记压缩算法是在标记压缩清除算法的基础之上优化的算法,和标记清除法一样也是从根节点开始对对象的引用标记,在清理阶段,并不是简单的清理未标记的对象。而是将存活的对象压缩到内存的另外一端。然后清理边界意外的垃圾,从而解决碎片化的问题
    优缺点:
    相比标记清除法解决了内存碎片化的问题,同时,标记压缩算法多了一步,对象移动内存位置的步骤,其效率也有一定的影响

  • 复制算法
    复制算法的核心是将内存空间一分为2,每次只用其中的一块,在垃圾回收时,将正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾回收。
    这种适合内存中的垃圾对象较多,需要复制的对象较少、
    深究JDK7和8 JVM垃圾回收机制原理_第7张图片
    1在GC开始的时候,对象只会存在于Eden区 和Survivor区
    2,紧接着进行GC,Eden区中所有存活的对象都会复制到到Survivor“To”,而在from区仍存活的对象会根据他们的年龄值来决定去向。年龄达到一定值(年龄阈值,可以通过XX:MaxTenuringThreshold来设置)会移动到老年代中,没有达到阈值的会移动到To区
    3,经过这次GC后,From和To会交换他们的角色,就是保证To的Survivor区都是空的
    4,GC会一直重复这个过程,直到To区被填满,To区被填满后会将所有的对象移到老年代中。

优缺点:
垃圾对象多的情况下,效率较高
清理后,内存无碎片
缺点:
需要两块内存空间
在垃圾对象较少的情况下不适合

  • 分代算法:
    根据我们上面的分析,我们知道,每一种算法都有自己的优缺点,谁也代替不了谁,所以我们应该根据垃圾回收对象的特点进行明智的选择。

分代算法于是就隐隐而生,根据回收对象进行选择,在JVM中,年轻代适合使用复制算法,老年代适合使用标记清除或者标记压缩算法。

垃圾收集器

  • 串行垃圾回收器
    是指使用单线程进行垃圾回收,垃圾回收时,只有一个线程在工作,并且java引用中的所有线程都要暂停,等待垃圾回收的完成,这种现象称之为STW(stop the world)
    对于交互性较强的运用而言,这种垃圾收集器是不能接受的。
    测试代码:
package com.evan.springboot.study;

import java.util.ArrayList;
import java.util.List;
import java.util.Properties;
import java.util.Random;

/**
 * @author evanYang
 * @version 1.0
 * @date 04/14/2020 11:36
 */
public class TestJVM{
    public static void main(String[] args) throws InterruptedException {
        System.out.print(System.getProperty("test.demo"));
        List<Object> list = new ArrayList<>();
        while (true){
            int anInt = new Random().nextInt(100);
            if (System.currentTimeMillis()%2==0){
                list.clear();
            }else{
                for (int i = 0; i < 1000; i++) {
                    Properties properties = new Properties();
                    properties.put("key_"+i,"value_"+ System.currentTimeMillis()+i);
                    list.add(properties);
                    //System.out.println(list);
                }
                //System.gc();
            }
            Thread.sleep(anInt);
        }

    }
}
-XX:+UseSerialGC -XX:+PrintGCDetails -Xms16m -Xmx16m

深究JDK7和8 JVM垃圾回收机制原理_第8张图片

Connected to the target VM, address: '127.0.0.1:3808', transport: 'socket'
null[GC (Allocation Failure) [DefNew: 4416K->512K(4928K), 0.0057594 secs] 4416K->1339K(15872K), 0.0058384 secs] [Times: user=0.00 sys=0.02, real=0.01 secs] 
[GC (Allocation Failure) [DefNew: 4928K->511K(4928K), 0.0031514 secs] 5755K->2462K(15872K), 0.0031901 secs] [Times: user=0.02 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [DefNew: 4927K->243K(4928K), 0.0008056 secs] 6878K->2196K(15872K), 0.0008453 secs] [Times: user=0.02 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [DefNew: 4659K->157K(4928K), 0.0013913 secs] 6612K->2110K(15872K), 0.0014919 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [DefNew: 4573K->511K(4928K), 0.0022576 secs] 6526K->2867K(15872K), 0.0023027 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [DefNew: 4927K->240K(4928K), 0.0005597 secs] 7283K->2620K(15872K), 0.0005894 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [DefNew: 4656K->154K(4928K), 0.0021212 secs] 7036K->2533K(15872K), 0.0022378 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [DefNew: 4570K->67K(4928K), 0.0003081 secs] 6949K->2447K(15872K), 0.0003411 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 

DefNew:表示使用的是串行垃圾收集器
4928K->511K(4928K): 表示年轻代GC前,占有4928K内存,GC后,占有511K内存
0.0005894 secs: GC所用的时间
6949K->2447K(15872K): 堆内存占有6949K,GC后占有2447K,总大小为15872K

  • 并行垃圾回收器
    并行垃圾收集器在串行垃圾收集器的基础上做了改进,将单线程改为了多线程进行垃圾回收,这样可以缩短垃圾回收时间。(这里是指,并行能力较强的机器)

当然了,并行垃圾收集器在收集的过程中也会暂停运用程序,这个和串行垃圾回收器是一样的。只是并行执行,速度更快一些,暂停的时间更短一些。

-XX:+UseParNewGC -XX:+PrintGCDetails -Xms16m -Xmx16m
null[GC (Allocation Failure) [ParNew: 4416K->512K(4928K), 0.0015939 secs] 4416K->1368K(15872K), 0.0016704 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4928K->424K(4928K), 0.0006856 secs] 5784K->1746K(15872K), 0.0007229 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4840K->512K(4928K), 0.0011280 secs] 6162K->2465K(15872K), 0.0011691 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4928K->512K(4928K), 0.0025072 secs] 6881K->2505K(15872K), 0.0025483 secs] [Times: user=0.05 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4928K->512K(4928K), 0.0007648 secs] 6921K->2689K(15872K), 0.0008018 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4928K->512K(4928K), 0.0017972 secs] 7105K->3593K(15872K), 0.0018330 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4928K->377K(4928K), 0.0007489 secs] 8009K->3579K(15872K), 0.0008213 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4793K->512K(4928K), 0.0025430 secs] 7995K->5377K(15872K), 0.0025828 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4928K->512K(4928K), 0.0010387 secs] 9793K->5638K(15872K), 0.0010879 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4928K->512K(4928K), 0.0014553 secs] 10054K->5894K(15872K), 0.0014929 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC (Allocation Failure) [ParNew: 4928K->512K(4928K), 0.0013254 secs] 10310K->6358K(15872K), 0.0013664 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 

- CMS并发垃圾收集器

CMS全称Concurrent Mark Sweep,是一款并发的,使用标记-清除算法的垃圾回收器,该回收器是针对老年代垃圾回收的。通过参数-XX:+UseConcMarkSweepGC进行设置。
CMS垃圾回收器的执行过程如下:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200416160442883.png)

初始化标记(CMS-initial-mark),标记root,会导致stw。
并发标记(CMS-concurrent-mark),与用户线程同时运行。
预清理(CMS-concurrent-preclean),与用户线程同时运行
重新标记(CMS-remark)会导致stw
并发清除(CMS-concurrent-sweep),与用户线程同时运行。
调整堆大小,设置CMS在清理之后进行内存压缩,目的是清理内存中的碎片。
并发重置状态等待下次CMS的触发(CMS-concurrent-reset),与用户线程同时运行。

#设置启动参数 ‐XX:+UseConcMarkSweepGC ‐XX:+PrintGCDetails ‐Xms16m ‐Xmx16m #运行日志 [GC (Allocation Failure) [ParNew: 4926K‐>512K(4928K), 0.0041843 secs] 9424K‐>6736K(15872K), 0.0042168 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
 #第一步,初始标记 [GC (CMS Initial Mark) [1 CMS‐initial‐mark: 6224K(10944K)] 6824K(15872K), 0.0004209 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
#第二步,并发标记 [CMS‐concurrent‐mark‐start] [CMS‐concurrent‐mark: 0.002/0.002 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
#第三步,预处理 [CMS‐concurrent‐preclean‐start] [CMS‐concurrent‐preclean: 0.000/0.000 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
#第四步,重新标记 [GC (CMS Final Remark) [YG occupancy: 1657 K (4928 K)][Rescan (parallel) , 0.0005811 secs][weak refs processing, 0.0000136 secs][class unloading, 0.0003671 secs][scrub symbol table, 0.0006813 secs][scrub string table, 0.0001216 secs][1 CMS‐remark: 6224K(10944K)] 7881K(15872K), 0.0018324 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]
 #第五步,并发清理 [CMS‐concurrent‐sweep‐start] [CMS‐concurrent‐sweep: 0.004/0.004 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
 #第六步,重置 [CMS‐concurrent‐reset‐start] [CMS‐concurrent‐reset: 0.000/0.000 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

G1垃圾收集器

G1的设计原则就是简化JVM性能调优,开发人员只需要简单的三步即可完成调优:
1,第一步开启G1垃圾收集器
2,第二步设置堆的最大内存
3,设置最大的停顿时间
G1中提供了三种垃圾回收模式,YoungGC,MixedGC和Full GC,在不同的条件下触发。

原理:
G1垃圾收集器相对于其他收集器而言,最大的区别是在于取消了年轻代,老年代的物理划分,取而代之的是将堆划分为若干个区域(Region),这些区域中包含了有逻辑上的年轻代,老年代区域。
这样的好处是我们再也不用单的的空间对每个代进行设置了。不用担心每个带内存是否足够。
深究JDK7和8 JVM垃圾回收机制原理_第9张图片
在G1划分的区域中,年轻代的垃圾收集依然采用暂停所有运用程序的方式。将存活对象拷贝到老年代或者Survivor空间,G1收集器通过将对象从一个区间复制到另外一个区域,完成了清理工作。
这就意味着,在正常的处理过程中,G1完成了堆的压缩(至少是部分堆的压缩),这样也就不会有cms内存碎片问题的存在了。

在G1中,有一种特殊的区域,叫Humongous区域。
1,如果一个对象占用的空间超过了分区容量50%以上,G1收集器就认为这是个巨型对象
2,这些巨型对象,默认直接会被分配在老年代,但是如果它是一个短期存在的巨型对 象,就会对垃圾收集器造成负面影响。
3,为了解决这个问题,G1划分了一个Humongous区,它用来专门存放巨型对象。如果 一个H区装不下一个巨型对象,那么G1会寻找连续的H分区来存储。为了能找到连续 的H区,有时候不得不启动Full GC。

YoungGC
YoungGC主要是对Eden区进行GC,在Eden空间耗尽时会被触发。
1,Eden空间的数据移动到Survivor空间中,如果Survivor空间不够,Eden空间的部分数据会直接晋升到老年代中
2,Survivor区数据移动到新的Survivor区中,也有部分数据直接晋升到老年代中。
3,最终eden空间数据为空,GC停止工作,应用线程继续执行。
深究JDK7和8 JVM垃圾回收机制原理_第10张图片
深究JDK7和8 JVM垃圾回收机制原理_第11张图片
RememberedSet(已记忆集合)
在GC年轻代的对象时,我们如何找到年轻代中对象的根对象呢?
根对象可能是在年轻代中,也可以在老年代中,那么老年代中的所有对象都是根吗?
如果全量扫描老年代,那么这样扫描下来会耗费大量的时间。
于是,G1引进了RSet的概念。它的全称是RememberedSet,其作用是跟踪指向某个堆内的对象的引用。
深究JDK7和8 JVM垃圾回收机制原理_第12张图片
每个Redion初始化时,会初始一个Rset,该集合用来记录并跟踪其他Region指向该Region对象的引用,每个Region默认按照512Kb划分为多个Card,所以RSet需要记录的东西是xx Region的xx Card

Mixed GC
当越来越多的对象晋升到老年代old region时,为了避免内存被耗尽,虚拟机会触发一个混合的垃圾收集器,即Mixed GC,该算法并不是一个Old GC,除了回收整个Yound Region,还会回收一部分Old Region,这里需要注意,是一部分老年代,而不是全部老年代。可以选择哪些old region进行收集,从而可以对垃圾回收的耗时时间进行控制。也要注意的是Mixed GC并不是Full GC。

MixedGC什么时候触发? 当参数-XX:InitialingHeapOccupancyPercent=n决定。默认是45%,该参数的意思是:当老年代大小占整个堆大小百分比达到该阈值时触发。

它的GC步骤分2步:
1,全局并发标记
2,拷贝存活对象

全部并发标记
全局并发标记,执行过程分为五个步骤: 初始标记(initial mark,STW) 标记从根节点直接可达的对象,这个阶段会执行一次年轻代GC,会产生全局停 顿。

  • 根区域扫描(root region scan)

G1 GC 在初始标记的存活区扫描对老年代的引用,并标记被引用的对象。 该阶段与应用程序(非 STW)同时运行,并且只有完成该阶段后,才能开始下 一次 STW 年轻代垃圾回收。

  • 并发标记(Concurrent Marking)

    G1 GC 在整个堆中查找可访问的(存活的)对象。该阶段与应用程序同时运行, 可以被 STW 年轻代垃圾回收中断。

  • 重新标记(Remark,STW)

    该阶段是 STW 回收,因为程序在运行,针对上一次的标记进行修正。

  • 清除垃圾(Cleanup,STW)

    清点和重置标记状态,该阶段会STW,这个阶段并不会实际上去做垃圾的收集, 等待evacuation阶段来回收。
    G1收集器相关参数
    -XX:+UseG1GC
    使用 G1 垃圾收集器 -XX:MaxGCPauseMillis 设置期望达到的最大GC停顿时间指标(JVM会尽力实现,但不保证达到),默认 值是 200 毫秒。
    -XX:G1HeapRegionSize=n
    设置的 G1 区域的大小。值是 2 的幂,范围是 1 MB 到 32 MB 之间。目标是根 据最小的 Java 堆大小划分出约 2048 个区域。 默认是堆内存的1/2000。
    -XX:ParallelGCThreads=n
    设置 STW 工作线程数的值。将 n 的值设置为逻辑处理器的数量。n 的值与逻辑 处理器的数量相同,最多为 8。
    -XX:ConcGCThreads=n
    设置并行标记的线程数。将 n 设置为并行垃圾回收线程数 (ParallelGCThreads) 的 1/4 左右。 -XX:InitiatingHeapOccupancyPercent=n
    设置触发标记周期的 Java 堆占用率阈值。默认占用率是整个 Java 堆的 45%。

对于G1垃圾收集器优化建议
年轻代大小
避免使用-Xmn选项或-XX:NewRatio等其他相关选项显示设置年轻代大小。
暂停时间目标不要太过于苛刻
G1 GC的吞吐量目标是90%应用程序时间和10%的垃圾回收时间。
评估G1 GC的吞吐量是,暂停目标不要太过苛刻。目标太过苛刻表示你愿意承受更多的垃圾回收开销,而这会直接影响到吞吐量

‐XX:+PrintGC 输出GC日志 ‐XX:+PrintGCDetails 输出GC的详细日志 ‐XX:+PrintGCTimeStamps 输出GC的时间戳(以基准时间的形式) ‐XX:+PrintGCDateStamps 输出GC的时间戳(以日期的形式,如 2013‐05‐ 04T21:53:59.234+0800) ‐XX:+PrintHeapAtGC 在进行GC的前后打印出堆的信息 ‐Xloggc:../logs/gc.log 日志文件的输出路径

#面试时的逻辑

主要串行,并行回收器。CMS回收器,G1回收器。CMS是在JDK8以前使用,我们先说下JVM内存主要有堆,栈,本地方法区,程序计数器,元素空间/永久代 组成。垃圾回收发生在堆中。堆分年轻代、年老代。年轻代是由Eden,Survivor1/2 组成。这里主要是在eden区间满之后发生young gc,使用的是复制算法。年老代发生的是full gc,这里容易产生碎片化。
流程是,初始化标记(stw),并发标记,预清除,重新标记(stw),并发清除。

G1垃圾收集器取消了年轻代和年老代的物理区域上的划分,将堆内存划分成若干区域,增加了H区,当有大对象生成时不会提前触发full gc。
使用标记清除算法不会有碎片化产生。增加了mixed gc 当老年代达到45%的时候会触发回收部分老年代。 利用多核cpu可以减少stw时间。

流程是,初始化标记,并发标记,重新标记,并发清除

你可能感兴趣的:(JVM)