JVM第十章-垃圾回收概述和相关算法

  1. 垃圾回收概述

  1. Java 和 C++语言的区别,就在于垃圾收集技术和内存动态分配上,C++语言没有垃圾收集技术,需要程序员手动的收集。

  2. 垃圾收集,不是Java语言的伴生产物。早在1960年,第一门开始使用内存动态分配和垃圾收集技术的Lisp语言诞生。

  3. 关于垃圾收集有三个经典问题:

    • 哪些内存需要回收?
    • 什么时候回收?
    • 如何回收?
  4. 垃圾收集机制是Java的招牌能力,极大地提高了开发效率。如今,垃圾收集几乎成为现代语言的标配,即使经过如此长时间的发展,Java的垃圾收集机制仍然在不断的演进中,不同大小的设备、不同特征的应用场景,对垃圾收集提出了新的挑战,这当然也是面试的热点。

1.1 大厂面试题

蚂蚁金服

  1. 你知道哪几种垃圾回收器,各自的优缺点,重点讲一下CMS和G1?
  2. JVM GC算法有哪些,目前的JDK版本采用什么回收算法?
  3. G1回收器讲下回收过程GC是什么?为什么要有GC?
  4. GC的两种判定方法?CMS收集器与G1收集器的特点

百度

  1. 说一下GC算法,分代回收说下
  2. 垃圾收集策略和算法

天猫

  1. JVM GC原理,JVM怎么回收内存
  2. CMS特点,垃圾回收算法有哪些?各自的优缺点,他们共同的缺点是什么?

滴滴

  1. Java的垃圾回收器都有哪些,说下G1的应用场景,平时你是如何搭配使用垃圾回收器的

京东

  1. 你知道哪几种垃圾收集器,各自的优缺点,重点讲下CMS和G1,
  2. 包括原理,流程,优缺点。垃圾回收算法的实现原理

阿里

  1. 讲一讲垃圾回收算法。
  2. 什么情况下触发垃圾回收?
  3. 如何选择合适的垃圾收集算法?
  4. JVM有哪三种垃圾回收器?

字节跳动

  1. 常见的垃圾回收器算法有哪些,各有什么优劣?
  2. System.gc()和Runtime.gc()会做什么事情?
  3. Java GC机制?GC Roots有哪些?
  4. Java对象的回收方式,回收算法。
  5. CMS和G1了解么,CMS解决什么问题,说一下回收的过程。
  6. CMS回收停顿了几次,为什么要停顿两次?

1.2 什么是垃圾?

  1. 垃圾是指在运行程序中没有任何指针指向的对象,这个对象就是需要被回收的垃圾。
  2. 外文:An object is considered garbage when it can no longer be reached from any pointer in the running program.
  3. 如果不及时对内存中的垃圾进行清理,那么,这些垃圾对象所占的内存空间会一直保留到应用程序结束,被保留的空间无法被其他对象使用。甚至可能导致内存溢出。

十几年前磁盘碎片整理的日子

1.3 为什么需要GC?

想要学习GC,首先需要理解为什么需要GC?

  1. 对于高级语言来说,一个基本认知是如果不进行垃圾回收,内存迟早都会被消耗完,因为不断地分配内存空间而不进行回收,就好像不停地生产生活垃圾而从来不打扫一样。

  2. 除了释放没用的对象,垃圾回收也可以清除内存里的记录碎片。碎片整理将所占用的堆内存移到堆的一端,以便JVM将整理出的内存分配给新的对象

  3. 随着应用程序所应付的业务越来越庞大、复杂,用户越来越多,没有GC就不能保证应用程序的正常进行。而经常造成STW的GC又跟不上实际的需求,所以才会不断地尝试对GC进行优化。

1.4 早期垃圾回收

  1. 在早期的C/C++时代,垃圾回收基本上是手工进行的。开发人员可以使用new关键字进行内存申请,并使用delete关键字进行内存释放。比如以下代码:
MibBridge *pBridge= new cmBaseGroupBridge();
//如果注册失败,使用Delete释放该对象所占内存区域
if(pBridge->Register(kDestroy)!=NO ERROR)
  delete pBridge;
  1. 这种方式可以灵活控制内存释放的时间,但是会给开发人员带来频繁申请和释放内存的管理负担。倘若有一处内存区间由于程序员编码的问题忘记被回收,那么就会产生内存泄漏,垃圾对象永远无法被清除,随着系统运行时间的不断增长,垃圾对象所耗内存可能持续上升,直到出现内存溢出并造成应用程序崩溃

  2. 有了垃圾回收机制后,上述代码极有可能变成这样

MibBridge *pBridge=new cmBaseGroupBridge(); 
pBridge->Register(kDestroy);
  1. 现在,除了Java以外,C#、Python、Ruby等语言都使用了自动垃圾回收的思想,也是未来发展趋势,可以说这种自动化的内存分配和来及回收方式已经成为了现代开发语言必备的标准。

1.5 Java 垃圾回收机制

1.5.1 自动内存管理

官网介绍:https://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/toc.html

自动内存管理的优点

  1. 自动内存管理,无需开发人员手动参与内存的分配与回收,这样降低内存泄漏和内存溢出的风险

  2. 没有垃圾回收器,java也会和cpp一样,各种悬垂指针,野指针,泄露问题让你头疼不已。

  3. 自动内存管理机制,将程序员从繁重的内存管理中释放出来,可以更专心地专注于业务开发

关于自动内存管理的担忧

  1. 对于Java开发人员而言,自动内存管理就像是一个黑匣子,如果过度依赖于“自动”,那么这将会是一场灾难,最严重的就会弱化Java开发人员在程序出现内存溢出时定位问题和解决问题的能力
  2. 此时,了解JVM的自动内存分配和内存回收原理就显得非常重要,只有在真正了解JVM是如何管理内存后,我们才能够在遇见OutofMemoryError时,快速地根据错误异常日志定位问题和解决问题。
  3. 当需要排查各种内存溢出、内存泄漏问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,我们就必须对这些“自动化”的技术实施必要的监控和调节

1.5.2 应该关心哪些区域的回收?

  1. 垃圾收集器可以对年轻代回收,也可以对老年代回收,甚至是全栈和方法区的回收,

  2. 其中,Java堆是垃圾收集器的工作重点

  3. 从次数上讲:

    1. 频繁收集Young区
    2. 较少收集Old区
    3. 基本不收集Perm区(元空间)

2. 垃圾回收相关算法

2.1 标记阶段:引用计数算法

2.1.1 标记阶段的目的

垃圾标记阶段:主要是为了判断对象是否存活

  1. 在堆里存放着几乎所有的Java对象实例,在GC执行垃圾回收之前,首先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记为己经死亡的对象,GC才会在执行垃圾回收时,释放掉其所占用的内存空间,因此这个过程我们可以称为垃圾标记阶段
  2. 那么在JVM中究竟是如何标记一个死亡对象呢?简单来说,当一个对象已经不再被任何的存活对象继续引用时,就可以宣判为已经死亡。
  3. 判断对象存活一般有两种方式:引用计数算法可达性分析算法

2.1.2 引用计数算法

  1. 引用计数算法(Reference Counting)比较简单,对每个对象保存一个整型的引用计数器属性。用于记录对象被引用的情况。
  2. 对于一个对象A,只要有任何一个对象引用了A,则A的引用计数器就加1;当引用失效时,引用计数器就减1。只要对象A的引用计数器的值为0,即表示对象A不可能再被使用,可进行回收。
  3. 优点:实现简单,垃圾对象便于辨识;判定效率高,回收没有延迟性。
  4. 缺点:
    1. 它需要单独的字段存储计数器,这样的做法增加了存储空间的开销
    2. 每次赋值都需要更新计数器,伴随着加法和减法操作,这增加了时间开销
    3. 引用计数器有一个严重的问题,即无法处理循环引用的情况。这是一条致命缺陷,导致在Java的垃圾回收器中没有使用这类算法。

2.1.3 循环引用

当p的指针断开的时候,内部的引用形成一个循环,计数器都还算1,无法被回收,这就是循环引用,从而造成内存泄漏

2.1.4 证明:java使用的不是引用计数算法

/**
 * -XX:+PrintGCDetails
 * 证明:java使用的不是引用计数算法
 */
public class RefCountGC {
   
    //这个成员属性唯一的作用就是占用一点内存
    private byte[] bigSize = new byte[5 * 1024 * 1024];//5MB

    Object reference = null;

    public static void main(String[] args) {
   
        RefCountGC obj1 = new RefCountGC();
        RefCountGC obj2 = new RefCountGC();

        obj1.reference = obj2;
        obj2.reference = obj1;

        obj1 = null;
        obj2 = null;
        //显式的执行垃圾回收行为
        //这里发生GC,obj1和obj2能否被回收?
        System.gc();

    }
}

  • 如果不小心直接把obj1.referenceobj2.reference置为null。则在Java堆中的两块内存依然保持着互相引用,无法被回收

没有进行GC时

把下面的几行代码注释掉,让它来不及

        System.gc();//把这行代码注释掉
Heap
 PSYoungGen      total 38400K, used 14234K [0x00000000d5f80000, 0x00000000d8a00000, 0x0000000100000000)
  eden space 33280K, 42% used [0x00000000d5f80000,0x00000000d6d66be8,0x00000000d8000000)
  from space 5120K, 0% used [0x00000000d8500000,0x00000000d8500000,0x00000000d8a00000)
  to   space 5120K, 0% used [0x00000000d8000000,0x00000000d8000000,0x00000000d8500000)
 ParOldGen       total 87552K, used 0K [0x0000000081e00000, 0x0000000087380000, 0x00000000d5f80000)
  object space 87552K, 0% used [0x0000000081e00000,0x0000000081e00000,0x0000000087380000)
 Metaspace       used 3496K, capacity 4498K, committed 4864K, reserved 1056768K
  class space    used 387K, capacity 390K, committed 512K, reserved 1048576K

Process finished with exit code 0

进行GC

打开那行代码的注释

[GC (System.gc()) [PSYoungGen: 13569K->808K(38400K)] 13569K->

你可能感兴趣的:(JVM上篇:内存与垃圾回收篇,java,jvm)