JVM 读书笔记(二)之垃圾收集器 & 垃圾收集算法

一、垃圾收集器判断对象已死的算法

1.对象已死吗?

判断方法有以下两种:

  • 1.引用计数法

    给对象添加一个引用计数器,每当有一个地方引用它时,计数器就加1;当引用失效时,计数器数值就减1;任何时刻计数器为0的对象就是不可能再被使用的。
    但是这种方法有个弊端:很难解决对象之间相互循环引用的问题。

  • 2.可达性分析算法

    当一个对象到 GC Roots 没有任何引用链相连(用图论的话来说就是从 GC Roots 到这个对象不可达时),证明这个对象是不可用的。

  • 3.四种引用类型

    • 强引用:Object obj = new Object(),这就是强引用。只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。

    • 软引用:软引用用来描述一些还有用但并非必需的对象。对于软引用关联的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。使用 SoftRefrence类实现软引用。

    • 弱引用:弱引用也是用来描述非必须对象的,但是强度比软引用更弱。被弱引用关联的对象只能生存到下一次垃圾回收之前。垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。使用 WeakRefrence类实现弱引用。

    • 虚引用:这是最弱的一种引用关系。对象的生存时间与虚引用完全没有关系,无法通过虚引用获得对象实例。虚引用的唯一作用就是在对象被垃圾回收时收到一个系统通知。使用 PhantomRefrence类实现虚引用。


二、垃圾收集算法

  • 1.标记-清除算法(Mark-Sweep

    最基础的收集算法是“标记-清除算法”。这个算法分为两个阶段:标记清除
    标记:在标记阶段,collectormutator根对象开始进行遍历,对从 mutator根对象可以访问到的对象都打上一个标识,一般是在对象的header 中,将其记录为可达对象。

清除:在清除阶段,collector 对堆内存(heap memory)从头到尾进行线性的遍历,通过读取对象的 header 信息,如果发现某个对象没有标记为可达对象,则就将其回收。标记为可达对象的对象,将重新去掉 header信息的标志位,以准备下次垃圾回收。

但是这种方法有2个不足:
1.效率问题,标记和清除两个过程效率都不高。
2.空间问题,标记清除之后会产生大量的不连续的内存碎片,空 间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾回收动作。

JVM 读书笔记(二)之垃圾收集器 & 垃圾收集算法_第1张图片
标记-清除算法
  • 2.复制算法 (Copying)

    复制算法将内存划分为两个区间,在任意时间点,所有动态分配的对象都只能分配在其中一个区间(称为活动区间),而另外一个区间(称为空闲区间)则是空闲的。

    当有效内存空间耗尽时,JVM 将暂停程序运行,开启复制算法 GC 线程。接下来 GC 线程会将活动区间内的存活对象,全部复制到空闲区间,且严格按照内存地址依次排列,与此同时,GC线程将更新存活对象的内存引用地址指向新的内存地址。

    而此时,其实空闲区间和活动区间已经进行了交换,垃圾对象已经全部留在了原来的活动区间,也就是现在的空闲区间。事实上,在活动区间转换为空间区间的同时,垃圾对象已经被一次性全部回收。

    优点:每次内存回收都是对整个半区进行内存回收,内存分配时不用考虑内存碎片的问题,只要移动堆顶指针,按照顺序分配内存即可,实现简单,运行高效。

    缺点:1.代价是将内存缩小为原来的一半;2.如果对象的存活率很高,我们可以极端一点,假设是100%存活,那么我们需要将所有对象都复制一遍,并将所有引用地址重置一遍。复制这一工作所花费的时间,在对象存活率达到一定程度时,将会变的不可忽视。

    复制算法比较适合的场景:对象的存活率要非常低才行,而且最重要的是,我们必须要克服50%内存的浪费。

    下面看看复制算法回收前和回收后的内存模型:

    回收前:

    JVM 读书笔记(二)之垃圾收集器 & 垃圾收集算法_第2张图片
    回收前

    回收后:

    JVM 读书笔记(二)之垃圾收集器 & 垃圾收集算法_第3张图片
    回收后

    由于 1,4 对象不可达,被回收掉,剩下的对象按照顺序分配内存。这时右边的区域变成了活动区间,左边变成空闲区间,下次垃圾回收将再次调换回来。

  • 3.标记-整理算法 (Mark-Compact)

    标记-整理算法与标记-清除算法非常相似,它也是分为两个阶段:标记和整理

    标记:它的第一个阶段与标记-清除算法是一模一样的,均是遍历 GC Roots,然后将存活的对象标记。

    整理:移动所有存活的对象,且按照内存地址次序依次排列,然后将末端内存地址以后的内存全部回收。因此,第二阶段才称为整理阶段。

    标记-整理算法 GC 前后的图示与复制算法的图非常相似,只是没有了活动区间和空闲区间的区别,而过程又与标记-清除算法非常相似。

    回收前

    JVM 读书笔记(二)之垃圾收集器 & 垃圾收集算法_第4张图片
    回收前

    标记

    JVM 读书笔记(二)之垃圾收集器 & 垃圾收集算法_第5张图片
    回收前

    标记为 1 表示对象仍然可达。

    整理

    JVM 读书笔记(二)之垃圾收集器 & 垃圾收集算法_第6张图片
    回收前

    可见,1,4 对象被回收了,剩下的存活对象的内存按照顺序排列,这点很像复制算法,回收后不存在内存碎片问题,而且避免了内存减半的高额代价。但是处理过程又想标记-清除算法,不仅要标记所有存活对象,还要整理所有存活对象的引用地址。效率也不高,在效率上要低于复制算法。

参考资料

  • JVM内存管理------GC算法精解(复制算法与标记/整理算法)

你可能感兴趣的:(JVM 读书笔记(二)之垃圾收集器 & 垃圾收集算法)