jvm(四):垃圾收集器初探

对于为了学jvm的人来说,垃圾收集应该是最为有用的章节之一,了解垃圾收集有助于我们手动调节使用何种垃圾收集机制,有助于解决内存溢出。

垃圾收集算法

垃圾收集算法是垃圾收集器的构建理论,仅从算法的思想方面介绍三种常用的垃圾收集算法如下:

标记-清除算法

标记-清除(Mark-Sweep)算法,如同名字一样,分为两个阶段:即“标记”和“清除”阶段。
首先标记处需要回收的对象(使用可达性分析),标记完成后统一回收。
jvm(四):垃圾收集器初探_第1张图片
该算法有两个问题:
- 效率低,尤其是清除阶段,需要针对每个标记逐一清除
- 空间不连续,产生内存碎片,导致分配较大对象时找不到合适的空间
以上问题也是操作系统在文件管理时会遇到的问题,而找不到空间存放较大对象则会导致再一次垃圾收集的启动,影响效率。

复制算法

算法思想是,将内存空间分为两块,其中一块用于存放内存,另一块空着,分配对象空间时,按序分配,当其中一块用完时,触动垃圾回收,标记出需要回收的对象和不需要回收的对象,然后将满的那一块上仍存活对象按序移到另一块空的上,满的那一块则腾出来了。该算法也需要标记。
这样每次分配时就不同考虑内存碎片的情况,每次分配时只要移动堆顶指针,按序分配内存即可。但问题是可用内存缩小了一半。
jvm(四):垃圾收集器初探_第2张图片
为了克服浪费内存的问题,整理算法做如下修改:将内存分为三块,一块较大的eden空间和两块survivor空间,每次分配时使用eden和一块survivor,当回收时,将eden和survivor上的存活对象移到另一块survivor上,然后清理掉eden和一块survivor上的空间。研究表明大部分对象都是“朝生夕死”的,因此这种做法是可以的,不太会引起survivor放不下的情况。
一般来说,如果遇到survivor上放不下的情况,则这些对象将被迁移到老年代。(关乎新生代和老年代请看下面)

标记-整理算法

标记-整理(Mark-Compact)算法,第一阶段仍是标记,不同之处在于第二阶段,不是直接对对象进行回收,而是让所有存活的对象都向一端移动。整体效果就是标记-清除后在进行压缩。
jvm(四):垃圾收集器初探_第3张图片

分代收集算法

分代收集(Generational Collection)更像是一种纯粹的思想。其主旨是将对象进行分代管理,分为“新生代”和“老年代”,分代的依据是对象存活的周期次数。
比如对象经过多次垃圾回收后仍存活,则将其移到老年代。同时,新生代和老年代采用不同的垃圾收集算法。
比如说,对于一开始所有对象,垃圾收集尚未开始,所有对象都在新生代区域,老年代区域为空。然后进行一次垃圾回收,此次垃圾回收发生在新生代,由于新生代大部分对象都是朝生夕死,因此新生代采取的垃圾回收算法是复制算法。新生代经过多次垃圾回收后,发现survivor区域放不下了,于是将survivor中的对象移到老年代,同时老年代也需要进行垃圾回收,由于老年代的对象存活率高,因此,常采用标记-整理标记清除算法。

算法的具体细节

上述只是介绍了整体的算法思想, 但在实际应用中还需要考虑实现的细节。

可达性分析的具体实现

我们在上一节对象引用与垃圾回收提到了可达性分析和垃圾回收,实际上可达性分析就是为垃圾回收服务的,通过可达性分析得出哪些对象需要被回收,然后在执行垃圾回收算法。
但具体可达性分析是如何实现的呢?
具体算法我们当然都知道了,使用图的遍历,不管是深度优先还是广度优先。
但一开始的节点如何选择呢?即如何选择GC Roots?
上一届也提到了,一般是全局性的引用(例如常量或者类静态属性),栈帧中的局部变量表。
然后实际情况是,方法区就有数百兆,如何逐一检查每个引用,必然会消耗很多时间。
另外,在进行可达性分析时,我们需要注意到其他的java线程仍是在执行的,这会导致可达性分析的误差,于是不得不暂停所有的java线程(一般称为Stop The World).
以上两点使得可达性分析变得困难。
一种较好的方法是使用一个表来记录这些GC Roots。
jvm使用一组称为OopMap的数据结构来直接得知哪些方法存放着对象的引用。于是在OopMap的帮助下,jvm就可以快速准确的完成GC Roots的枚举了。

GC的执行地

程序执行时并非在所有地方都可以停顿下来开始GC,只有到达特定的地点才可以,这些地点被称为安全点(Safepoint)。这样做的目的是为了减少OopMap的存放次数。
也就是说当执行GC时,并不是马上就行垃圾回收,因为有些线程并不在安全点上,于是就有了主动式中断的思想,即GC开始时,需要中断线程,此时不是直接对线程操作,而是设置一个标志,各个线程执行时主动去轮询这个标志,发现中断标志位真,就自己主动挂起。

你可能感兴趣的:(jvm)