Gc回收机制和回收算法解析

前言

GC(Garbage Collection),和面向对象一样是java语言的一大特性之一,有了它,不用再像c/c++那样麻烦且频繁地free()和delete()。垃圾回收机制主要作用于java堆(Heap),也就是jvm用于存放对象实例的地方,所以很多时候我们也把java堆成为GC堆。Java的内存管理包括内存分配和内存回收。这两方面工作都是由JVM自动完成的,虽然降低了Java程序员的学习难度,避免了像C/C++直接操作内存的危险。但是,也正因为内存管理完全由JVM负责,所以也使Java很多程序员不再关心内存分配,导致很多程序低效,耗内存。因此就有了Java程序员到最后应该去了解GC机制,才能写出更高效,充分利用有限的内存的程序。

相关知识

JAVA 简单理解JVM概念分析与GC机制

Java、Android 内存详解如何分配

垃圾收集器必须完成的两件事:1,检测垃圾、2,回收垃圾。

一、检测垃圾

1、引用计数算法(Reference Counting)

给每个对象添加一引用计数器,每当有一个地方引用它,计数器+1;引用失效时,计数器-1。引用计数算法很简单高效。但是,现在主流的虚拟机没有选用引用计数算法来管理内存,原因是它很难解决对象之间相互引用的问题。试想一下,要是虚拟机用了引用计数算法,下面的objA和objB会不会回收呢?
[java]   view plain  copy
  1. public class ReferenceCountingGC{  
  2.     public Object instance = null;  
  3.     public static void testGC(){  
  4.         ReferenceCountingGC objA = new ReferenceCountingGC ();  
  5.         ReferenceCountingGC objB = new ReferenceCountingGC ();  
  6.         objB.instance = objA;  
  7.         objA.instance = objB;  
  8.         objA = null;  
  9.         objB = null;  
  10.         System.gc();  
  11.     }  
  12. }  

2、可达性分析算法(Rearchability Analysis)

  • 可达状态:在一个对象创建后,有一个以上的引用变量引用它,那它就处于可达状态。
  • 可恢复状态:如果程序中某个对象不再有任何的引用变量引用它,它将先进入可恢复状态。在这个状态下,系统会调用finalize()方法进行资源整理,如果资源整理后有一个以上引用变量引用该对象,则这个对象又再次变为可达状态,否则会变成不可达状态。
  • 不可达状态:当对象的所有引用都被切断,且系统调用finalize()方法进行资源整理后该对象依旧没变为可达状态,则这个对象将永久性失去引用并且变成不可达状态,系统才会真正的去回收该对象所占用的资源!!!(前面啰啰嗦嗦一大堆,都是铺垫这句才是重点!哈哈~)

3、对象的4种引用

  • 强引用 :创建一个对象并把这个对象直接赋给一个变量,不管系统资源多么紧张,强引用的对象都不会被回收,即使他以后不会再用到
  • 软引用 :通过SoftReference修饰的类,内存非常紧张的时候会被回收,其他时候不会被回收,在使用之前要判断是否为null从而判断他是否已经被回收了。
  • 弱引用 :通过WeakReference修饰的类,不管内存是否足够,系统垃圾回收时必定会回收。
  • 虚引用 :不能单独使用,主要是用于追踪对象被垃圾回收的状态。通过PhantomReference修饰和引用队列ReferenceQueue类联合使用实现。

二、垃圾回收

其实Java垃圾回收主要做的是两件事:内存回收 和 碎片整理 。

回收机制

  1. 串行回收和并行回收:串行回收是不管系统有多少个CPU,始终只用一个CPU来执行垃圾回收操作;并行回收就是把整个回收工作拆分成多个部分,每个部分由一个CPU负责,从而让多个CPU并行回收。并行回收的执行效率很高,但更复杂,另外内存会增加。
  2. 应用程序停止和并发执行 :应用程序停止,顾名思义是在执行垃圾回收的同时会导致应用程序的暂停。并发执行的垃圾回收虽不会导致应用程序的暂停,但需要解决和应用程序的执行冲突(应用程序可能在垃圾回收的过程修改对象),因此并发执行垃圾回收的系统开销比较高,而且执行时需要更多的堆内存。
  3. 支持压缩的垃圾回收(标记-压缩 = 标记清除+压缩)会把所有的可达对象搬迁到一起,然后将之前占用的内存全部回收,减少了内存碎片。
  4. 不压缩的垃圾回收(标记-清除)要遍历两次,第一次先从跟开始访问所有可达对象,并将他们标记为可达状态,第二次便利整个内存区域,对未标记可达状态的对象进行回收处理。这种回收方式不压缩,不需要额外内存,但要两次遍历,会产生碎片
  5. 复制式的垃圾回收:将堆内存分成两个相同空间,将空间A的全部可达对象复制到空间B,然后一次性回收空间A。对于该算法而言,因为只需访问所有的可达对象,将所有的可达对象复制走之后就直接回收整个空间,完全不用理会不可达对象,所以遍历空间的成本较小,但需要巨大的复制成本和较多的内存。

     6.堆内存的分代回收:按对象的生存时间分成两代,分布是年轻代(Yong)和老人代(old),且两代之间的对象很少存在互相引用。

Young代 :因为对象数量少,所以采用复制回收机制。划分两个区域,分别是Eden区和Survivor区,多数对象先分配到Eden区,一些内存大的对象会直接被分配到Old代中。Survivor区同一时间又分Form、To两个小区,一个用来保存对象,另一个是空的;如下图,每次进行Young代垃圾回收的时候,就把Eden和From中的可达对象复制到To区域中,一些生存时间长的就复制到了老年代,接着清理回收Eden和From空间。最后,原来的To空间变为From空间,原来的From空间变为To空间绝大因为Young代对象大部分很快进入不可达状态,因此回收频率高且回收速度快。

②Old代 :

Ⅰ回收机制 :采用标记压缩算法回收。

Ⅱ对象来源 :1.对象大直接进入老年代。2.Young代中生存时间长的可达对象

Ⅲ回收频率 :因为很少对象会死掉,所以执行频率不高,而且需要较长时间来完成。

③Permanent代 :

Ⅰ用      途 :用来装载Class,方法等信息,默认为64M,不会被回收

Ⅱ对象来源 :eg:对于像Hibernate,Spring这类喜欢AOP动态生成类的框架,往往会生成大量的动态代理类,因此需要更多的Permanent代内存。所以我们经常在调试Hibernate,Spring的时候经常遇到java.lang.OutOfMemoryError:PermGen space的错误,这就是Permanent代内存耗尽所导致的错误。

Ⅲ回收频率 :不会被回收


3.3常见的垃圾回收器

1)串行回收器(只使用一个CPU):Young代采用串行复制算法;Old代使用串行标记压缩算法(三个阶段:标记mark—清除sweep—压缩compact),回收期间程序会产生暂停,

2)并行回收器:对Young代采用的算法和串行回收器一样,只是增加了多CPU并行处理; 对Old代的处理和串行回收器完全一样,依旧是单线程。

3)并行压缩回收器:对Young代处理采用与并行回收器完全一样的算法;只是对Old代采用了不同的算法,其实就是划分不同的区域,然后进行标记压缩算法:

① 将Old代划分成几个固定区域;

② mark阶段(多线程并行),标记可达对象;

③ summary阶段(串行执行),从最左边开始检验知道找到某个达到数值(可达对象密度小)的区域时,此区域及其右边区域进行压缩回收,其左端为密集区域

④ compact阶段(多线程并行),识别出需要装填的区域,多线程并行的把数据复制到这些区域中。经此过程后,Old代一端密集存在大量活动对象,另一端则存在大块空间。

4)并发标识—清理回收(CMS):对Young代处理采用与并行回收器完全一样的算法;只是对Old代采用了不同的算法,但归根待地还是标记清理算法:

① 初始标识(程序暂停):标记被直接引用的对象(一级对象);

② 并发标识(程序运行):通过一级对象寻找其他可达对象;

③ 再标记(程序暂停):多线程并行的重新标记之前可能因为并发而漏掉的对象(简单的说就是防遗漏)

④ 并发清理(程序运行)


4.内存管理小技巧

1)尽量使用直接量,eg:String javaStr = “小学徒的成长历程”;

2)使用StringBuilder和StringBuffer进行字符串连接等操作;

3)尽早释放无用对象;

4)尽量少使用静态变量;

5)缓存常用的对象:可以使用开源的开源缓存实现,eg:OSCache,Ehcache;

6)尽量不使用finalize()方法;

7)在必要的时候可以考虑使用软引用SoftReference。

你可能感兴趣的:(Java)