那些内存需要回收?

什么时候回收?

如何回收?



    在程序运行时,何时会触发垃圾回收?


一、内存分配与回收策略


    java技术体系中所提倡的自动内存管理最终可以归结自动解决两个问题: 给对象分配内存回收分配给对象的内存。我们下面一起讨论给对象分配内存的那点事。

    对象的内存分配,往大方向上讲,就是在堆上分配对象主要分配在新生代的Eden区,如果启动了本地线程分配缓冲,将按照线程优先在TLAB上分配。少数情况下也可能直接分配在老年代中。分配的规则并不是百分百固定的,七夕节取决于当前使用的是哪一种垃圾收集器组合,还有虚拟机中与内存相关的参数设置。


1. 对象优先在Eden分配

    大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC


 2. 大对象直接进入老年代

    所谓的大对象是指,需要大量连续内存空间的java对象,最典型的的大对象就是那种很长的字符串以及数组。经常出现大对象容易导致内存还有不少空间时就提前触发垃圾收集以获取足够的连续空间来安置它们。

    虚拟机提供了一个-XX:PretenureSizeThreshold参数,令大于这个设置值的对象直接在老年代分配。这样的目的是避免在Eden区及两个survivor区之间发生大量的内存复制。


 3. 长期存活的对象将进入老年代

     既然虚拟机采用了分代收集的思想来管理内存,那么内存回收时就必须能识别那些对象应放在新生代,那些对象应放在老年代中。为了做到这一点,虚拟机给每个对象定义了一个对象年龄计数器。如果对象在Eden出生经过第一次Minor GC后仍然存活,并且能被Servivor容纳的话,将被移动到Servivor空间中,并且对象年龄设置为1。对象在Servivor区中每熬过一次Minor GC年龄就增加1岁,当它的年龄增加到一定程度(默认15岁)就将会被晋升到老年代中。对象晋升老年代的年龄阈值:-XX:MaxTenuringThreshold设置。


 4. 动态对象年龄判断

     为了更好的适应不同程序的内存情况,虚拟机并不是永远的要求对象的年龄必须达到了MaxTenuringshold才能晋升老年代,如果在servivor空间中相同年龄所有对象大小的总和大于servivor空间的一半年龄大于或等于该年龄的对象就可以直接进入老年代,无须等到MaxTenuringThreshold中要求的年龄。


 5. 空间分配担保

        在发生Minor GC之前,虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果条件成立,那么Minor GC可以确保是安全的。

如果不成立,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败

        如果允许,那么会检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小

            如果大于,将尝试进行一次Minor GC

            如果小于,或者HandlePromotionFailure设置不允许冒险,那这是要改为进行一次Full GC    



    

    垃圾收集器在对堆进行回收前,第一件事就是确定这些对象之中那些还活着,那些已经死?



二、可达性分析算法

      在主流的商用程序语言的主流实现中,都是通过可达性分析(reachability Analusis)来判断对象是否存活。这个算法的基本思路:通过一系列的成为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链时,则证明此对象是不可用的。


   

在Java语言中,可作为GC Roots的对象包括下面几种:

·虚拟机栈(栈帧中的本地变量表)中引用的变量

·方法区中类静态属性引用的对象

·方法区中常量引用的对象

·本地方法栈中native引用的对象


  判断对象是否存活都与引用有关。在JDK1.2以前,java中引用的定义很传统:如果reference类型的数据中存储的数值代表另外一块内存的起始地址,就称这块内存代表着一个引用。在jdk1.2之后,java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)软引用(Soft Reference)弱引用(Weak  Reference)虚引用(Phantom Reference)



    对于已经判断是不可用对象,如何进行清理。


三、垃圾收集算法


1. 标记-清除(Mark-Sweep)算法

   

    最基础的收集算法是“标记-清除”算法,算法分为“标记”和“清除”两个阶段:首先标记出所有要回收的对象,在标记完成后统一回收所有被标记的对象。它主要不足有两点:一个是效率问题。标记和清除两个过程的效率都不高;另一个是空间问题,标记清除之后会产生大量的不连续的内存碎片,空间碎片太多可能会导致以后程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

2. 复制算法

      为了解决效率问题,一种称为“复制(copying)”的收集算法出现了,它将可用内存容量划分为大小相等的两块每次只使用其中一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动栈顶的指针,按顺序分配内存即可。这种算法的代价是将内存缩小为原来的一半。


      现在的商业虚拟机都是采用复制算法来回收新生代,新生代中的对象98%是朝生夕死。将内存划分为一块较大的Eden空间和两个较小的Servivor空间每次使用Eden和其中一块Servivor。当回收时,将Eden和Servivor中还存活的对象一次性复制到另外一块Servivor空间上,最后清理掉Eden和刚才使用过的Servivor空间。HotSpot虚拟机默认Eden和Servivor的大小比例是8:1,也就是说每次新生代中可用的内存空间为整个新生代容量的90%,只有10%的内存会被浪费。当Servivor空间没有足够空间存放上一次新生代收集下来的存活对象时,这些对象直接通过分配担保机制进入老年代


3. 标记-整理(Mark-Compact)算法

    根据老年代的特点,有人提出来“标记-整理”算法,先标记所有要回收的对象,然后让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存

    

4. 分带收集算法

    当前商业虚拟机的垃圾收集都是采用“分代收集(Generational Collection)算法”。根据对象存活周期的不同将内存划分为几块。一般把java堆分为新生代和老年代,可以根据各个年代的特点采用最合适的收集算法。

·新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,选择复制算法,只需要付出少量存活对象的复制成本就可以完成收集。

·老生代中,对象存活率高、没有额外的空间对它进行分配担保,就必须使用“标记-清理”或者“标记-整理”算法来进行回收。