垃圾收集器与内存分配策略

阅读更多

1、对象已死

 

堆中几乎存放着Java世界中所有的对象实例,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象有哪些还“存活”着,哪些已经“死去”(即不可能再被任何途径使用的对象)

 

1.1、引用计数算法

 

给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器都为0的对象就是不可能再被使用的。——实现简单,判定效率也很高。

 

Java语言中没有选用引用计数算法来管理内存,其中最主要的原因是它很难解决对象之间的相互循环引用的问题。

 

1.2、根搜索算法

 

在主流的商用程序语言中(Java 和 C#),都是使用根搜索算法(GC Roots Tracing)判定对象是否存活的。

 

基本思路:通过一系列的名为“GC Roots”的对象作为起点,从这些节点开始向下搜索,搜索所有走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。

 

在Java语言里,可作为GC Roots的对象包括下面几种:

 

  • 虚拟机栈(栈帧中的本地变量表)中的引用的对象。
  • 方法区中的类静态属性引用的对象。
  • 方法区中的常量引用的对象。
  • 本地方法栈中JNI(即一般说的Native方法)的引用的对象。

 

1.3、引用

 

在JDK1.2之前,Java中的引用的定义很传统:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。

 

在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Rhantom Reference)四种,这四种引用强度依次逐渐减弱。

 

  • 强引用是指程序代码之中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。
  • 软引用用来描述一些还有用,但并非必须的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中并进行第二次回收。如果这次回收还是没有足够的内存,才会抛出内存溢出异常。在JDK1.2之后,提供了SoftReference类来实现软引用。
  • 弱引用也是用来描述非必须对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK1.2之后,提供了WeakReference类来实现弱引用。
  • 虚引用也成为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有序引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是希望能在这个对象被收集器回收时收到一个系统通知。在JDK1.2之后,提供了一个PhantomReference类来实现虚引用。

 

1.4、生存还是死亡

 

在根搜索算法中不可达的对象,也并非是“非死不可”的,这时候他们暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行根搜索后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次删选,筛选的条件时此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。

 

如果这个对象被判定为有必要执行finalize方法,那么这个对象将会被放置在名为F-Queue的队列中,并在稍后由一条虚拟机自动建立的、低优先级的Finalizer线程去执行。这里所谓的“执行”是指虚拟机会出发这个方法,但并不承诺会等待它运行结束。这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环(更极端的情况),将很可能会导致F-Queue队列中的其他对象永久处于等待状态,甚至导致整个内存回收系统崩溃。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this关键字)赋值给某个类变量或对象的成员变量,那在第二次标记时它将被移除“即将回收”的集合;如果对象这时候还没有逃脱,那它就真的离死不远了。

 

任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,他的finalize()方法不会被再次执行。

 

1.5、回收方法区

 

永久代的垃圾收集主要回收两部分内容:废弃常量和无用的类。回收废弃常量与回收Java堆中的对象非常类似。

 

类需要同时满足下面3个条件才能算是“无用的类”:

 

  • 该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。
  • 加载该类的ClassLoader已经被回收。
  • 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

 

2、垃圾收集算法

 

2.1、标记——清除算法

 

最基础的收集算法是“标记—清除”(Mark-Sweep)算法,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。

 

之所以说它是最基础的收集算法,是因为后续的收集算法都是基于这种思路并对其缺点进行改进而得到的。它的主要缺点有两个:一个是效率问题,标记和清除过程效率都不高;另外一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致,当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前出发另一次垃圾收集动作。


垃圾收集器与内存分配策略_第1张图片
 

2.2、复制算法

 

为了解决效率问题,一种称为“复制”(Copying)的收集算法出现了,它将可用内存按照容量划分为大小相等的两块,每次只使用其中的一块。当这一块内存用完了,就将还存活着的独享复制到另外一块上面,然后再把已经使用过的内存空间一次清理掉。这样使得每次都是对其中的一块进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。只是这种算法的代价是将内存缩小为原来的一半,未免太高了一点。

 


垃圾收集器与内存分配策略_第2张图片
 

 

现在的商业虚拟机都采用复制算法来回收新生代。IBM的专门研究表明,新生代中的对象98%是朝生夕死的,所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块娇小的Survivor空间,每次使用Eden和其中的一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地拷贝到另外一块Survivor空间,最后清理掉Eden和刚才用过的Survivor的空间。HotSpot虚拟机默认Eden和Survivor的大小比例是8:1,即每次新生代中可用内存空间为整个新生代容量的90%,只有10%的内存是会被“浪费”的。当然,98%的对象可回收只是一般场景下的数据,我们没有办法保证每次回收都只有不多于10%的对象存活,当Survivor空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保(Handle Promotion)。

 

2.3、标记—整理算法

 

复制收集算法在对象存活率较高时就要执行较多的复制操作,效率会变低。老年代一般不能直接选用复制算法。

 

根据老年代的特点,有人提出了另外一种“标记—整理”(Mark-Compact)算法,标记过程仍然与“标记—清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界意外的内存。

 


垃圾收集器与内存分配策略_第3张图片
 

 

2.4、分代收集算法

 

当前商业虚拟机的垃圾手机都采用“分代收集”(Genaration Collection)算法,这种算法并没有什么新的思想,只是根据对象的存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记—清除”或“标记—整理”算法来进行回收。

 

3、垃圾收集器

 

如果说收集算法是内存回收的方法论,垃圾收集器就是内存回收的具体实现。直到现在为止还没有最好的收集器出现,更加没有万能的收集器,所以我们选择的只是对具体应用最合适的收集器。

 

 

 


垃圾收集器与内存分配策略_第4张图片
 

 

3.1、Serial收集器

 

Serial收集器是最基本、历史最悠久的收集器,曾经(在JDK1.3.1之前)是虚拟机新生代的唯一选择。这个收集器是一个单线程的收集器,但它的“单线程”的意义并不仅仅是说明它只会使用一个CPU或一条手机线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程(“Stop The World”),直到它收集结束。

 

到现在为止,它依然是虚拟机运行在Client模式下的默认新生代收集器。它有着由于其他收集起的地方:简单而高效,对于限定单个CPU的环境来说,Serial收集器由于没有现成交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。Serial收集器对于运行在Client模式下的虚拟机来说是一个很好的选择。

 

3.2、ParNew收集器

 

ParNew收集器其实就是Serial收集器的多线程版本,除了使用多条线程进行垃圾手机之外,其余行为包括Serial收集器可用的控制参数、收集算法、Stop The World、对象分配规则、回收策略等都与Serial收集器完全一样,实现上这两种收集器也共用了相当多的代码。

 

 ParNew收集器除了多线程收集之外,其他与Seral收集器相比并没有太多创新之处,但它却是许多运行在Server模式下的虚拟机中首选的新生代收集器,其中又一个与性能无关但很重要的原因是,除了Serial收集器外,目前只有它能与CMS收集器配合工作。

 

3.3、Parallel Scavenge收集器 

 

 Parallel Scavenge收集器也是一个新生代收集器,他也是使用复制算法的收集器,优势并行的多线程收集器。其特点是与其他收集器的关注点不同,CMS等收集器的关注点尽可能地缩短垃圾收集时用户线程的停顿时间,而Parallel Scavengen收集器的目标则是达到一个可控制的吞吐量(Throughput)。所谓吞吐量就是CPU用于运行用户代码的时间与与CPU总消耗时间的比值。经常被称为“吞吐量优先”收集器。

 

停顿时间越短就越适合需要与用户交互的程序,良好的响应速度能提升用户的体验;而高吞吐量则可以最高效率地利用CPU时间,尽快地完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。

 

 Parallel Scavengen收集器提供了两个参数用于精确控制吞吐量,分别是控制最大垃圾收集停顿时间的参数及直接设置吞吐量大小的参数。

 

3.4、Serial Old收集器

 

Seril Old是Serial收集器的老年代版本,它同样是一个单线程收集器,使用“标记—整理”算法。这个收集器的主要意义也是被Client模式下的虚拟机使用。如果在Server模式下,它主要还有两大用途:一个是在JDK1.5及之前的版本中与Parallel Scavengen收集器单配使用,另一个就是作为CMS收集器的后背预案,在并发收集发生Concurrent Mode Failure的时候使用。

 

3.5、Parallel Old收集器

 

Parallel Old是Parallel Scavenge收集器的老年代版本,使用多线程和“标记—整理”算法。这个收集器实在JDK1.6中才开始提供的,在此之前,新生代的Parallel Scavenge收集器一直处于比较尴尬的状态。直到Parallel Old收集器出现后,“吞吐量优先”收集器终于有了比较名不其实的应用组合,在注重吞吐量及CPU资源敏感的场合,都可以优先考虑Parallel Scavenge加Parallel Old收集器。

 

 3.6、CMS收集器

 

CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。是基于“标记—清除”算法实现的,它的运作过程相对于前面几种收集起来说要更复杂一些,整个过程分为4个步骤,包括:

 

  • 初始标记(CMS initial mark)——需要Stop The World。初始标记仅仅只是标记一下GC Roots能直接关联到的对象,速度很快。
  • 并发标记(CMS concurrent mark)——并发标记阶段就是进行GC Roots Tracing的过程。
  • 重新标记(CMS remark)——需要Stop The World。重新标记阶段则是为了修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短。
  • 并发清除(CMS concurrent sweep)

 

最主要优点:并发收集、低停顿。也被称为并发低停顿收集器(Concurrent Low Pause collector).

 

显著缺点

 

  • CMS收集器对CPU资源非常敏感。——默认启动的回收线程数是(CPU数量 + 3)/4,也就是当CPU在4个以上时,并发回收时垃圾收集线程最多占用不少于25%的CPU资源,并随着CPU数量的增加而下降。
  • CMS收集器无法处理浮动垃圾(Floating Garbage),可能出现“Concurrent Mode Failure”失败而导致领一次Full GC的产生。
  • 收集结束时会产生大量空间碎片。

 

3.7、G1收集器

 

G1(Garbage First)收集器是当前收集器技术发展的最前沿成果。与CMS收集器相比有两个显著的改进:以使G1收集器是基于“标记—整理”算法实现的收集器,也就是说它不会产生空间碎片,这对于长时间运行的应用系统来说非常重要。二是它可以非常精确地控制停顿,既能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾回收上的时间不得超过N毫秒。

 

G1收集器可以实现在基本不牺牲吞吐量的前提下完成低停顿的内存回收,这是由于他能够极力地避免全区域的垃圾收集,之前的收集器进行收集的范围都是整个新生代或者老年代,而G1将整个Java堆划分为多个大小固定的独立区域(Region),并且跟踪这些区域里面的垃圾堆积程度,在后台维护一个优先列表,每次根据允许的收集时间,优先回收垃圾最多的区域(这就是Garbage First名称的由来)。区域划分及有优先级的区域回收,保证了G1收集器在有限的时间内可以获得最高的收集效率。

 

3.8、垃圾收集器参数总结

 


垃圾收集器与内存分配策略_第5张图片
 

 

4、内存分配与回收策略

 

Java技术体系中所提倡的自动内存管理最终可以归结为自动化地解决了两个问题:给对象分配内存以及回收分配给对象的内存。

 

对象的内存分配,往大方向上讲,就是在堆上分配(但也可能经过JIT编译后背拆散为标量类型并间接地在栈上分配),对象主要分配在新生代的Eden区上,如果启动了本地线程分配缓冲,将按线程优先在TLAB上分配。上述情况下也可能会直接分配在老年代中,分配的规则并不是百分之百固定的,其细节取决于当前使用的是哪一种垃圾收集器组合,还有虚拟机中与内存相关的参数的设置。

 

接下来我们将会讲解几条最普遍的内存分配规则。

 

4.1、对象优先在Eden分配

 

大多数情况下,对象在新生代Eden区分配。当Eden区没有足够的空间进行分配时,虚拟机将发起一次Minor GC。

 

  • 新生代GC(Minor GC):指发生在新生代的垃圾收集动作,因为Java对象大多都具备朝生夕灭的特性,所以Minor GC非常频繁,一般回収速度也比较快。
  • 老年代GC(Major GC/Full GC):指发生在老年代的GC,出现了Major GC,经常会伴随至少一次的Minor GC(但非绝对的,在ParallelScavenge收集器的收集策略里就有直接进行Major GC的策略选择过程)。MajorGC的速度一般会比Minor GC慢10倍以上。

 

4.2、大对象直接进入老年代

 

所谓大对象就是指,需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串数组。虚拟机提供了一个 -XX:PretenureSizeThreshold参数,令大于这个设置值的对象直接在老年代中分配。这样做的目的是避免在Eden区及两个Survivor区之间发生大量地内存拷贝。ps:PretenureSizeThreshold参数只对 Serial 和 ParNew 两款收集器有效。

 

4.3、长期存活的对象将进入老年代

 

虚拟机给每个对象定义了一个对象年龄(Age)计数器。如果对象在Eden出生并经过第一次Minor GC后任然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并将对象年龄设为1。对象在Survivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁)时,就会被晋升到老年代中。对象晋升老年代的年龄阈值,可以 通过参数 -XX:MaxTenuringThreshold来设置。

 

4.4、动态对象年龄判定

 

 为了更好地适应不同程序的内存状况,虚拟机并不总是要求对象年龄必须达到MaxTenuringThreshold才能晋升老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无须等到MaxTenuringThreshold中要求的年龄。

 

4.5、空间分配担保

 

在发生Micro GC时,虚拟机会检测之前每次晋升到老年代的平均大小是否大于老年代的剩余空间大小,如果大于,则改为直接进行一次Full GC。如果小于,则查看 HandlePromotionFailure 设置是否允许担保失败;如果允许,那只会进行Minor GC;如果不允许,则也要改为进行一次 Full GC。

 

 

  • 垃圾收集器与内存分配策略_第6张图片
  • 大小: 41.7 KB
  • 垃圾收集器与内存分配策略_第7张图片
  • 大小: 57.4 KB
  • 垃圾收集器与内存分配策略_第8张图片
  • 大小: 59.9 KB
  • 垃圾收集器与内存分配策略_第9张图片
  • 大小: 46.6 KB
  • 垃圾收集器与内存分配策略_第10张图片
  • 大小: 119.2 KB
  • 查看图片附件

你可能感兴趣的:(虚拟机,垃圾手机,内存分配)