JVM内存管理、JVM垃圾回收机制、新生代、老年代以及永久代

如果大家想深入的了解JVM,可以读读周志明《深入理解Java虚拟机:JVM高级特性与最佳实践》

     需要掌握的东西,包括以下内容、判断对象存活还是死亡的算法(引用计数算法、可达性分析算法)、常见的垃圾收集算法(复制算法、分代收集算法等以及这些算法适用于什么代)以及常见的垃圾收集器的特点(这些收集器适用于什么年代的内存收集)。

     

     JVM运行时数据区由程序计数器、堆、虚拟机栈、本地方法栈、方法区部分组成,结构图如下所示。

     JVM内存结构由程序计数器、堆、栈、本地方法栈、方法区等部分组成,结构图如下所示:

                 JVM内存管理、JVM垃圾回收机制、新生代、老年代以及永久代_第1张图片


   1)程序计数器

   几乎不占有内存。用于取下一条执行的指令。

   2)堆

   所有通过new创建的对象的内存都在堆中分配,其大小可以通过-Xmx和-Xms来控制。堆被划分为新生代和旧生

代,新生代又被进一步划分为Eden和Survivor区,最后Survivor由FromSpace和ToSpace组成,结构图如下所示:

    新生代。新建的对象都是用新生代分配内存,Eden空间不足的时候,会把存活的对象转移到Survivor中,新生代

大小可以由-Xmn来控制,也可以用-XX:SurvivorRatio来控制Eden和Survivor的比例旧生代。用于存放新生代中经过

多次垃圾回收仍然存活的对象。

                 

   3)栈

   每个线程执行每个方法的时候都会在栈中申请一个栈帧,每个栈帧包括局部变量区和操作数栈,用于存放此次方

法调用过程中的临时变量、参数和中间结果。

   4)本地方法栈

   用于支持native方法的执行,存储了每个native方法调用的状态

   5)方法区

   存放了要加载的类信息、静态变量、final类型的常量、属性和方法信息。JVM用永久代(PermanetGeneration)

来存放方法区,(在JDK的HotSpot虚拟机中,可以认为方法区就是永久代,但是在其他类型的虚拟机中,没有永久代

的概念,有关信息可以看周志明的书)可通过-XX:PermSize和-XX:MaxPermSize来指定最小值和最大值。


   JVM垃圾回收机制

   JVM分别对新生代和旧生代采用不同的垃圾回收机制

新生代的GC:

新生代通常存活时间较短,因此基于复制算法来进行回收,所谓复制算法就是扫描出存活的对象,并复制到一块新的完全未使用的空间中,对应于新生代,就是在Eden和其中一个Survivor,复制到另一个之间Survivor空间中,然后清理掉原来就是在Eden和其中一个Survivor中的对象。新生代采用空闲指针的方式来控制GC触发,指针保持最后一个分配的对象在新生代区间的位置,当有新的对象要分配内存时,用于检查空间是否足够,不够就触发GC。当连续分配对象时,对象会逐渐从eden到 survivor,最后到老年代。

用javavisualVM来查看,能明显观察到新生代满了后,会把对象转移到旧生代,然后清空继续装载,当旧生代也满了后,就会报outofmemory的异常。


在执行机制上JVM提供了串行GC(SerialGC)、并行回收GC(ParallelScavenge)和并行GC(ParNew)

1)串行GC

在整个扫描和复制过程采用单线程的方式来进行,适用于单CPU、新生代空间较小及对暂停时间要求不是非常高的应用上,是client级别默认的GC方式,可以通过-XX:+UseSerialGC来强制指定

2)并行回收GC

在整个扫描和复制过程采用多线程的方式来进行,适用于多CPU、对暂停时间要求较短的应用上,是server级别默认采用的GC方式,可用-XX:+UseParallelGC来强制指定,用-XX:ParallelGCThreads=4来指定线程数

3)并行GC

与旧生代的并发GC配合使用

旧生代的GC:

旧生代与新生代不同,对象存活的时间比较长,比较稳定,因此采用标记(Mark)算法来进行回收,所谓标记就是扫描出存活的对象,然后再进行回收未被标记的对象,回收后对用空出的空间要么进行合并,要么标记出来便于下次进行分配,总之就是要减少内存碎片带来的效率损耗。在执行机制上JVM提供了串行 GC(SerialMSC)、并行GC(parallelMSC)和并发GC(CMS),具体算法细节还有待进一步深入研究。



Java GC、新生代、老年代

   Java 中的堆是 JVM 所管理的最大的一块内存空间,主要用于存放各种类的实例对象。

   在 Java 中,堆被划分成两个不同的区域:新生代 ( Young )、老年代 ( Old )。新生代 ( Young ) 又被划分为

三个区域:Eden、From Survivor、To Survivor。

   这样划分的目的是为了使 JVM 能够更好的管理堆内存中的对象,包括内存的分配以及回收。

   堆的内存模型大致为:

     

    从图中可以看出: 堆大小 = 新生代 + 老年代。其中,堆的大小可以通过参数 –Xms、-Xmx 来指定。


   (本人使用的是 JDK1.6,以下涉及的 JVM 默认值均以该版本为准。)
   默认的,新生代 ( Young ) 与老年代 ( Old ) 的比例的值为 1:2 该值可以通过参数 –XX:NewRatio 来指定

 ),即:新生代 ( Young ) = 1/3 的堆空间大小。老年代 ( Old ) = 2/3 的堆空间大小。其中,新生代 ( Young )

 被细分为 Eden 和 两个 Survivor 区域,这两个 Survivor 区域分别被命名为 from 和 to,以示区分。


    默认的,Edem : from : to = 8 :1 : 1 可以通过参数–XX:SurvivorRatio 来设定 ),即: Eden = 8/10 的

新生代空间大小,from = to = 1/10 的新生代空间大小。


    JVM 每次只会使用 Eden 和其中的一块 Survivor 区域来为对象服务,所以无论什么时候,总是有一块Survivor

 区域是空闲着的。

    因此,新生代实际可用的内存空间为 9/10 ( 即90% )的新生代空间。

GC 堆                                                                                  

    Java 中的堆也是 GC 收集垃圾的主要区域。GC 分为两种:Minor GC、FullGC ( 或称为 Major GC )。

    Minor GC 是发生在新生代中的垃圾收集动作,所采用的是复制算法

    新生代几乎是所有 Java 对象出生的地方,即 Java 对象申请的内存以及存放都是在这个地方。Java 中的大部

分对象通常不需长久存活,具有朝生夕灭的性质。

    当一个对象被判定为 "死亡" 的时候,GC 就有责任来回收掉这部分对象的内存空间。新生代是 GC 收集垃圾的

频繁区域。

   当对象在 Eden ( 包括一个 Survivor 区域,这里假设是 from 区域 ) 出生后,在经过一次 Minor GC 后,如

果对象还存活,并且能够被另外一块 Survivor 区域所容纳上面已经假设为 from 区域,这里应为 to 区域,

即 to 区域有足够的内存空间来存储 Eden 和 from 区域中存活的对象 ),则使用复制算法将这些仍然还存活的对

象复制到另外一块 Survivor 区域 ( 即 to 区域 ) 中,然后清理所使用过的 Eden 以及 Survivor 区域 ( 即

from 区域 ),并且将这些对象的年龄设置为1,以后对象在 Survivor 区每熬过一次 Minor GC,就将对象的年

龄 + 1,当对象的年龄达到某个值时 ( 默认是 15 岁,可以通过参数 -XX:MaxTenuringThreshold 来设定

 ),这些对象就会成为老年代。

   但这也不是一定的,对于一些较大的对象 ( 即需要分配一块较大的连续内存空间 ) 则是直接进入到老年代


   Full GC 发生在老年代的垃圾收集动作,所采用的是标记-清除算法

   现实的生活中,老年代的人通常会比新生代的人"早死"。堆内存中的老年代(Old)不同于这个,老年代里面的对象

几乎个个都是在 Survivor 区域中熬过来的,它们是不会那么容易就 "死掉" 了的。因此,Full GC 发生的次数不

会有 Minor GC 那么频繁,并且做一次 Full GC 要比进行一次 Minor GC 的时间更长。


   另外,标记-清除算法收集垃圾的时候会产生许多的内存碎片 即不连续的内存空间 ),此后需要为较大的对象

分配内存空间时,若无法找到足够的连续的内存空间,就会提前触发一次 GC 的收集动作。


GC 日志                                                                               

    publicstaticvoid main(String[] args) {    Object obj new Object();   System.gc();   System.out.println();    obj =new Object();   obj new Object();    System.gc();    System.out.println();}

   设置 JVM 参数为 -XX:+PrintGCDetails,使得控制台能够显示 GC 相关的日志信息,执行上面代码,下面是其中

一次执行的结果。

   Full GC 信息与 Minor GC 的信息是相似的,这里就不一个一个的画出来了。

   从 Full GC 信息可知,新生代可用的内存大小约为 18M,则新生代实际分配得到的内存空间约为 20M(为什么是

 20M? 请继续看下面...)。老年代分得的内存大小约为 42M,堆的可用内存的大小约为 60M。可以计算出: 18432K

 ( 新生代可用空间 ) + 42112K ( 老年代空间 ) = 60544K ( 堆的可用空间 )


    新生代约占堆大小的 1/3,老年代约占堆大小的 2/3。也可以看出,GC 对新生代的回收比较乐观,而对老年代

以及方法区的回收并不明显或者说不及新生代。

    并且在这里 Full GC 耗时是 Minor GC 的 22.89 倍。

JVM 参数选项                                                                        


    jvm 可配置的参数选项可以参考 Oracle 官方网站给出的相关信息:          http://www.oracle.com/technetwork/java/javase/tech/vmoptions-jsp-140102.html


    下面只列举其中的几个常用和容易掌握的配置选项

-Xms

初始堆大小。如:-Xms256m

-Xmx

最大堆大小。如:-Xmx512m

-Xmn

新生代大小。通常为 Xmx 的 1/3 或 1/4。新生代 = Eden + 2 个 Survivor 空间。实际可用空间为 = Eden + 1 个 Survivor,即 90% 

-Xss

JDK1.5+ 每个线程堆栈大小为 1M,一般来说如果栈不是很深的话, 1M 是绝对够用了的。

-XX:NewRatio

新生代与老年代的比例,如 –XX:NewRatio=2,则新生代占整个堆空间的1/3,老年代占2/3

-XX:SurvivorRatio

新生代中 Eden 与 Survivor 的比值。默认值为 8。即 Eden 占新生代空间的 8/10,另外两个 Survivor 各占 1/10 

-XX:PermSize

永久代(方法区)的初始大小

-XX:MaxPermSize

永久代(方法区)的最大值

-XX:+PrintGCDetails

打印 GC 信息

-XX:+HeapDumpOnOutOfMemoryError

让虚拟机在发生内存溢出时 Dump 出当前的内存堆转储快照,以便分析用


  1 /** 2  -Xms60m 3  -Xmx60m 4 -Xmn20m 5  -XX:NewRatio=2 ( 若 Xms = Xmx, 并且设定了 Xmn, 那么该项配置就不需要配置了 ) 6  -XX:SurvivorRatio=8 7  -XX:PermSize=30m 8  -XX:MaxPermSize=30m 9  -XX:+PrintGCDetails10  */11 publicstaticvoid main(String[] args) {12    new Test().doTest();13 }14 15 publicvoid doTest(){16     Integer M = newInteger(1024 * 1024 * 1);  //单位, 兆(M)17     byte[] bytes = newbyte[1 * M]; //申请1M 大小的内存空间18     bytes = null;  //断开引用链19    System.gc();   //通知 GC 收集垃圾20    System.out.println();21     bytes =newbyte[1 * M];  //重新申请1M 大小的内存空间22     bytes = newbyte[1 * M];  //再次申请1M 大小的内存空间23    System.gc();24    System.out.println();25 }

     按上面代码中注释的信息设定 jvm 相关的参数项,并执行程序,下面是一次执行完成控制台打印的结果:

[ GC [ PSYoungGen:  1351K -> 288K (18432K) ]  1351K -> 288K (59392K), 0.0012389 secs]  [ Times: user=0.00 sys=0.00, real=0.00 secs ] [ Full GC (System)  [ PSYoungGen: 288K -> 0K (18432K)]  [ PSOldGen:  0K -> 160K (40960K) ]  288K -> 160K (59392K)  [ PSPermGen: 2942K -> 2942K (30720K) ], 0.0057649 secs ] [ Times: user=0.00  sys=0.00,  real=0.01 secs ] [ GC [ PSYoungGen:  2703K -> 1056K (18432K) ] 2863K -> 1216K(59392K), 0.0008206 secs ]  [ Times:user=0.00 sys=0.00, real=0.00 secs] [ Full GC (System)  [ PSYoungGen:  1056K -> 0K (18432K) ] [ PSOldGen:  160K -> 1184K(40960K) ]  1216K -> 1184K(59392K)  [ PSPermGen:  2951K -> 2951K (30720K) ], 0.0052445 secs]  [ Times: user=0.02 sys=0.00, real=0.01 secs ] Heap PSYoungGen      total 18432K, used 327K [0x00000000fec00000, 0x0000000100000000,0x0000000100000000)  eden space 16384K, 2% used[0x00000000fec00000,0x00000000fec51f58,0x00000000ffc00000)  fromspace 2048K, 0% used[0x00000000ffe00000,0x00000000ffe00000,0x0000000100000000) to   space 2048K, 0% used[0x00000000ffc00000,0x00000000ffc00000,0x00000000ffe00000) PSOldGen        total 40960K, used 1184K [0x00000000fc400000, 0x00000000fec00000,0x00000000fec00000)  object space 40960K, 2% used[0x00000000fc400000,0x00000000fc5281f8,0x00000000fec00000) PSPermGen       total 30720K, used 2959K [0x00000000fa600000, 0x00000000fc400000,0x00000000fc400000)  object space 30720K, 9% used [0x00000000fa600000,0x00000000fa8e3ce0,0x00000000fc400000)

  从打印结果可以看出,堆中新生代的内存空间为18432K ( 约 18M ),eden 的内存空间为 16384K ( 约 16M),

from/ to survivor 的内存空间为 2048K ( 约2M)。


    这里所配置的 Xmn 为 20M,也就是指定了新生代的内存空间为 20M,可是从打印的堆信息来看,新生代怎么就

只有 18M 呢? 另外的 2M 哪里去了? 别急,是这样的。新生代 = eden + from + to = 16 + 2 + 2 = 20M,可见新

生代的内存空间确实是按 Xmn 参数分配得到的。而且这里指定了 SurvivorRatio = 8,因此,eden = 8/10 的新生

代空间 = 8/10 * 20 = 16M。from = to = 1/10 的新生代空间 = 1/10 * 20 = 2M。


    堆信息中新生代的 total 18432K 是这样来的:eden + 1 个 survivor = 16384K + 2048K = 18432K,即约为 18M。

   因为 jvm 每次只是用新生代中的 eden 和 一个 survivor,因此新生代实际的可用内存空间大小为所指定的

 90%。

   因此可以知道,这里新生代的内存空间指的是新生代可用的总的内存空间,而不是指整个新生代的空间大小。

   另外,可以看出老年代的内存空间为 40960K ( 约 40M),堆大小 = 新生代 + 老年代。因此在这里,老年代 =

 堆大小 - 新生代 = 60 -20 = 40M。

   最后,这里还指定了 PermSize = 30m,PermGen即永久代 ( 方法区 ),它还有一个名字,叫非堆,主要用来存储

由 jvm 加载的类文件信息、常量、静态变量等。

   回到 doTest() 方法中,可以看到代码在第 17、21、22 这三行中分别申请了一块 1M大小的内存空间,并在 19

 和 23 这两行中分别显式的调用了 System.gc()。从控制台打印的信息来看,每次调 System.gc(),是先进行

 Minor GC,然后再进行 Full GC。


第 19 行触发的 Minor GC 收集分析:


   从信息 PSYoungGen : 1351K -> 288K,可以知道,在第 17 行为bytes 分配的内存空间已经被回收完成。

引起 GC 回收这 1M 内存空间的因素是第 18 行的 bytes = null;   bytes 为 null 表明之前申请的那 1M 大小的

内存空间现在已经没有任何引用变量在使用它了,并且在内存中它处于一种不可到达状态 ( 即没有任何引用链与 GC

 Roots 相连 )。那么,当 Minor GC 发生的时候,GC 就会来回收掉这部分的内存空间。


第 行触发的 Full GC 收集分析:

   在 Minor GC 的时候,信息显示 PSYoungGen :  1351K -> 288K,再看看Full GC 中显示的 PSYoungGen :  288K

 -> 0K,可以看出,Full GC 后,新生代的内存使用变成0K 了,那么这 288K 到底哪去了 ? 难道都被GC 当成垃圾

回收掉了 ? 当然不是了。我还特意在 main 方法中 new 了一个 Test 类的实例,这里的 Test 类的实例属于小对

象,它应该被分配到新生代内存当中,现在还在调用这个实例的doTest 方法呢,GC 不可能在这个时候来回收它的。


   接着往下看 Full GC 的信息,会发现一个很有趣的现象,PSOldGen: 0K  -> 160K,可以看到,Full GC 后,老

年代的内存使用从 0K 变成了 160K,想必你已经猜到大概是怎么回事了。当 Full GC 进行的时候,默认的方式是尽

量清空新生代 ( YoungGen ),因此在调 System.gc() 时,新生代 ( YoungGen ) 中存活的对象会提前进入老年代。


第  行触发的 Minor GC 收集分析:

    从信息 PSYoungGen : 2703K -> 1056K,可以知道,在第 21 行创建的,大小为 1M 的数组被 GC 回收了。在第

22 行创建的,大小也为 1M 的数组由于 bytes 引用变量还在引用它,因此,它暂时未被 GC 回收。 


第23行触发的 Full GC 收集分析:

   在 Minor GC 的时候,信息显示 PSYoungGen :  2703K -> 1056K,FullGC 中显示的 PSYoungGen :  1056K ->

 0K,以及 PSOldGen:  160K -> 1184K,可以知道,新生代 (YoungGen ) 中存活的对象又提前进入老年代了。


你可能感兴趣的:(java)