Java技术体系中所提倡的自动内存管理最终可以归结为自动化地解决了两个问题:
给对象分配内存JVM有自己的一套机制,而JVM在内存分配工作不能丝滑的进行时,会由垃圾收集器进行垃圾的清理和内存的回收。
大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC。
Minor GC和Full GC 有什么不同呢?
示例代码:
/**
* -Xms30M -Xmx30M -XX:+PrintGCDetails
**/
public static void main(String[] args) {
byte[] allocation1 = new byte[300 * 1024];
}
打印结果:
Heap
PSYoungGen total 9216K, used 2692K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
eden space 8192K, 32% used [0x00000007bf600000,0x00000007bf8a13a0,0x00000007bfe00000)
from space 1024K, 0% used [0x00000007bff00000,0x00000007bff00000,0x00000007c0000000)
to space 1024K, 0% used [0x00000007bfe00000,0x00000007bfe00000,0x00000007bff00000)
ParOldGen total 20480K, used 0K [0x00000007be200000, 0x00000007bf600000, 0x00000007bf600000)
object space 20480K, 0% used [0x00000007be200000,0x00000007be200000,0x00000007bf600000)
Metaspace used 3073K, capacity 4496K, committed 4864K, reserved 1056768K
class space used 337K, capacity 388K, committed 512K, reserved 1048576K
我们给堆分配了最多30M的空间,按照新生代占1/3,老年代占2/3,新生代中Eden:From Survivor:To Survivor为8:1:1,则Eden区内存空间为8M。
可以看到只有Eden区被占用了2692K,其中300K是给对象分配内存占用的空间。
声明一下即使程序什么也不做,新生代也会使用至少几M的内存,这里的2392K就是系统初始化消耗的内存。
大对象就是需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串以及数组。
大对象对虚拟机的内存分配来说就是一个坏消息,比遇到一个大对象更加坏的消息就是遇到一群朝生夕灭的短命大对象,写程序的时候应当避免。
虚拟机提供了一个-XX:PretenureSizeThreshold
参数,可以设置大对象的大小,如果对象超过设置的大小会直接进入老年代,不会进入年轻代。这样做的目的是避免在Eden区及两个Survivor区之间发生大量和频繁的内存复制。
-XX:PretenureSizeThreshold
参数只对Serial和ParNew两款收集器有效,Parallel Scavenge收集器不认识这个参数,Parallel Scavenge收集器一般并不需要设置。如果遇到必须使用此参数的场合,可以考虑ParNew加CMS的收集器组合。
示例代码:
/**
* -Xms30M -Xmx30M -XX:+PrintGCDetails
**/
public static void main(String[] args) {
byte[] allocation1 = new byte[10 * _1M];
}
打印结果:
Heap
PSYoungGen total 9216K, used 2392K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
eden space 8192K, 29% used [0x00000007bf600000,0x00000007bf856390,0x00000007bfe00000)
from space 1024K, 0% used [0x00000007bff00000,0x00000007bff00000,0x00000007c0000000)
to space 1024K, 0% used [0x00000007bfe00000,0x00000007bfe00000,0x00000007bff00000)
ParOldGen total 20480K, used 10240K [0x00000007be200000, 0x00000007bf600000, 0x00000007bf600000)
object space 20480K, 50% used [0x00000007be200000,0x00000007bec00010,0x00000007bf600000)
Metaspace used 3087K, capacity 4496K, committed 4864K, reserved 1056768K
class space used 339K, capacity 388K, committed 512K, reserved 1048576K
可以看到Eden区的2392K是程序初始化消耗的内存,对象的10M内存空间直接在老年代进行分配了,这就是大对象直接进入老年代。
对象过大是很危险的,如果新生代有空间进行分配,那么对象的复制也会让垃圾收集过程效率变得低下,所以JVM直接让其进入老年代,避免对大对象的复制。
虚拟机给每个对象定义了一个对象年龄(Age)计数器。如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并且对象年龄设为1。对象在Survivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁),就将会被晋升到老年代中。对象晋升老年代的年龄阈值,可以通过参数-XX:MaxTenuringThreshold
设置。
为了能更好地适应不同程序的内存状况,虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋升老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,此时年龄大于或等于该年龄的对象就可以直接进入老年代了,无须等到MaxTenuringThreshold
中要求的年龄。
这个规则其实是希望那些可能是长期存活的对象,尽早进入老年代。对象动态年龄判断机制一般是在Minor GC之后触发的。
这种情况会把存活的对象部分挪到老年代,部分可能还会放在Survivor区。
示例代码:
/**
* -Xms30M -Xmx30M -XX:+PrintGCDetails
**/
public static void main(String[] args) {
byte[] allocation1 = new byte[2 * _1M];
byte[] allocation2 = new byte[2 * _1M];
byte[] allocation3 = new byte[2 * _1M];
}
打印结果:
[GC (Allocation Failure) [PSYoungGen: 8185K->512K(9216K)] 8185K->6664K(29696K), 0.0055178 secs] [Times: user=0.01 sys=0.00, real=0.00 secs]
Heap
PSYoungGen total 9216K, used 701K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
eden space 8192K, 2% used [0x00000007bf600000,0x00000007bf62f6d8,0x00000007bfe00000)
from space 1024K, 50% used [0x00000007bfe00000,0x00000007bfe80000,0x00000007bff00000)
to space 1024K, 0% used [0x00000007bff00000,0x00000007bff00000,0x00000007c0000000)
ParOldGen total 20480K, used 6152K [0x00000007be200000, 0x00000007bf600000, 0x00000007bf600000)
object space 20480K, 30% used [0x00000007be200000,0x00000007be802030,0x00000007bf600000)
Metaspace used 3001K, capacity 4496K, committed 4864K, reserved 1056768K
class space used 328K, capacity 388K, committed 512K, reserved 1048576K
可以看到在新生代发生了一次Minor GC,并且因为From Survivor区没有足够的内存空间存储从Eden区复制过来的对象,所以From Survivor区只存储了一部分,还有一部分挪到了老年代。
在发生Minor GC之前,虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那么Minor GC可以确保是安全的。如果不成立,则虚拟机会查看HandlePromotionFailure
设置值是否允许担保失败。如果允许,那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试着进行一次MinorGC,尽管这次Minor GC是有风险的;如果小于或者HandlePromotionFailure
设置不允许冒险,那这时也要改为进行一次Full GC。
老年代要进行这样的担保,前提是老年代本身还有容纳这些对象的剩余空间,一共有多少对象会活下来在实际完成内存回收之前是无法明确知道的,所以只好取之前每一次回收晋升到老年代对象容量的平均大小值作为经验值,与老年代的剩余空间进行比较,决定是否进行Full GC来让老年代腾出更多空间。
如果Full GC完之后还是没有空间存放Minor GC之后的存活对象,则会发生OOM。
堆中几乎放着所有的对象实例,对堆进行垃圾回收前的第一步就是要判断哪些对象已经死亡(即不能再被任何途径使用的对象)。
给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。
优点:实现简单,判定效率也很高,在大部分情况下是一个不错的算法
缺点:无法解决对象之间循环引用的问题
这个算法的基本思路就是通过一系列称为GC Roots的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说,就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。
GC Roots根节点:线程栈的本地变量、静态变量、本地方法栈的变量等等
即使在可达性分析算法中不可达的对象,也并非是一定会被执行死刑的,这时候它们暂时处于缓刑阶段,要真正宣告一个对象死亡,至少要经历再次标记过程。
1.第一次标记并进行一次筛选
如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。
当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为没有必要执行。
任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行。
如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做F-Queue的队列之中,并在稍后由一个由虚拟机自动建立的、低优先级的Finalizer线程去执行它。
这里所谓的执行是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环(更极端的情况),将很可能会导致F-Queue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。
2.第二次小规模标记
finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己,只要重新与引用链上的任何一个对象建立关联即可(譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量),那在第二次标记时它将被移除出即将回收的集合;如果对象这时候还没有逃脱,那基本上它就真的被回收了。
方法区主要回收的是无用的类,那么如何判断一个类是无用的类的呢?
在JDK 1.2以前,Java中的引用的定义很传统:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。
我们希望能描述这样一类对象:当内存空间还足够时,则能保留在内存之中;如果内存空间在进行垃圾收集后还是非常紧张,则可以抛弃这些对象。
在JDK 1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)4种,这4种引用强度依次逐渐减弱。
强引用就是指在程序代码之中普遍存在的,类似 Object obj = new Object() 这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。
软引用是用来描述一些还有用但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。
在JDK 1.2之后,提供了SoftReference
类来实现软引用。
弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
在JDK 1.2之后,提供了WeakReference
类来实现弱引用。
虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
在JDK 1.2之后,提供了PhantomReference
类来实现虚引用。