垃圾回收和内存分配相关,先了解运行时数据区域的划分及各个区域的作用。
垃圾回收主要需要考虑的3个问题:
1、什么时候回收;
2、哪些对象需要回收;
3、如何回收。
程序计数器是一块较小的内存空间,它是当前线程执行字节码的行号指示器,字节码解释工作器就是通过改变这个计数器的值来选取下一条需要执行的指令。它是线程私有的内存,也是唯一一个没有OOM异常的区域。
也就是通常所说的栈区,它描述的是Java方法执行的内存模型,每个方法被执行的时候都创建一个栈帧(Stack Frame),用于存储局部变量表、操作数栈、动态链接、方法出口等。每个方法被调用到完成,相当于一个栈帧在虚拟机栈中从入栈到出栈的过程。此区域也是线程私有的内存,可能抛出两种异常:
本地方法栈与虚拟机栈发挥的作用非常相似,区别就是虚拟机栈为虚拟机执行Java方法,本地方法栈则是为虚拟机使用到的Native方法服务。
所有对象实例和数组都在堆区上分配,堆区是GC主要管理的区域。堆区还可以细分为新生代、老年代,新生代还分为一个Eden区和两个Survivor区。此块内存为所有线程共享区域,当堆中没有足够内存完成实例分配时会抛出OOM异常。
方法区也是所有线程共享区,用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。GC在这个区域很少出现,这个区域内存回收的目标主要是对常量池的回收和类型的卸载,回收的内存比较少,所以也有称这个区域为永久代(Permanent Generation)的。当方法区无法满足内存分配时抛出OOM异常。运行时常量池是方法区的一部分,用于存放编译期生成的各种字面量和符号引用。
给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1 ;当引用失效时,计数器值就减1 ;任何时刻计数器都为0 的对象就是不可能再被使用的。引用计数算法(Reference Counting)的实现简单,判定效率也很高,在大部分情况下它都是一个不错的算法,但是Java 语言中没有选用引用计数算法来管理内存,其中最主要的原因是它很难解决对象之间的相互循环引用的问题。
这个算法的基本思路就是通过一系列的名为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots 没有任何引用链相连(用图论的话来说就是从GC Roots 到这个对象不可达)时,则证明此对象是不可用的。在Java 语言里,可作为GC Roots 的对象包括下面几种:
GC经常发生的区域是堆区,堆区还可以细分为新生代、老年代,新生代还分为一个Eden区和两个Survivor区。
A.对象优先在Eden中分配,当Eden中没有足够空间时,虚拟机将发生一次Minor GC,Minor GC非常频繁,而且速度也很快;
B.Full GC,发生在老年代的GC,当老年代没有足够的空间时即发生Full GC,发生Full GC一般都会有一次Minor GC。
C.发生Minor GC时,虚拟机会检测之前每次晋升到老年代的平均大小是否大于老年代的剩余空间大小,如果大于,则进行一次Full GC,如果小于,则查看是否允许担保失败,如果允许,那只会进行一次Minor GC,如果不允许,则改为进行一次Full GC。
先看看常用的垃圾回收算法。
缺点:标记、清除的效率都很低;标记清除后导致不连续空间。
优点:存活率低时高效,回收后空间连续。
缺点:内存分成大小相同的两块,资源浪费。存活率高的情况下复制的对象多,效率低。
HotSpot内存分配:Eden :Survivor:Survivor = 8:1:1。每次只有10%的内存是可能被浪费的。
根据对象的存活周期将内存分为新生代和老年代。
新生代中的对象都是朝生夕死的对象,老年代中的对象相对比较稳定。
新生代和老年代采用不同的收集算法。新生代的特点对象存活率很低(复制算法);老年代的特点对象存活率高,没有额外的空间进行分配担保(标记整理算法)。
A.大对象。
B.每次Eden进行MinorGC后对象年龄加1进入survivor,对象年龄达到15时进入老年代。
C.如果Survivor空间中相同年龄所有对象大小的总和大于survivor空间的一半,年龄大于等于该年龄的对象就直接进入老年代。
D.如果survivor空间不能容纳Eden中存活的对象。由于担保机制会进入老年代。如果survivor中的对象存活很多,担保失败,那么会进行一次Full GC。
总结:本文参考《深入理解java虚拟机》进行总结,如有不妥之处请读者批评教导。