jvm内存分配结构与垃圾回收算法

java语言作为高级语言,最主依赖之一就算是内存的自动分配和回收的功能了。
不像c语言那样,需要程序员自己去主动的,申请和释放内存,增加了语言的使用门槛。

jvm内存分配结构
内存分配结构
程序计数器:

程序计数器,是线程私有的一块内存区域(每个线程独立维护),它是当前线程所执行的字节码的行号指示器,记录着正在执行的虚拟机字节码指令地址。
类加载器在加载好字节码class文件后,需要解释器去解释,字节码解释器就是通过程序计数器的值,获取下一条字节码指令地址。
如果线程正在执行一个java方法,这个线程的程序计数器就记录着,正在执行的虚拟字节码指令地址。

栈:

跟数据结构中学到的栈作用类似。用于存储方法的入栈出栈,局部变量表等信息
栈是线程私有的,每个线程在执行一个方式的时候,都会创建一个栈帧,里边存储着方法执行所需要的局部变量表,方法入栈出栈等信息。

局部变量表存储的变量,包括八种基本类型,和对象的引用
其中long和double占了两个局部变量空间(slot),其余的占一个。
局部变量表所需要的内存,在编译期时就已经确定,运行期间不会改变局部变量表的大小。

java虚拟机规范里定义了两个种异常。当栈空间不足时(jvm中每个线程的栈空间设置参数-Xss),报**stackOverflowError,jvm支持动态扩展,当设置动态扩展时,如果动态扩展申请不到内存时,报OutOfMemoryError异常

本地方法栈

本地方法栈跟栈功能结构是一样的。
只是栈(又称虚拟机栈),是给java方法使用的。
本地方法栈是作用于native方法的。

提起HotSpot VM,相信所有Java程序员都知道,它是Sun JDK和OpenJDK中所带的虚拟机,也是目前使用范围最广的Java虚拟机。

方法区

方法区(method area)只是JVM规范中定义的一个概念,用于存储类信息、常量池、静态变量、JIT编译后的代码等数据。
不同的jvm厂商对其实现不同,选择把上述数据放到不同的位置实现。
是线程共有的。

而永久代是Hotspot虚拟机特有的概念,是方法区的一种实现,别的JVM都没有这个东西。
在Java 6中,方法区中包含的数据,除了JIT编译生成的代码存放在native memory区域,其他都存放在永久代;
在Java 7中,
常量池”如果说的是runtime constant pool,这个还是在PermGen里;
“常量池”如果说的是SymbolTable / StringTable,这俩table自身原本就一直在native memory里,是它们所引用的东西在哪里更有意思。上面说了,7是把SymbolTable引用的Symbol移动到了native memory,而StringTable引用的java.lang.String实例则从PermGen移动到了普通Java heap。
在Java 8中,永久代被彻底移除,取而代之的是另一块与堆不相连的本地内存——元空间(Metaspace),‑XX:MaxPermSize 参数失去了意义,取而代之的是-XX:MaxMetaspaceSize。

看上边引用的一段话里,感觉HotSpot vm就是在一步步,去掉永久代这个概念。1.6使用这个概念去实现方法区规范,可能是为了,方便这部分区域的内存管理。
之后想去掉,是为了优化,淡化这个容易混淆的概念。

在1.8版本的jvm里,再也不会又--MaxPermSize参数了。也不会又perm OutOfMemory,取而代之的是另外的参数和概念。

Java虚拟机管理的内存中最大的一块。
所有线程共享的一块区域。此区域唯一的目的就是存放对象的实例
我们知道垃圾回收是基于分代回收的。为了更好的回收,堆又分为新生代,老年代。
新生代又分为eden区,from survivor区,to survivor区。这些本质上都是存放java对象实例,只是为了更优化的垃圾回收。

直接内存

直接内存不是虚拟机运行时的一部分,但是java中有使用到的地方,使用不当,会导致OutOfMemory。
在NIO中,引入了一种基于通道(channel)和缓冲区(buffer)的I/O方式,它可以使用Native函数库的直接分配堆外内存。这样能在一些场景中显著提高性能。因为避免了来回复制,也就是说所谓的“零拷贝”

垃圾的回收主要是针对堆内存。那么如何判断哪些对象可以回收,算法是什么?

对象回收的判断

内存回收条件的判断:
当一个对象或者变量(内存),没有被引用,就可以被回收了。

引用计数算法

基于这个思路,一个比较古老的方法是,使用计数器,一个对象初始化时,计数器是0,每增加一个引用时,计数器加1,每减少一个引用时,计数器减1。当一个对象的计数器为0时,就可以回收这个对象了。
这种方法很高效,也有很多语言在使用这种方法。但是,这个方法有个缺点,没法解决循环引用的问题。即A对象里的变量引用了B,B对象里的变量引用了A。这个时候,其实,两个对象并没有被实际使用,但是却回收不了。

可达性分析算法

判断一个对象,是否能从任意某根结点gc root找到。
如何确定gc root 。以下四种属于根结点:

  • 虚拟机栈中的引用对象
  • 方法区中类静态属性引用的对象
  • 方法区中常量引用对象
  • 本地方法栈中JNI引用对象

知道了哪些对象可以被回收,来看下都是有哪些回收的算法。以及jvm使用的是哪个垃圾回收算法。

垃圾回收算法
标记-清除算法

把内存区域所有该回收的对象,标记下。回收
缺点:就是会造成很多不连续的内存空间。当有大些的对象时,使用不上。造成浪费。

复制算法

复制算法,把一块内存区域分成两份,每次回收其中一块区域,把存活的对象,顺序对齐的移到另一块区域。这样,回收的区域,就完全是对齐的。
优点:弥补了标记回收算法的缺陷
缺点:浪费,只有50%在工作

标记-清理算法

跟标记-回收算法类似。只是,在标记后,并没有清除,而是整理到了头或尾,对齐了内存。
优点:没有浪费空间。对于每次需要清理的对象,比较少时,比较合适。(所以老年代使用的此方法)

上述算法各有优缺点,实际jvm的垃圾回收算法,是上述算法的混合使用,因为java的应用程序,在创建使用对象时,多数对象可能使用完,立刻就不用了(朝建夕亡),而有些对象存活的时间很长(长时间的被使用)。IBM有个研究表明98%的对象是朝建夕亡。垃圾回收的算法是根据上述情况设计的。

分代回收算法

把内存区域分为年轻代,和老年代的概念。
年轻代,由于存活时间短,很快多数就会被回收掉,所以选择复制算法。减少垃圾碎片。
而老年代,由于存活时间比较长,而且每次清理的对象,可能比较少。所以选择标记-整理算法。

问题:
1.young gc(minor gc)个full gc的触发条件是怎样的?
Minor GC触发条件:当Eden区满时,触发Minor GC。
Full GC触发条件:
(1)调用System.gc时,系统建议执行Full GC,但是不必然执行
(2)老年代空间不足
(3)方法区空间不足
(4)通过Minor GC后进入老年代的平均大小大于老年代的可用内存
(5)由Eden区、From Space区向To Space区复制时,对象大小大于To Space可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小

  1. 分代回收的过程是怎样?
    知道了,jvm是使用的分代回收算法。看下具体内存分配策略。
    年轻代,又分为eden区和2个survivor区,默认比例是8:1:1。
  2. 正常对象初始化,在eden区分配内存。eden区的内存满了。就进行一个minor gc,会把eden区和from survivor区的存活的对象,转移到to survivor中,并对存活的对象标记经历次数。
  3. 交换两个survivor的作用地位,重复1的动作,把存活次数超过一个数字(可指定)的对象转移到老年代中。
  4. 老年代的内存空间,超过某个阀值(可指定);或者剩余的空间,不足一次minor gc后往老年代转移的对象平均内存大小;或者因为初始化一个大对象,年轻代放不下,直接申请到了老年代,老年代剩余空间也不足。则会进行一次full gc。
    full gc中,老年代的回收是用标记-整理算法。

参考《深入理解java虚拟机》周志明著
http://blog.csdn.net/yhyr_ycy/article/details/52566105

你可能感兴趣的:(jvm内存分配结构与垃圾回收算法)