Java虚拟机在执行Java程序的过程中会把它管理的内存划分为几个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有些区域则依赖用户线程的启动和结束而建立和销毁。
程序计数器是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要它来完成。
Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(多核处理器中的一个核)都只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,这类内存区域叫做“线程私有”的内存。
此内存区域是唯一一个Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
Java虚拟机栈也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。
每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
局部变量表:存放了编译器可知的各种基本数据类型(boolean、byte、char…)、对象引用(reference类型,它不同于对象本身,可能是指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)、returnAddress类型(指向了一条字节码指令的地址)。所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的。
在Java虚拟机规范中,对这个区域规定了两种异常状况:
本地方法栈与虚拟机栈所发挥的作用非常相似,区别在于虚拟机栈为虚拟机执行Java方法(字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务。
在虚拟机规范中对本地方法栈中方法使用的语言、使用方式与数据结构并没有强制规定,具体的虚拟机可以自由实现它,甚至有的虚拟机将此二者合二为一。也会抛出两种异常。
对于大多数应用来说,Java堆是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。(注意几乎二字,不做更深入的说明)
Java堆是垃圾收集器管理的主要区域,很多时候称为“GC堆”。从内存回收的角度看,现代收集器基本都采用分代收集算法,所以Java堆可以细分为:新生代和老年代。也有进一步的划分,为了更好的回收内存,后者更好的分配内存。
Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。如果在堆中没有内存完成实例分配,并且堆也无法扩展时,将会抛出OutOfMemoryError异常。
方法区与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。这区域的内存回收目标主要是针对常量池的回收和对类型的卸载。对类型的卸载,条件相当苛刻。当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。
运行时常量池:
是方法区的一部分,Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
以常用的虚拟机HotSpot和常用的内存区域Java堆为例,了解一下Java堆中对象分配、布局和访问的过程。
虚拟机遇到一条new指令时,首先将去检查这个指令的参数能否在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过了。如果没有要先执行相应的类加载过程。
类加载检查通过后,接下来虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定,为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。
内存分配完成后,虚拟机将分配到的内存空间都初始化为零值(不包括对象头)。接下来,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这写信息存放在对象的对象头当中。
在上面的工作完成后,从虚拟机的角度来看,一个新的对象已经完成。但是从Java程序的角度来看,对象创建才刚刚开始,init方法还没有执行,所有的字段都还为零。所以一般来说,执行new之后会接着执行**< init>方法**,把对象按照码农的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。
对象在内存中的布局可以分为3块区域:对象头、实例数据和对齐填充。
**对象头:**包括两部分信息:第一部分用于存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志…,对象头的另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。但是,查找对象的元数据信息并不一定要通过对象本身。
**实例数据:**是对象真正存储的有效信息,也是程序代码中所定义的各种类型的字段内容。无论是从父类继承下来的,还是在子类中定义的,都需要记录下来。相同宽度的字段总是被分配到一起。
**对齐填充:**仅仅起着占位符的作用,对象的大小必须是8字节的整数倍。
Java程序通过栈上的reference数据来操作堆上的具体对象。由于reference类型在Java虚拟机规范中只规定了一个指向对象的引用,并没有定义这个引用应该通过何种方式去定位、访问堆中的对象的具体位置,所以对象访问的方式也是取决于VM来实现的。
句柄: Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。
直接指针: Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址。好处在于速度快,少了一次指针定位的时间开销,HotSpot就是采用这种方式的。
这篇总结来源于《深入理解Java虚拟机》一书,更多详细的信息可以参考此书!