【第一篇】深入学习Java虚拟机之运行时数据区

Java虚拟机在执行Java程序的过程中,会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间
——摘自《深入理解Java虚拟机》第2版

根据Java虚拟机规范的规定,Java虚拟机会把所管理的内存划分为以下几个运行时数据区:程序计数器、堆、方法区、虚拟机栈、本地方法区,如下图所示:

Java虚拟机运行时数据区

程序计数器

占用一块较小的内存空间,可以看作是当前线程所执行的字节码的 行号指示器,字节码解释器工作时通过改变该计数器的值来选择下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖计数器来完成。

每条线程都拥有一个独立的的程序计数器,各线程之间的计数器互不影响,独立存储

这样的内存区域,我们称之为“线程私有”的内存,线程私有的内存区域,不会发生并发问题。

当线程在执行一个Java方法时,该计数器记录的是正在执行的虚拟机字节码指令的地址。

当线程在执行的是Native方法(调用本地操作系统方法)时,该计数器的值为空(Undefined)。

该内存区域是唯一一个在Java虚拟机规范中没有规定任何内存溢出(OutOfMemoryError)情况的区域。

Java虚拟机栈

与程序计数器一样,Java虚拟机栈也是 线程私有 的,它的生命周期与线程相同,即同生共死。

可能发生的两种异常:
StackOverflowError异常条件:线程请求的栈深度大于虚拟机所允许的深度
OutOfMemoryError异常条件:虚拟机栈可以动态扩展,但是扩展时无法申请到足够的内存

虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用开始到最后的结束,都对应着一个栈帧在虚拟机栈中入栈出栈的过程

虚拟机栈既然描述的是Java方法执行的内存模型,也就是说,虚拟机栈这块内存存储的内容是跟方法里的内容相关的。

比如现在有下面一个方法:

public static void main(String[] args) {for (int a = 0, len = 2018; a < len; a++) {System.out.println("a = " + a);}}

这个方法中的所有内容就是存储在栈帧中。栈帧又包含:局部变量表、操作数栈、动态链接、方法出口等信息。它们各自的职能如下:

1、局部变量表

顾名思义,局部变量表是一块存放了 编译期 可知的基本类型(byte、boolean 、char、short、int、float、long、double)、对象引用(reference类型,注意:不等同于对象本身)和returnAddress类型(它指向了一条字节码指令的地址)的内存空间。

编译期指的是,Java代码被编译成Class文件的过程。在这个过程中,就确定了所需分配的最大局部变量表的容量。该容量在方法运行期间不会改变大小。

说明:
64位的长度的long和dobule类型的数据会占用2个局部变量空间(slot,也称变量槽),其余的数据类型只占用1个局部变量空间。

如上面main方法,那么该局部变量表的大小如下:
数组类型(特殊的引用类型)的args 占用1个slot
for循环中的变量a 占用1个slot
for循环中的变量len 占用1个slot

可这样理解slot中存放的内容:
人由姓名和身体组成,姓名是它的变量,身体是它具体的数值,比如张三是一个80公斤的胖子,张三是变量名,80公斤是它的值,一起存在slot中

局部变量表的相关文档参考:

https://blog.csdn.net/qq_30739519/article/details/51043512
https://blog.csdn.net/keda8997110/article/details/19480769
https://blog.csdn.net/xixiaoming_A/article/details/52260137
https://blog.csdn.net/TuGeLe/article/details/78886522

虚拟机通过索引定位的方式使用局部变量表,索引值的范围是从0开始到局部变量表最大的Slot数量,对于32位数据类型的变量,索引n代表第n个Slot,对于64位的,索引n代表第n和第n+1两个Slot。
在方法执行时,虚拟机是使用局部变量表来完成参数值到参数变量列表的传递过程的,如果是实例方法(非static),则局部变量表中的第0位索引的Slot默认是用于传递方法所属对象实例的引用,在方法中可以通过关键字“this”来访问这个隐含的参数。其余参数则按照参数表的顺序来排列,占用从1开始的局部变量Slot,参数表分配完毕后,再根据方法体内部定义的变量顺序和作用域分配其余的Slot。
局部变量表中的Slot是可重用的,方法体中定义的变量,作用域并不一定会覆盖整个方法体,如果当前字节码PC计数器的值已经超过了某个变量的作用域,那么这个变量对应的Slot就可以交给其他变量使用。这样的设计不仅仅是为了节省空间,在某些情况下Slot的复用会直接影响到系统的而垃圾收集行为。
摘自如下文章:
https://blog.csdn.net/ns_code/article/details/17565503

2、操作数栈

操作数栈又常被称为操作栈,操作数栈的最大深度也是在编译的时候就确定了。32位数据类型所占的栈容量为1,64为数据类型所占的栈容量为2。当一个方法开始执行时,它的操作栈是空的,在方法的执行过程中,会有各种字节码指令(比如:加操作、赋值元算等)向操作栈中写入和提取内容,也就是入栈和出栈操作。

Java虚拟机的解释执行引擎称为“基于栈的执行引擎”,其中所指的“栈”就是操作数栈。因此我们也称Java虚拟机是基于栈的,这点不同于Android虚拟机,Android虚拟机是基于寄存器的。

基于栈的指令集最主要的优点是可移植性强,主要的缺点是执行速度相对会慢些;而由于寄存器由硬件直接提供,所以基于寄存器指令集最主要的优点是执行速度快,主要的缺点是可移植性差。
摘自如下文章:
https://blog.csdn.net/ns_code/article/details/17565503

3、动态连接

每个栈帧都包含一个指向运行时常量池(在方法区中,后面介绍)中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接。Class文件的常量池中存在有大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用为参数。这些符号引用,一部分会在类加载阶段或第一次使用的时候转化为直接引用(如final、static域等),称为静态解析,另一部分将在每一次的运行期间转化为直接引用,这部分称为动态连接。
摘自如下文章:
https://blog.csdn.net/ns_code/article/details/17565503

4、方法返回地址

当一个方法被执行后,有两种方式退出该方法:执行引擎遇到了任意一个方法返回的字节码指令或遇到了异常,并且该异常没有在方法体内得到处理。无论采用何种退出方式,在方法退出之后,都需要返回到方法被调用的位置,程序才能继续执行。方法返回时可能需要在栈帧中保存一些信息,用来帮助恢复它的上层方法的执行状态。一般来说,方法正常退出时,调用者的PC计数器的值就可以作为返回地址,栈帧中很可能保存了这个计数器值,而方法异常退出时,返回地址是要通过异常处理器来确定的,栈帧中一般不会保存这部分信息。

方法退出的过程实际上等同于把当前栈帧出站,因此退出时可能执行的操作有:恢复上层方法的局部变量表和操作数栈,如果有返回值,则把它压入调用者栈帧的操作数栈中,调整PC计数器的值以指向方法调用指令后面的一条指令。
摘自如下文章:
https://blog.csdn.net/ns_code/article/details/17565503

本地方法栈

与虚拟机栈所发挥的作用非常相似,区别是虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则为虚拟机使用到的本地Native方法服务。

可能发生的两种异常:
StackOverflowError异常条件:线程请求的栈深度大于虚拟机所允许的深度
OutOfMemoryError异常条件:虚拟机栈可以动态扩展,但是扩展时无法申请到足够的内存

Java堆

可能发生的异常:
OutOfMemoryError异常条件:堆中如果没有内存完成实例分配,并且堆无法再扩展

Java堆(Java Heap)是Java虚拟机所管理的内存中最大的一块,该区域被所有的线程共享,在虚拟机启动时创建。

该区域的唯一目的就是存放对象实例,在Java虚拟机规范中的描述是:所有的对象实例以及数组都要在堆上分配。

注意:

随着JIT编译器的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换优化技术将会导致一些微妙的变化发生,所有对象都分配在堆上也渐渐变得不是那么“绝对”了。
——摘自《深入理解Java虚拟机》第2版

解释:
我们可以这样理解堆上存储的内容,即,堆上存储了几乎所有的对象实例和数组,有可能对象以及数组不存在堆上。

Java Heap是垃圾收集器管理的主要区域,因此很多时候也被称为“GC堆”。

从内存回收的角度来看,由于现在的收集器基本都采用分代收集算法,所以Java堆中可以细分为:新生代和老年代;再细致一点,还可分为:Edgn空间、From Survivor空间、To Survivor空间。

从内存分配的角度来看,线程共享的Java堆中可能划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB)

根据Java虚拟机规范的规定,Java堆可以处在 物理上不连续 的内存空间中,只要逻辑上是连续的即可。

方法区

可能发生的异常:
OutOfMemoryError异常条件:当方法区无法满足内存分配需求时

与Java堆一样,方法区也是被各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

方法区域又被称为“永久代”,但这仅仅对于Sun HotSpot来讲,JRockit和IBM J9虚拟机中并不存在永久代的概念。

Java虚拟机规范把方法区描述为Java堆的一个逻辑部分,而且它和Java Heap一样不需要连续的内存,可以选择固定大小或可扩展,另外,虚拟机规范允许该区域可以选择不实现垃圾回收。

相对而言,垃圾收集行为在这个区域比较少出现。该区域的内存回收目标主要针是对废弃常量的和无用类的回收。

运行时常量池是方法区的一部分,Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Class文件常量池),用于存放编译器生成的各种字面量和符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。

运行时常量池相对于Class文件常量池的另一个重要特征是具备动态性,Java语言并不要求常量一定只能在编译期产生,也就是并非预置入Class文件中的常量池的内容才能进入方法区的运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用比较多的是String类的intern()方法。

直接内存

可能发生的异常:
OutOfMemoryError异常条件:动态扩展时无法得到有效分配,即无法动态扩展时

直接内存并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域,不受Java堆大小的限制,但是会受到本机总内存的大小及处理器寻址空间的限制。

总结:
Java的内存区域按照共享与否可以分为两大类:
① 线程私有内存区域,即,伴随线程而生,伴随线程而销毁:程序计数器、虚拟机栈、本地方法栈

②线程共享内存区域,即,多个线程进行空间共享的区域:堆和方法区

你可能感兴趣的:(【第一篇】深入学习Java虚拟机之运行时数据区)