运行时数据区域
Java虚拟机在执行 Java 程序的过程中会把它管理的内存划分为若干个不同的数据区域。根据《Java 虚拟机规范》将 Java虚拟机所管理的内存分为以下几个运行时数据区域:
● 程序计数器
● Java虚拟机栈
● 本地方法栈
● Java堆
● 方法区
程序计数器
程序计数器 ,也称作 PC寄存器或者指令地址寄存器。在汇编语言中,它保存的是程序当前执行的指令的地址(或者说是保存一条),当CPU需要执行指令时,需要从程序计数器中得到当前需要执行的指令所在存储单元的地址,然后根据得到的地址获取指令,在得到指令之后,程序计数器便自动加1或者根据转移指针得到下一条指令的地址,如此循环,直至执行完所有的指令。
在JVM中,程序计数器是一块较小的内存空间,它可以看做是当前线程所执行的字节码的行号指示器,字节码解释器工作时就是通过改变这个计数器的值来选取下一跳需要执行的字节码指令。
由于Java 虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时间,一个处理器(对于多核处理器来说是一个内核)都只会执行一条线程中的指令。因此,为了线程切换后能够恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,这是 "线程私有的"。
如果线程正在执行的是一个 Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是 Native方法,计数器值为空,此内存区域是唯一一个在 Java虚拟机规范中没有规定任何 OutOfMemoryError 情况的区域。
Java虚拟机栈
Java虚拟机栈也是线程私有的,它的生命周期与线程相同,它描述的是 Java 方法执行的内存模型: 每个方法在执行的同时都会创建一个栈帧( Stack Frame)用于存储局部变量表,操作数栈,动态链接,方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。至于关于栈帧的具体介绍后续文章再分析。
因为除了栈帧的出栈和入栈之外,Java虚拟机栈不会再受其他因素的影响,所以 栈帧可以在系统的堆中分配(注意,是系统的Heap而不是Java 堆)
JVM保留了两个内存区:Java 堆和本机(或系统堆)。这个堆具有不同的用途,并使用不同的机制进行维护,Java堆就是我下面要将的包含对象实例的"堆",而系统的堆使用操作系统的底层malloc和 free机制进行分配,且用于底层实施特定的Java对象。
Java虚拟机栈所使用的内存不需要保证是连续的。
Java虚拟机栈可能发生如下异常情况:
● 如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常
● 如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都可以动态扩展,只不过Java虚拟机规范中也允许固定长度的虚拟机栈),如果扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。
注意: Java虚拟机栈就是栈,也可以成为"堆栈",只是堆栈这种说法容易让人混淆。关于Java虚拟机的堆,栈,堆栈如何去理解这类问题,JVM专家R大也在知乎上对其进行了详细的解答,传送门: https://www.zhihu.com/question/29833675/answer/82661572。
本地方法栈
本地方法栈(Native Method Stack)与虚拟机栈所发挥的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行 Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的是 Native方法服务。在虚拟机规范中对本地方法栈中方法使用的语言,使用方法与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。
看到这个本地方法栈,总是对本地方法有些疑惑,下面简单说下Native Method:
什么是 Native Method?
一个Natvie Method就是一个Java调用非Java代码的接口,它由非Java语言实现,比如C语言。
在定义一个 Native Method时,并不提供实现体(有些像定义一个 Java Interface),因为其实现体是由非Java语言在外面实现的,比如:
public class IHaveNatives
{
native public void Native1( int x ) ;
native static public long Native2() ;
native synchronized private float Native3( Object o ) ;
native void Native4( int[] ary ) throws Exception ;
}
native方法可以返回任何 Java类型,也能够实现异常控制。
为什么使用Native Method?
Java对一些层次的任务用 Java实现不容易,对某些程序效率不高:
● Java与Java外的环境交互:
Java与一些底层系统如操作系统或某些硬件交换信息,native方法提供一个非常简洁的接口,无需了解Java应用之外的细节。
● 与操作系统交互
通过使用本地方法让 Java实现 JRE与底层系统的交互
● Sun'Java
Sun的解释器是用 C实现的,JRE 大部分用 Java实现,其通过一些本地方法与外界交互
所以对于本地方法栈来说,它本质是为本地方法服务的,如果某个虚拟机实现的本地方法接口是使用 C连接模型的话,那么它的本地方法栈就是 C栈。下图展示了一个Java栈和本地方法栈之间的跳转,(图片摘自网络):
Java堆
对于大多数应用来说,Java 堆(Java Heap)是Java 虚拟机所管理的内存中最大的一块。Java 堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。
Java堆是垃圾收集器管理的主要区域,因此很多时候也被称作为 "GC堆"。从内存回收的角度看,由于现在收集器基本采用分代收集算法,(关于垃圾算法的介绍后续文章分析),所以 Java 堆中还可以细分为: 新生代和老年代,再细致一点有 Eden空间,From Survivor空间,To Survivor 空间等。
根据 Java 虚拟机规范的规定, Java 堆可以处于物理不连续的内存空间中,只要逻辑是连续的即可,就像我们的磁盘空间一样。在实现时,即可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的 (通过 -Xmx 和 -Xms 控制)。
如果堆上没有内存完成实例分配,并且 堆也无法再扩展时,将会抛出 OutOfMemoryError异常。
JVM中堆和栈的区别
这里简单说说JVM中堆和栈的区别:
● 功能不同
● 栈内存用来存储局部变量,操作数栈等信息
● 堆内存用来存储Java中的对象
● 共享性不同
● 栈内存是线程私有的
● 堆内存是所有线程共有的
● 空间大小
● 栈的空间大小远远小于堆的
● 异常错误不同
● 栈有两种异常情况,如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常,如果虚拟机栈动态扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。
● 堆一般在堆中没有内存完成实例分配,并且堆也无法进行扩展时,抛出OutOfMemoryError异常。
方法区
方法区(Method Area) 与 Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为 堆的一个逻辑部分,但是它有一个别名叫做 "非堆"。
对于HotSpot虚拟机来讲,方法区域又被称为 "永久代",本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把 GC 分代收集扩展至方法区,或者说使用 永久代来实现方法区而已,这样的HotSpot的垃圾收集器可以像 管理 Java堆一样管理这部分内存,能够省去专门为方法区编写内存管理代码的工作。对于其他虚拟机(如 BEA JRockit,IBM J9等)来说是不存在永久代的概念的。
在JDK 1.7及以前的HotSpot JVM中,方法区位于永久代(Permanent Generation,PermGen) 中。如下图,是JDK 1.7及以前的 Java堆内存的结构图,里面包含了 Permanent Generation:
由于 永久代内可能发生内存泄漏或溢出的问题(永久代有 -XX:MaxPermSize的上限)而导致的 java.lang.OutOfMemoryError: PermGen space,JEP小组从JDK 1.7 开始就筹划移除永久代,并且在 JDK 1.7 中把字符串常量,符号引用等移除了永久代。到了Java 8 ,永久代被彻底地移除了 JVM,取而代之的是元空间 (Metaspace):
JDK 8开始将类的元数据放到本地堆内存(native heap)中,这一块区域就叫 Metaspace,关于 Metaspace 的介绍请参考:https://link.juejin.im/?target=https%3A%2F%2Fjava-latte.blogspot.com%2F2014%2F03%2Fmetaspace-in-java-8.html
运行时常量池
前面讲 方法区的时候就提到,运行时常量池是方法区的一部分,它是 class文件中每一个类或接口的常量池表的运行时表示形式。它包括了若干种不同的常量,常量池表存放 编译器生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
运行时常量池具有动态性,运行期间也可以将新的量放到运行时常量池中,典型的应用是 String 类的 intern方法:
public native String intern()
String类的 intern方法会从字符串常量池中查询当前字符串是否存在,如果存在,就会直接返回当前字符串,若不存在就会将当前字符串放入常量池中,再返回。关于String.intern()更为详尽的分析,请参阅文章:https://tech.meituan.com/in_depth_understanding_string_intern.html
而从JDK 1.7开始,字符串常量和符号引用等被移除永久代:
● 符号引用迁移至系统堆内存 (Native Heap)
● 字符串字面量迁移至 Java堆(Java Heap)
小结
以上的分析参考了《深入理解Java虚拟机》这本书,同时也参考了很多优秀的文章。在此过程中,我们要注意JDK版本变化带来的问题,比如在 JDK 8版本中,永久代被彻底移除了。
当上面提到一个JVM的巨牛级别的人物——R大,R大是国内JVM巨牛级人物,他的回答都是非常权威的,所以学习 JVM的知识可以多参考 R大的分析。目前本人对 JVM也是一枚渣渣级选手,现在输出对JVM的一些学习笔记。如有错误之处,欢迎指出。
原文发布时间为:2018-09-4
本文作者:pjmike_pj
本文来自云栖社区合作伙伴“ Java架构沉思录”,了解相关信息可以关注“Java架构沉思录”。