JVM虚拟机学习笔记(一)Java内存划分

前言

学习一门编程语言有必要去了解其底层的工作原理,这个系列对JVM学习过程中的一些笔记(主要来自周志明的深入理解Java虚拟机)

JVM虚拟机学习笔记(一)Java内存划分_第1张图片
Java技术体系

java虚拟机运行时数据区域

JVM虚拟机学习笔记(一)Java内存划分_第2张图片
jvm体系结构

程序计数器 (Program Counter Register)

程序计数器是一块较小的内存空间,它可以看成是当前线程所执行的字节码的行号指器。在虚拟机的概念模型里(这里仅指概念模型,不同的虚拟机可能会有更高效的实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支 循环 跳转 异常理 线程恢复等基础功能都需要依赖这个计数器来完成.

由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)都只会执行一条线程中的指令。因此,为了线程切换后恢复到正确的行位置,每条线程都需要有一个独立的程序计数器,各线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存.

如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行虚拟机字节码指令的地址,如果正在执行是Native方法,这个计数器值则为空(Undefined)。此内存区域是唯一一个在JVM规范中没有规定任何OutOfMemoryError情况的区域.

Java虚拟机栈 (Java Virtual Machine Stacks)

人们通常会把Java内存区域简单地分为堆内存(Heap)和栈内存(Stack),这并不严谨,实际的内存划分远比这复杂。这样分类仅仅是更容易的讲述Java内存中比较常用的模块,其中栈就是指的虚拟机栈中的局部变量表部分。

Java虚拟机栈是线程私有, 它的生命周期与线程相同. 虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表,操作数栈,动态链接, 方法返回地址等信息。栈帧随着方法调用而创建,随着方法结束而销毁——无论方法是正常完成还是异常完成(抛出了在方法内未被捕获的异常)都算作方法结束。每一个方法从调用直至执行完成的过程,就对应一个帧栈在虚拟机栈中入栈到出栈的过程.

  • 局部变量表(Local Variables)
    局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double),对象引用(reference),和returnAddress类型(指向了一条字节码指令的地址)。其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用一个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。

  • 操作数栈(Operand stack)
    每一个栈帧内部都包含一个称为操作数栈(Operand Stack)的后进先出(Last-In-First-Out,LIFO)栈。栈帧中操作数栈的长度由编译期决定。
    操作数栈所属的栈帧在刚刚被创建的时候,操作数栈是空的。Java 虚拟机提供一些字节码指令来从局部变量表或者对象实例的字段中复制常量或变量值到操作数栈中,也提供了一些指令用于从操作数栈取走数据、操作数据和把操作结果重新入栈。在方法调用的时候,操作数栈也用来准备调用方法的参数以及接收方法返回结果。

  • 动态链接(Dynamic Linking)
    每个栈帧都有一个运行时常量池的引用。这个引用指向栈帧当前运行方法所在类的常量池。通过这个引用支持动态链接(dynamic linking)。
    C/C++ 代码一般被编译成对象文件,然后多个对象文件被链接到一起产生可执行文件或者 dll。在链接阶段,每个对象文件的符号引用被替换成了最终执行文件的相对偏移内存地址。在 Java中,链接阶段是运行时动态完成的。
    当 Java 类文件编译时,所有变量和方法的引用都被当做符号引用存储在这个类的常量池中。符号引用是一个逻辑引用,实际上并不指向物理内存地址。JVM 可以选择符号引用解析的时机,一种是当类文件加载并校验通过后,这种解析方式被称为饥饿方式。另外一种是符号引用在第一次使用的时候被解析,这种解析方式称为惰性方式。无论如何 ,JVM 必须要在第一次使用符号引用时完成解析并抛出可能发生的解析错误。绑定是将对象域、方法、类的符号引用替换为直接引用的过程。绑定只会发生一次。一旦绑定,符号引用会被完全替换。如果一个类的符号引用还没有被解析,那么就会载入这个类。每个直接引用都被存储为相对于存储结构(与运行时变量或方法的位置相关联的)偏移量。

  • 方法返回地址
    当执行遇到返回指令,会将返回值传递给上层的方法调用者,这种退出的方式称为正常完成出口(Normal Method Invocation Completion),一般来说,调用者的PC计数器可以作为返回地址。
    当执行遇到异常,并且当前方法体内没有得到处理,就会导致方法退出,此时是没有返回值的,称为异常完成出口(Abrupt Method Invocation Completion),返回地址要通过异常处理器表来确定。
    Java虚拟机栈规定了两种异常状况: 如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;如果虚拟机可以动态扩展,如果扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。

本地方法栈 (Native Method Stack)

本地方法栈与Java虚拟机栈所发挥的作用非常相似,只不过本地方法栈为虚拟机使用到的Native方法服务;在虚拟机规范中对本地方法栈中方法使用的语言,使用方法和数据结构并没有强制规定,具体的虚拟机可以自由实现,甚至有的虚拟机(比如HotSpot)直接就把Java虚拟机栈和本地方法栈合二为一,本地方法栈也会抛出StackOverflowError和OutOfMemoryError异常。

Java堆 (Java Heap)

Java堆是Java虚拟机所管理的内存中最大的一块,是被所有线程共享的内存区域,此内存区域的唯一目的就是存放实例对象,几乎所有的对象实例都在这里分配内存,JVM规范描述:所有的对象实例以及数组都要在堆上分配,但随着JIT编译器的发展和逃逸分析技术的成熟,所有对象实例在堆上分配也渐渐变得不是那么“”绝对”了。

Java堆是垃圾收集管理的主要区域,也被称为GC堆(Garbage Collected Heap),Java堆可以细分为:新生代和老年代,新生代可以细分为:Eden空间,From Survivor空间,To Survivor空间等。从内存分配的角度来看,线程共享的堆中可能划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer, TLAB),但是无论怎样划分,都与存放内容无关,无论哪个区域,存储的仍然是对象实例,划分的目的只是为了更好的回收内存,或者更好的分配内存。Java堆会抛出OutOfMemoryError异常。

方法区 (Method Area)

方法区是各个线程共享的内存区域,用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。JVM规范把方法区描述为堆的一个逻辑部分,但方法区有一个别名叫做非堆(No-Heap),目的是与Java堆区分开来。虚拟机规范描述,方法区可以选择不实现垃圾收集,相对而言,垃圾回收在这个区域很少出现。这个区域内存回收目标主要是针对常量池的回收和对类型的卸载。当方法区无法满足内存分配需求时,将抛出OutOfMeoryError异常。

运行时常量池 (Runtime Constant Pool)

运行时常量池是方法区的一部分,Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。运行时常量池相对于Class文件常量池的另一个特性就是动态性,Java并不要求常量只能在编译期产生,运行期间也可以将新的常量放入池中,我们熟知的String类的intern()方法就体现了这个特性。当常量池无法申请到内存时, 也会抛出OutOfMemoryError异常。

直接内存(Direct Memory)

直接内存并不是虚拟机运行时数据区的一部分,也不是规范中定义的内存区域。在JDK1.4新加入了NIO(New Input/Output)类,引入一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内, 然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样在一些场景中显著提高性能,因此避免了在Java堆和Native堆中来回复制数据。这部分被频繁使用,也可能导致OutOfMemoryError异常出现。

你可能感兴趣的:(JVM虚拟机学习笔记(一)Java内存划分)