根据《Java虚拟机规范》的规定,运行时数据区通常包括这几个部分:程序计数器(Program Counter Register)、虚拟机栈(VM Stack)、本地方法栈(Native Method Stack)、方法区(Method Area)、堆(Heap)。其中,程序计数器、虚拟机栈和本地方法栈是线程私有的,方法区和堆是线程共有的。如下图所示:
一、程序计数器(Program Counter Register)
程序计数器可以看作是 当前线程所执行的字节码的行号指示器,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码。
多线程是通过线程轮流切换来获得CPU执行时间的,因此,在任一具体时刻,一个CPU的内核只会执行一条线程中的指令。因此,为了能够使得每个线程都在线程切换后能够恢复在切换之前的程序执行位置,每个线程都需要有自己独立的程序计数器,互不影响,为 线程私有 的。
如果线程执行的是Java方法,则程序计数器中保存的是当前需要执行的虚拟机字节码指令的地址;如果线程执行的是native方法,则程序计数器中的值是undefined。
二、Java虚拟机栈(VM Stack)
Java虚拟机栈也是 线程私有 的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法 在执行的同时都会创建一个 栈帧(Stack Frame),用于存储 局部变量表、操作数栈、动态链接、方法出口等信息。每个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
程序员主要关注的 栈内存,就是虚拟机栈中 局部变量表 部分。局部变量表存放了编译器可知的各种 基本数据类型(boolean、byte、char、short、int、float、long、double),对象引用(reference)。局部变量表所需的内存空间在 编译期间 完成分配,当进入一个方法时,这个方法需要在栈中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
三、本地方法栈(Native Method Stack)
本地方法栈和虚拟机栈是类似的,同样是 线程私有,作用也是类似的。不同的地方在于,虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则为虚拟机使用到的 Native方法 服务。甚至有的虚拟机(如HotSpot)直接把本地方法栈和虚拟机栈合二为一了。
四、Java堆(Heap)
Java堆是被所有线程 共享 的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例。JVM规范中描述:所有的对象实例以及数组都要在堆上分配。
Java堆是垃圾收集器管理的主要区域,因为也被称为 “GC堆”。从内存回收的角度来看,由于现代收集器基本都采用分代收集算法,所以Java堆还可以细分为:新生代 和 老年代。
从内存分配的角度来看,线程共享的Java堆可能划分出 多个线程私有 的分配缓冲区(Thread Local Allocation Buffer, TLAB)。
五、方法区(Method Area)
方法区与Java堆一样,是各个 线程共享 的内存区域,它用于存储已被虚拟机加载的类信息(Class)、常量(final)、静态变量(static)、即时编译器编译后的代码等数据。
在HotSpot中方法区常常被成为 “永久代”,垃圾收集行为在这个区域比较少出现,这个区域的内存回收目标主要是针对 常量池 的回收和对 类型 的卸载。
六、运行时常量池(Runtime Constant Pool) --> 方法区的一部分
运行时常量池是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种 字面量 和 符号引用 ,这部分内容将在类加载后进入方法区的运行时常量池中存放。
运行时常量池相对于CLass文件常量池的另外一个重要特征是具备 动态性,Java语言并不要求常量一定只有编译期才能产生,也就是并非预置入CLass文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用比较多的就是 String类的intern()方法。
七、直接内存(Direct Memory)
直接内存并不是虚拟机运行时数据区的一部分,在JDK1.4中加入了NIO,引入基于通道(channel)与缓冲区(Buffer) I/O方式,它可以使用Native函数库直接分配堆外内存。也就是说通过这种方式,不会在运行时数据区域分配内存,这样就避免了在运行时数据区域来回复制数据,直接调用外部内存,在一些场景中显著提高性能。==>了解一下Netty
HotSpot对象探秘
一、对象的创建
1.当虚拟机遇到一条new指令的时候,首先将去检查这个指定的参数是否能在 常量池 中定位到这个类的符号引用,并且检查这个符号引用代表的类是否已被 加载、解析和初始化 过。
2.如果类加载检查通过后,虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可以完全确定。==> Q:如何确定
两种分配方式:
- 指针碰撞(Bump the Pointer): 内存是规整的,空闲内存在一端,不空闲的内存在一端,中间有一个指针作为分界点的指示器。分配内存就是简单地往空闲空间挪动一段与对象大小相等的距离。
- 空闲列表(Free List): 内存是不规整的,虚拟机需要维护一个列表,记录哪些内存块是可用的,在分配的时候在列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。
内存分配的线程安全性:
- 同步分配内存: 对分配内存空间的动作进行同步处理————实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性。
- TLAB: 把内存分配动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为 本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。
3.内存分配完成后,虚拟机需要将分配到的内存空间都初始化为 零值(不包括对象头),这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用。
4.虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息(Class)、对象的哈希码、对象的GC分代年龄(新生代Eden,Survisor,老年代)等信息。这些信息存放在对象的 对象头 (Object Header)中。
5.执行new指令之后会接着执行
方法(构造方法),把对象按照程序员的意愿进行初始化。
二、对象的内存布局
对象在内存中存储的布局可以分为三块区域:对象头(Header),实例数据(Instance Data) 和 对齐填充(Padding)。
对象头
包括两个部分,第一部分用于存储自身运行时的数据例如GC标志位,MonirGC次数,哈希码,锁状态,哪个线程可以拥有等被称为MarkWord(标记字)。第二部分是类型指针,即对象指向它的类元数据(位于方法区)的指针。
实例数据
是对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。无论是从父类继承下来的,还是在子类中定义的( 是否会导致数据冗余)
对齐填充
并不是必要的,也没有特别含义,仅仅起着占位符的作用。
三:对象的访问定位
建立对象是为了使用对象,我们的Java程序需要通过栈上(虚拟机栈)的reference数据来操作堆上的具体对象。目前reference主流的实现有 句柄 和 直接指针 两种,其中HotSpot使用直接指针。
句柄
如果使用句柄,那么java堆中将会划分出一部分内存作为 句柄池,reference
中存储的是对象的句柄地址,而句柄包含对象实例数据(堆)与类型数据(方法区)各自的具体地址信息。
直接指针
reference
引用直接指向堆中的对象实例,对象实例的对象头存放对象类型指针。
区别
使用句柄访问的最大好处就是reference
中存储的是稳定的句柄地址,在对象被移动时(GC中很频繁)只会改变句柄中的实例数据地址,而reference
本身不需要修改。使用直接指针访问最大的好处就是 速度更快 ,它节省了一次指针定位的时间开销。
参考资料
深入理解Java虚拟机