【JVM从入门到实战】(七)运行时数据区的组成

【JVM从入门到实战】(七)运行时数据区的组成_第1张图片

运行时数据区:
Java虚拟机在运行Java程序过程中管理的内存区域,称之为运行时数据区。
《Java虚拟机规范》中规定了每一部分的作用

线程不共享:程序计数器、虚拟机栈、本地方法栈
线程共享:方法区,堆

1. 程序计数器(Program Counter Register)

程序计数器也叫PC寄存器,每个线程会通过程序计数器记录当前要执行的的字节码指令的地址。在加载阶段,虚拟机将字节码文件中的指令读取到内存之后,会将原文件中的偏移量转换成内存地址。每一条字节码指令都会拥有一个内存地址。

在代码执行过程中,程序计数器会记录下一行字节码指令的地址。执行完当前指令之后,虚拟机的执行引擎根据程序计数器执行下一行指令。

程序计数器可以控制程序指令的进行,实现分支、跳转、异常等逻辑。

在多线程执行情况下,Java虚拟机需要通过程序计数器记录CPU切换前解释执行到那一句指令并继续解释运行。

程序计数器在运行中会出现内存溢出吗?
内存溢出指的是程序在使用某一块内存区域时,存放的数据需要占用的内存大小超过了虚拟机能提供的内存上限。
因为每个线程只存储一个固定长度的内存地址,程序计数器是不会发生内存溢出的。
程序员无需对程序计数器做任何处理。

2. Java虚拟机栈(Java Virtual Machine Stack)

Java虚拟机栈(Java Virtual Machine Stack)采用栈的数据结构来管理方法调用中的基本数据,先进后出(First In Last Out),每一个方法的调用使用一个栈帧(Stack Frame)来保存
【JVM从入门到实战】(七)运行时数据区的组成_第2张图片


可以通过idea来查看线程的栈帧情况
【JVM从入门到实战】(七)运行时数据区的组成_第3张图片

Java虚拟机栈随着线程的创建而创建,而回收则会在线程的销毁时进行。由于方法可能会在不同线程中执行,每个线程都会包含一个自己的虚拟机栈

栈帧组成:局部变量表、操作数栈、帧数据

1)局部变量表

局部变量表的作用是在方法执行过程中存放所有的局部变量。编译成字节码文件时就可以确定局部变量表的内容。

栈帧中的局部变量表是一个数组,数组中每一个位置称之为槽(slot) ,longdouble类型占用两个槽,其他类型占用一个槽。

实例方法中的序号为0的位置存放的是this,指的是当前调用方法的对象,运行时会在内存中存放实例对象的地址。

方法参数也会保存在局部变量表中,其顺序与方法中参数定义的顺序一致。

局部变量表保存的内容有:实例方法的this对象方法的参数,方法体中声明的局部变量

【JVM从入门到实战】(七)运行时数据区的组成_第4张图片

为了节省空间,局部变量表中的槽是可以复用的,一旦某个局部变量不再生效,当前槽就可以再次被使用。
思考:以下代码的局部变量表中会占用几个槽?
【JVM从入门到实战】(七)运行时数据区的组成_第5张图片
答:局部变量表占用如下图
【JVM从入门到实战】(七)运行时数据区的组成_第6张图片

2)操作数栈

栈帧中虚拟机在执行指令过程中用来存放临时数据的一块区域,是一种栈式的数据结构,如果一条指令将一个值压入操作数栈,则后面的指令可以弹出并使用该值。在编译期就可以确定操作数栈的最大深度,从而在执行时正确的分配内存大小。
【JVM从入门到实战】(七)运行时数据区的组成_第7张图片


加法运算中操作数栈的应用
【JVM从入门到实战】(七)运行时数据区的组成_第8张图片

3)帧数据

主要包含动态链接、方法出口、异常表的引用

  • 动态链接:保存了编号到运行时常量池的内存地址的映射关系。当前类的字节码指令引用了其他类的属性或者方法时,需要将符号引用(编号)转换成对应的运行时常量池中的内存地址。
    【JVM从入门到实战】(七)运行时数据区的组成_第9张图片

  • 方法出口:指的是方法在正确或者异常结束时,当前栈帧会被弹出,同时程序计数器应该指向上一个栈帧中的下一条指令的地址。所以在当前栈帧中,需要存储此方法出口的地址。

  • 异常表:存放的是代码中异常的处理信息,包含了异常捕获的生效范围以及异常发生后跳转到的字节码指令位置。
    【JVM从入门到实战】(七)运行时数据区的组成_第10张图片

栈内存溢出:

Java虚拟机栈如果栈帧过多,占用内存超过栈内存可以分配的最大大小就会出现内存溢出。虚拟机栈内存溢出时会出现StackOverflowError的错误。

如果我们不指定栈的大小,JVM 将创建一个具有默认大小的栈。大小取决于操作系统和计算机的体系结构。要修改Java虚拟机栈的大小,可以使用虚拟机参数 -Xss 。字节(默认,必须是 1024 的倍数)、k或者K(KB)、m或者M(MB)、g或者G(GB) 图6

栈内存溢出模拟
使用递归让方法调用自身,但是不设置退出条件。定义调用次数的变量,每一次调用让变量加1。查看错误发生时总调用的次数。

	public static int count = 0;
	//递归方法调用自己
	 public static void recursion(){
		 System.out.println(++count);
		 recursion();
	 }
  • 要修改Java虚拟机栈的大小,可以使用虚拟机参数 -Xss
    语法:-Xss栈大小
    单位:字节(默认,必须是 1024 的倍数)、k或者K(KB)、m或者M(MB)、g或者G(GB)

注意事项

  1. -Xss类似,也可以使用-XX:ThreadStackSize调整标志来配置堆栈大小。
    格式为: -XX:ThreadStackSize=1024
  2. HotSpot JVM对栈大小的最大值和最小值有要求:
    比如测试如下两个参数:
    -Xss1k
    -Xss1025m
    Windows(64位)下的JDK8测试最小值为180k,最大值为1024m。
  3. 局部变量过多、操作数栈深度过大也会影响栈内存的大小。

一般情况下,工作中即便使用了递归进行操作,栈的深度最多也只能到几百,不会出现栈的溢出。所以此参数可以手动指定为-Xss256k节省内存。

3. 本地方法栈(Local Method Stack)

Java虚拟机栈存储了Java方法调用时的栈帧,而本地方法栈存储的是native本地方法的栈帧。

在Hotspot虚拟机中,Java虚拟机栈和本地方法栈实现上使用了同一个栈空间。本地方法栈会在栈内存上生成一个栈帧,临时保存方法的参数同时方便出现异常时也把本地方法的栈信息打印出来。

4. 堆(Heap)

1) Java程序中堆内存是空间最大的一块内存区域。创建出来的对象都存在于堆上

栈上的局部变量表中,可以存放堆上对象的引用。静态变量也可以存放堆对象的引用,通过静态变量就可以实现对象在线程之间共享。
堆内存大小有上限,当一直向堆中放入对象达到上限之后,会抛出OutOfMemory错误。
【JVM从入门到实战】(七)运行时数据区的组成_第11张图片

2) 堆空间有三个需要关注的值

used: 指的是当前已使用的堆内存
total: 是java虚拟机已经分配的可用堆内存
max: 是java虚拟机可以分配的最大堆内存

随着堆中的对象增多,当total可以使用的内存即将不足时,java虚拟机会继续分配内存给堆,total值会变大,最多只能与max相等。如果不设置任何的虚拟机参数,max默认是系统内存的1/4,total默认是系统内存的1/64。在实际应用中一般都需要设置total和max的值。

Java服务端程序开发时,建议将-Xmx-Xms设置为相同的值,这样在程序启动之后可使用的总内存就是最大内存,而无需向java虚拟机再次申请,减少了申请并分配内存时间上的开销,同时也不会出现内存过剩之后堆收缩的情况。

堆 – 设置大小:使用虚拟机参数 –Xmx(max最大值)-Xms (初始的total)。单位:字节(默认,必须是 1024 的倍数)、k或者K、m或者M、g或者G.

Oracle官方文档:https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html

3)arthas中堆内存相关的功能

可以通过dashboard命令看到堆内存usedtotalmax三个值。
手动指定刷新频率(默认5秒一次):dashboard –i 刷新频率(毫秒)
可使用memory命令,只查看内存的信息(不会自动刷新)
【JVM从入门到实战】(七)运行时数据区的组成_第12张图片

要修改堆的大小,可以使用虚拟机参数 –Xmx(max最大值)和-Xms (初始的total)

语法:-Xmx值 -Xms值
单位:字节(默认,必须是 1024 的倍数)、k或者K(KB)、m或者M(MB)、g或者G(GB)
限制:Xmx必须大于 2 MB,Xms必须大于1MB

5. 方法区

方法区是存放基础信息的位置,线程共享,主要包含三部分内容:类的元信息、运行时常量池、字符串常量池
【JVM从入门到实战】(七)运行时数据区的组成_第13张图片

1)类的元信息

存储每个类的基本信息,一般称之为InstanceKlass对象。在类的加载阶段完成。

2)运行时常量池

存放的是字节码中的常量池内容。字节码文件中通过编号查表的方式找到常量,这种常量池称为静态常量池。当常量池加载到内存中之后,可以通过内存地址快速的定位到常量池中的内容,这种常量池称为运行时常量池。
【JVM从入门到实战】(七)运行时数据区的组成_第14张图片

方法区是《Java虚拟机规范》中设计的虚拟概念,每款Java虚拟机在实现上都各不相同。Hotspot设计如下:
JDK7及之前的版本将方法区存放在堆区域中的永久代空间,堆的大小由虚拟机参数来控制。
JDK8及之后的版本将方法区存放在元空间中,元空间位于操作系统维护的直接内存中(不属于系统给jvm分配的内存),默认情况下只要不超过操作系统承受的上限,可以一直分配。可以使用“-XX:MaxMetaspaceSize=值”将元空间最大大小进行限制
【JVM从入门到实战】(七)运行时数据区的组成_第15张图片

arthas中查看方法区:
使用memory打印出内存情况,JDK7及之前的版本查看ps_perm_gen属性。
JDK8及之后的版本查看metaspace属性。
【JVM从入门到实战】(七)运行时数据区的组成_第16张图片

JDK7和JDK8在方法区的存放上,采用了不同的设计:
JDK7将方法区存放在堆区域中的永久代空间,堆的大小由虚拟机参数-XX:MaxPermSize=值来控制。
JDK8将方法区存放在元空间中,元空间位于操作系统维护的直接内存中,默认情况下只要不超过操作系统承受的上限,可以一直分配。可以使用-XX:MaxMetaspaceSize=值将元空间最大大小进行限制。

3)字符串常量池

方法区中除了类的元信息、运行时常量池之外,还有一块区域叫字符串常量池(StringTable)。
字符串常量池存储在代码中定义的常量字符串内容。比如“123” 这个123就会被放入字符串常量池。
【JVM从入门到实战】(七)运行时数据区的组成_第17张图片

字符串常量池和运行时常量池有什么关系?
【JVM从入门到实战】(七)运行时数据区的组成_第18张图片

案例:通过字节码指令分析如下代码的运行结果

问题1:

public static void main(String[] args){
    String a = "1";
    String b = "2";
    String c = "12";
    String d = a+b;
    System.out.println(c==d);
}

答案: false
分析: 图6 dab两个变量连接,创建了StringBuilder对象生成的,a,b,c都是常量池的字符串
【JVM从入门到实战】(七)运行时数据区的组成_第19张图片

问题2:

public static void main(String[] args){
String a = "1";
String b = "2";
String c = "12";
String d = "1" + "2";
System.out.println(c==d);
}

答案: true
分析: 在编译期就直接将12拼接为字符串12,没有创建对象
【JVM从入门到实战】(七)运行时数据区的组成_第20张图片

问题:静态变量存储在哪里?
JDK6及之前的版本中,静态变量是存放在方法区中的,也就是永久代
JDK7及之后的版本中,静态变量是存放在堆中的Class对象中,脱离了永久代。
【JVM从入门到实战】(七)运行时数据区的组成_第21张图片【JVM从入门到实战】(七)运行时数据区的组成_第22张图片

6. 直接内存(Direct Memory)

直接内存(Direct Memory)并不在《Java虚拟机规范》中存在,所以并不属于Java运行时的内存区域。

在 JDK 1.4 中引入了 NIO 机制,使用了直接内存,主要为了解决以下两个问题:
1、Java堆中的对象如果不再使用要回收,回收时会影响对象的创建和使用。
2、IO操作比如读文件,需要先把文件读入直接内存(缓冲区)再把数据复制到Java堆中。现在直接放入直接内存即可,同时Java堆上维护直接内存的引用,减少了数据复制的开销。写文件也是类似的思路。
【JVM从入门到实战】(七)运行时数据区的组成_第23张图片

要创建直接内存上的数据,可以使用ByteBuffer。
语法: ByteBuffer directBuffer = ByteBuffer.allocateDirect(size);
手动调整直接内存的大小:可以使用-XX:MaxDirectMemorySize=大小

arthas的memory命令可以查看直接内存大小,属性名direct
【JVM从入门到实战】(七)运行时数据区的组成_第24张图片

如果需要手动调整直接内存的大小,可以使用-XX:MaxDirectMemorySize=大小
单位k或K表示千字节,m或M表示兆字节,g或G表示千兆字节。默认不设置该参数情况下,JVM 自动选择最大分配的大小。

7. 总结

1) 运行时数据区分成哪几部分,每一部分的作用是什么?

程序计数器、Java虚拟机栈、本地方法栈、方法区、堆
每个线程会通过程序计数器记录当前要执行的的字节码指令的地址程序计数器可以控制程序指令的进行,实现分支、跳转、异常等逻辑。
虚拟机栈采用栈的数据结构来管理方法调用中的基本数据(局部变量、操作数等),每一个方法的调用使用一个栈帧来保存。
堆中存放的是创建出来的对象,这也是最容易产生内存溢出的位置
方法区中主要存放的是类的元信息,同时还保存了常量池

2) 不同JDK版本之间运行时数据区域的区别是什么?
  • jdk6
    【JVM从入门到实战】(七)运行时数据区的组成_第25张图片
  • JDK7
    【JVM从入门到实战】(七)运行时数据区的组成_第26张图片
  • JDK8
    【JVM从入门到实战】(七)运行时数据区的组成_第27张图片

你可能感兴趣的:(Java,jvm,python,开发语言)