定义:
JVM全称是Java Virtual Machine-java程序的运行环境(java二进制字节码的运行环境)
好处:
比较JVM,JRE,JDK之间的联系和区别,我们可以用一张图来解释
JVM体系结构如图所示
一个类从Java源代码(.java文件)编译成了Java二进制字节码以后,必须经过类加载器才能被加载到JVM里面才能运行。
我们一般把类放在方法区里。类将来创建的对象放在堆的部分,而堆里面的对象在调用方法时会用到虚拟机栈和程序计数器以及本地方发展。
方法执行时每行代码是由执行引擎中的解释器逐行进行执行的。方法里面的热点代码也就是频繁调用的代码,由即时编译器来编译执行。GC会对垃圾进行回收。
我们可以通过本地方法接口来调用操作系统提供的功能。
JVM的内存结构包括:
1.方法区
2.程序计数器
3.虚拟机栈
4.本地方法栈
5.堆
Program Counter Register程序计数器(寄存器)
作用:
是记住下一条jvm指令的执行地址
特点
是线程私有的
不会存在内存溢出(内存结构中唯一一个不会内存溢出的结构)
在2.2中我们将会解释程序计数器的作用及特点。
二进制字节码 JVM指令 Java源代码
0: getstatic #20 // PrintStream out = System.out;
3: astore_1 // -
4: aload_1 // out.println(1);
5: iconst_1 // -
6: invokevirtual #26 // -
9: aload_1 // out.println(2);
10: iconst_2 // -
11: invokevirtual #26 // -
14: aload_1 // out.println(3);
15: iconst_3 // -
16: invokevirtual #26 // -
19: aload_1 // out.println(4);
20: iconst_4 // -
21: invokevirtual #26 // -
24: aload_1 // out.println(5);
25: iconst_5 // -
26: invokevirtual #26 // -
29: return
我们可以看到这些代码,第一行System.out赋值给了一个变量,在4:中去调用println()方法。然后依次打印1,2,3,4,5。这些指令不能直接交给CPU来执行,必须经过解释器的作用。它负责把一条一条的字节码指令解释成机器码,然后机器码就可以交给CPU来执行。
也就是
二进制字节码->解释器->机器码->CPU
实际上程序计数器的作用就是在指令的执行过程中,记住下一条JVM指令的执行地址。
上面我们二进制字节码前面的数字0,3,4…我们可以把其理解为地址。根据这些地址信息,我们就可以找到命令来执行。
在每次拿到指令交给CPU执行之后,程序计数器就会把下一条指令的地址放入到程序计数器中,等一条指令执行完成之后,解释器就会到程序计数器中取到下一条指令的地址。再把其经过解释器解释成机器码然后交给CPU执行。然后一直重复这样的过程。
在物理上,实现程序计数器是通过寄存器来实现的。寄存器是CPU组件里读取最快的存储单元。
程序计数器是线程私有的
假如说上述代码都在线程1中运行,同时运行的还有线程2和线程3,多个线程运行的时候,CPU会给每个线程分配时间片,给线程1分配时间片,如果线程1在指定的时间没有运行完,它就会把状态暂存,切换到线程2,线程2执行自己的代码。线程2执行完了,再继续执行线程1的代码,在线程切换的过程中,我们要记住下一条指令的执行地址。就需要用到程序计数器。假如说线程1刚开始执行到第9行代码,恰好这个时候时间片用完,CPU切换到线程2去执行,这时它就会把下一条指令的地址10记录到程序计数器里面,而且程序计数器是线程私有的,它是属于线程1的,等线程2代码执行完了,线程1抢到了时间片,它就会从自己的程序计数器里面取出下一行代码。每个线程都有自己的程序计数器
栈类似现实生活中的子弹夹。栈最重要的特点是后进先出。
如图,1是最先进入栈中的,3是最后进入栈中的,但是在出栈的时候,3最先出栈,1最后出栈。即他们按照1,2,3的顺序入栈,按照3,2,1的顺序出栈
虚拟机栈就是我们线程运行时需要的内存空间,一个线程运行时需要一个栈。如果将来有多个线程的话,它就会有多个虚拟机栈。
每个栈可以看成是由多个栈帧组成,例如上图中每个元素1,2,3都可以看成是栈帧。
一个栈帧就对应着Java中一个方法的调用,即栈帧就是每个方法运行时需要的内存。每个方法运行时需要的内存一般有参数,局部变量,返回地址,这些都需要占用内存,所以每个方法执行时,都要预先把这些内存分配好。
当我们调用第一个方法栈帧时,它就会给第一个方法分配栈帧空间,并且压入栈内,当这个方法执行完了,就会把这个方法栈帧出栈,释放这个方法所占用的内存。
一个栈内可能有多个栈帧存在。
总结
Java Virtual Machine Stacks(Java虚拟机栈)
活动栈帧表示线程正在执行的方法。
public class teststacks {
public static void main(String[] args) throws InterruptedException{
method1();
}
public static void method1(){
method2(1,2);
}
public static int method2(int a,int b){
int c=a+b;
return c;
}
}
可以自行调试以上代码来观察栈中的变化情况。
入栈顺序:main->method1->method2
出栈顺序:method2->method1->main
看一个变量是否线程安全,首先就是看这个变量对多个线程是共享的还是私有的,共享的变量需要考虑线程安全。
其次局部变量也不能保证是线程安全的,需要看此变量是否逃离了方法的作用范围(作为参数和返回值逃出方法作用范围时需要考虑线程安全问题)
例如:
以下代码中局部变量是私有的,是线程安全的
//多个线程同时执行该方法,会不会造成x值混乱呢?
//不会,因为x是方法内的局部变量,是线程私有的,互不干扰
static void m1(){
int x=0;
for(int i=0;i<5000;i++){
x++;
}
System.out.println(x);
}
但是如果我们把变量的类型改为static,此时就大不一样了,x是静态变量,线程1和线程2同时拥有同一个x,static变量针对多个线程是一个共享的,不加安全保护的话,就会出现线程安全问题。
static void m1(){
static int x=0;
for(int i=0;i<5000;i++){
x++;
}
System.out.println(x);
}
我们再看几个方法
public static void main(String[] args) {
StringBuilder sb = new StringBuilder();
sb.append(4);
sb.append(5);
sb.append(6);
new Thread(()->{
m2(sb);
}).start();
}
public static void m1() {
StringBuilder sb = new StringBuilder();
sb.append(1);
sb.append(2);
sb.append(3);
System.out.println(sb.toString());
}
public static void m2(StringBuilder sb) {
sb.append(1);
sb.append(2);
sb.append(3);
System.out.println(sb.toString());
}
public static StringBuilder m3() {
StringBuilder sb = new StringBuilder();
sb.append(1);
sb.append(2);
sb.append(3);
return sb;
}
m1是线程安全的:m1中的sb是线程中的局部变量,它是属于线程私有的
m2线程不安全:sb它是方法的参数,有可能有其它的线程访问到它,它就不再是线程私有的了,它对多个线程是共享的。
m3不是线程安全的:它被当成返回结果返回了,返回了有可能其它的线程拿到这个对象,从而并发的修改。
什么情况下会导致栈内存溢出呐?
1.栈帧过多导致栈内存溢出(一般递归调用次数太多,进栈太多导致溢出)
这里最容易出现的场景是函数的递归调用。
2.栈帧过大导致栈内存溢出(不太容易出现)
栈内存溢出代码演示1(自己开发):
测试以下的程序,其中递归函数没有递归边界
public class Demo1_2 {
private static int count;
public static void main(String[] args) {
try {
method1();
} catch (Throwable e) {
e.printStackTrace();
System.out.println(count);
}
}
private static void method1() {
count++;
method1();
}
}
运行结果如下
…
这里报了错误StackOverflowError。
总共进行了22846次递归调用
idea中设置栈内存大小:
将栈内存设置的小一点,发现5000多次递归调用就溢出了。
栈内存溢出代码演示2(第三方依赖库出现):
本案例可以使用JsonIgnore注解解决循环依赖,数据转换时,只让部门类去关联员工类,员工类不再关联部门类,在员工类的部门属性(dept)上加@JsonIgnore注解。具体使用详情可以点击此处查看
排查步骤:
1.在linux中使用top命令,去查看后台进程对cpu的占用情况
注意,在这之前我们运行了一道Java程序
Java代码占用了CPU的99.3%.top命令只能定位到进程,而无法定位到线程。
2.查看线程对cpu的占用情况:ps H -eo pid,tid,%cpu
如果显示过多,可使用ps H -eo pid,tid,%cpu | grep 进程id,过滤掉不想看的部分进程
注意:ps不仅可以查看进程,也可以查看线程对CPU的占用情况。H把进程中的线程所有信息都展示出来。-eo规定输出感兴趣的内容,这里我们想看看pid,tid和CPU的占用情况%cpu
当线程数太多,排查不方便的话,我们可以用grep pid来进行筛选,过滤掉不感兴趣的进程
ps H -eo pid,tid,%cpu |grep 32655
3.定位到是哪个线程占用内存过高后,再使用Jdk提供的命令(jstack+进程id)去查看进程中各线程的运行信息,需要把第二步中查到的线程id(十进制)转为十六进制,然后进行比较查询到位置后判断异常信息。
thread1,thread2,thread3是我们自己定义的线程。
可以根据线程id,找到有问题的线程,进一步定位到问题代码的源码行号
仍然通过jdk提供的 jstack+进程id的方式,去查看进程中各个线程的运行信息
含义:Java虚拟机调用本地方法时,需要给本地方法提供的一些内存空间
本地方法不是由Java编写的代码,由于Java有时不能直接和操作系统打交道,所以需要用C/C++语言来与操作系统打交道,那么Java就可以通过调用本地方法来获得这些功能。本地方法非常的多,如Object类的clone(),hashCode方法,wait方法,notify方法等
public native int hashCode();
1.虚拟机栈,程序计数器,本地方法栈,这些都是线程私有的,而堆和方法区,是线程公用的一块内存区域。
2.通过new关键字创建的对象都会使用堆内存
3.由于堆是线程共享的,堆内的对象都要考虑线程安全问题(也有一些例外)
4.堆有垃圾回收机制,不再被引用的对象会被回收
对象一直存在于堆中未被回收,且占用内存越来越大,最终导致堆内存溢出(虽然堆中有垃圾回收机制,但垃圾回收机制不是回收所有的对象)
我们可以看看下面的代码
public static void main(String[] args) {
int i = 0;
try {
List<String> list = new ArrayList<>();
String a = "hello";
while (true) {
list.add(a); // hello, hellohello, hellohellohellohello ...
a = a + a; // hellohellohellohello
i++;
}
} catch (Throwable e) {
e.printStackTrace();
System.out.println(i);
}
}
报了错误java.lang.OutOfMemoryError
代码中每次都拼接一个hello,由于定义的list集合创建在try语句里面,所以在for循环不断执行过程中,list集合是不会被回收的,只要程序还没到catch之前,它就一直有效。而字符串对象都被追加到了集合内部,字符串对象由于一直被使用,所以不会被回收。
我们可以通过-Xmx来设置堆空间大小。
我们把堆内存改成8M(之前内存是4G),此时只运行了17次。
1.jps工具:jps,查看当前进程中有哪些Java进程,并将进程id显示出来(idea中通过terminal命令行输入命令)
2.jmap工具:jmap -heap 进程id 查询某一个时刻堆内存的占用情况
3.jconsole工具:图形界面的,多功能监测工具,可连续监测,使用流程图如下(1-2-3):
方法区(Method Area)与Java堆一样,是各个线程共享的内存区域,他用于存储已被虚拟机加载的类信息、常量、静态常量、即时编译器编译后的代码等数据。(与类有关的信息)。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是他却有一个别名叫做Non-Heap(非堆),目的应该是与Java堆区分开来。方法区在虚拟机启动时创建。
对于习惯在HotSpot虚拟机上开发、部署程序的开发者来说,很多都更愿意把方法取称为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已,这样HotSpot的垃圾收集器可以像管理Java堆一样管理这部分内存,能够省去专门为方法区编写内存管理代码的工作。对于其他虚拟机(如BEA JRockit、IBM J9等)来说是不存在永久代的概念的。原则上,如何实现方法区属于虚拟机实现细节,不受虚拟机规范约束,但使用永久代来实现方法区,现在看来并不是一个好主意,因为这样更容易遇到内存溢出问题(永久代有-XX:MaxPermSize的上限,J9和JRockit只要没有触碰到进程可用内存的上限,例如32位系统中的4GB,就不会出现问题),而且有极少数方法(例如String.intern())会因这个原因导致不同虚拟机下有不同的表现。因此,对于HotSpot虚拟机,根据官方发布的路线图信息,现在也已放弃永久代并逐步改为采用Navtive Memory来实现方法区的规划,在JDK1.7的HostSpot中,已经把原本放在永久代的字符串常量池移出,jdk1.8中后称作元空间,用的操作系统内存。
Java虚拟机规范对方法区的限制非常宽松,除了和Java堆一样不需要连续的内存和可以喧嚣而固定大小或者可扩展外,还可以选择不实现垃圾收集。相对而言,垃圾收集行为在这个区域是比较少出现的,但并非数据进入了方法区就如永久代的名字一样“永久”存在了。这区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说,这个区域的回收“成绩”比较难以令人满意,尤其是类型的卸载,条件相当苛刻,但是这部分区域的回收确实是必要的。在Sun公司的BUG列表中,曾出现过的若干个严重的BUG就是由于低版本的HotSpot虚拟机对此区域未完全回收而导致内存泄漏。
根据Java虚拟机规范的规定,当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。
文原文关于虚拟机的定义:
jdk1.8之前,方法区是用的堆内存,1.8之后,方法区用的操作系统内存。
这块不是太清晰,可以参考下此篇博客点击查看
常量池分为静态常量池和动态常量池,下图中的常量池指的是动态常量池,因为它们已经被读入内存中去,而静态常量池存在于class文件中
1.8以前会导致永久代内存溢出
1.8以后会导致元空间内存溢出
/**
* 演示元空间内存溢出 java.lang.OutOfMemoryError: Metaspace
* -XX:MaxMetaspaceSize=8m
*/
public class Demo1_8 extends ClassLoader {
// 可以用来加载类的二进制字节码
public static void main(String[] args) {
int j = 0;
try {
Demo1_8 test = new Demo1_8();
for (int i = 0; i < 10000; i++, j++) {
// ClassWriter 作用是生成类的二进制字节码
ClassWriter cw = new ClassWriter(0);
//参数:版本号, public, 类名, 包名, 父类, 接口
cw.visit(Opcodes.V1_8, Opcodes.ACC_PUBLIC, "Class" + i, null, "java/lang/Object", null);
// 生成类,二进制字节码用byte来表示,返回 byte[]
byte[] code = cw.toByteArray();
// 执行了类的加载
test.defineClass("Class" + i, code, 0, code.length); // Class 对象
}
} finally {
System.out.println(j);
}
}
}
jdk1.8以后, 默认情况下,方法区用的是系统内存,所以加大还是不会导致内存溢出,循环很多次都运行成功。
当设置了-XX:MaxMetaspaceSize=8m,到了5411次就溢出了。报的是java.lang.OutOfMemoryError: Metaspace错误
而1.8以前永久代溢出报的错误是java.lang.OutOfMemoryError:PermGen space
常量池,就是一张表,虚拟机指令根据这站常量表找到要执行的类名、方法名、参数类型、字面量信息(如字符串常量、true和false)。
运行时常量池,常量池是.class文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址*。
public class HelloWorld {
public static void main(String[] args) {
System.out.println("hello,world");
}
}
以上是一个helloworld程序,helloworld要运行,肯定要先编译成一个二进制字节码。
二进制字节码由类的基本信息、常量池、类方法定义(包含了虚拟机指令)。
反编译HelloWorld(之前需要运行将.java文件编译成.class文件)
使用idea工具
F:\IDEA\projects\jvm>javap -v F:\IDEA\projects\jvm\out\production\untitled\HelloWorld.class
F:\IDEA\projects\jvm\out\production\untitled\是HelloWorld.class所在的路径
显示类的详细信息
Classfile /F:/IDEA/projects/jvm/out/production/untitled/HelloWorld.class
Last modified 2021-1-30; size 533 bytes
MD5 checksum 82d075eb7217b4d23706f6cfbd44f8f1
Compiled from "HelloWorld.java"
public class HelloWorld
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
可以看到类的文件,最后修改时间,签名。以及版本等等。有的还有访问修饰符、父类和接口等详细信息。
显示常量池
Constant pool:
#1 = Methodref #6.#20 // java/lang/Object."":()V
#2 = Fieldref #21.#22 // java/lang/System.out:Ljava/io/PrintStream;
#3 = String #23 // hello,world
#4 = Methodref #24.#25 // java/io/PrintStream.println:(Ljava/lang/String;)V
#5 = Class #26 // HelloWorld
#6 = Class #27 // java/lang/Object
#7 = Utf8 <init>
#8 = Utf8 ()V
#9 = Utf8 Code
#10 = Utf8 LineNumberTable
#11 = Utf8 LocalVariableTable
#12 = Utf8 this
#13 = Utf8 LHelloWorld;
#14 = Utf8 main
#15 = Utf8 ([Ljava/lang/String;)V
#16 = Utf8 args
#17 = Utf8 [Ljava/lang/String;
#18 = Utf8 SourceFile
#19 = Utf8 HelloWorld.java
#20 = NameAndType #7:#8 // "":()V
#21 = Class #28 // java/lang/System
#22 = NameAndType #29:#30 // out:Ljava/io/PrintStream;
#23 = Utf8 hello,world
#24 = Class #31 // java/io/PrintStream
#25 = NameAndType #32:#33 // println:(Ljava/lang/String;)V
#26 = Utf8 HelloWorld
#27 = Utf8 java/lang/Object
#28 = Utf8 java/lang/System
#29 = Utf8 out
#30 = Utf8 Ljava/io/PrintStream;
#31 = Utf8 java/io/PrintStream
#32 = Utf8 println
#33 = Utf8 (Ljava/lang/String;)V
显示方法定义
{
public HelloWorld();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."":()V
4: return
LineNumberTable:
line 1: 0
LocalVariableTable:
Start Length Slot Name Signature
0 5 0 this LHelloWorld;
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=1, args_size=1
0: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3 // String hello,world
5: invokevirtual #4 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
LineNumberTable:
line 3: 0
line 4: 8
LocalVariableTable:
Start Length Slot Name Signature
0 9 0 args [Ljava/lang/String;
}
第一个方法是public HelloWorld();它是编译器自动为我们构造的无参构造方法。
第二个是public static void main(java.lang.String[]);即main方法
方噶里面就包括了虚拟机的指令了。
getstatic获取一个静态变量,即获取System.out静态变量
ldc是加载一个参数,参数是字符串hello,world
invokevirtual虚方法调用,println方法
return执行结束。
我们getstatic、ldc、invokevirtual后面都有一个#2,#3,#4。在解释器翻译这些虚拟机指令的时候,它会把这些#2,#3,#4进行一个查表翻译。比如getstatic #2,就去查常量池的表。在常量池中
#2 = Fieldref #21.#22 引用的是成员变量#21,#22.
#21 = Class #28 // java/lang/System
#22 = NameAndType #29:#30 // out:Ljava/io/PrintStream;
然后再去找#28.29,30
#28 = Utf8 java/lang/System
#29 = Utf8 out
#30 = Utf8 Ljava/io/PrintStream;
所以现在我就知道了,我是要找到java.lang.system类下叫out的成员变量,类型是java/io。
同理,ldc是找#3 = String #23 Utf8 hello,world,它是虚拟机常量池的一个字符串。把helloworld常量变成字符串对象加载进来。
invokevirtual #4 Methodref #24.#25 等等
所以常量池的作用就是给我们指令提供一些常量符号,根据这些常量符号,我们就可以根据查表的方式去找到它,这样虚拟机才能成功的执行它。