本文在尚硅谷的JVM视频教程和一些优秀CSDN博主以及GitHub上的优秀作者的创作基础上加入了自己的理解。由于引用来源的较多,请相关部分作者联系本人,以注明出处。
这是参考的一些链接:
https://github.com/youthlql/JavaYouth、
https://blog.csdn.net/weixin_43591980
就像是做菜,左边是菜谱以及执行的顺序,代表着我们的栈。右边就是真正的食材,我们存放的数据,代表是堆。
Java虚拟机栈是什么?
public class StackTest {
public static void main(String[] args) {
StackTest test = new StackTest();
test.methodA();
}
public void methodA() {
int i = 10;
int j = 20;
methodB();
}
public void methodB(){
int k = 30;
int m = 40;
}
}
虚拟机栈的生命周期
虚拟机栈的作用
栈是一种快速有效的分配存储方式,访问速度仅次于程序计数器。
JVM直接对Java栈的操作只有两个:
对于栈来说不存在垃圾回收问题
面试题:栈中可能出现的异常?
Java 虚拟机规范允许Java栈的大小是动态的或者是固定不变的。
如果采用固定大小的Java虚拟机栈,那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机栈允许的最大容量,Java虚拟机将会抛出一个StackoverflowError 异常。
如果Java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,那Java虚拟机将会抛出一个 OutofMemoryError 异常。
多去官方文档看看:https://docs.oracle.com/en/java/javase/11/tools/java.html#GUID-3B1CE181-CD30-4178-9602-230B800D4FAE
地址经常变
我们可以使用参数 -Xss 选项来设置线程的最大栈空间,栈的大小直接决定了函数调用的最大可达深度。
Sets the thread stack size (in bytes). Append the letter
k
orK
to indicate KB,m
orM
to indicate MB, andg
orG
to indicate GB. The default value depends on the platform:
- Linux/x64 (64-bit): 1024 KB
- macOS (64-bit): 1024 KB
- Oracle Solaris/x64 (64-bit): 1024 KB
- Windows: The default value depends on virtual memory
The following examples set the thread stack size to 1024 KB in different units:
-Xss1m
-Xss1024k
-Xss1048576
public class StackErrorTest {
private static int count = 1;
public static void main(String[] args) {
System.out.println(count);
count++;
main(args);
}
}
没设置参数前
部分输出结果:
11404
11405
11406
Exception in thread "main" java.lang.StackOverflowError
at sun.nio.cs.UTF_8$Encoder.encodeLoop(UTF_8.java:691)
说明栈在11406这个深度溢出了
设置栈参数之后
部分输出结果
2474
2475
2476
Exception in thread "main" java.lang.StackOverflowError
at sun.nio.cs.UTF_8.updatePositions(UTF_8.java:77)
说明参数起作用了
栈内存的分配越大越好吗?
JVM直接对Java栈的操作只有两个,就是对栈帧的压栈和出栈,遵循先进后出(后进先出)原则
在一条活动线程中,一个时间点上,只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧(栈顶栈帧)是有效的。这个栈帧被称为当前栈帧(Current Frame),与当前栈帧相对应的方法就是当前方法(Current Method),定义这个方法的类就是当前类(Current Class)
执行引擎运行的所有字节码指令只针对当前栈帧进行操作。
如果在该方法中调用了其他方法,对应的新的栈帧会被创建出来,放在栈的顶端,成为新的当前帧。
每个栈帧中存储着:
局部变量表(Local Variables)
操作数栈(Operand Stack)(或表达式栈)
动态链接(Dynamic Linking)(或指向运行时常量池的方法引用)
方法返回地址(Return Address)(或方法正常退出或者异常退出的定义)
一些附加信息
并行每个线程下的栈都是私有的,因此每个线程都有自己各自的栈,并且每个栈里面都有很多栈帧,栈帧的大小主要由局部变量表 和 操作数栈决定的
(JDK7及其之后,静态变量、字符常量是放在java的堆中)不过由于方法区作为一个逻辑概念,所以表示成方法区。真正存在
public class LocalVariablesTest {
private int count = 0;
public static void main(String[] args) {
LocalVariablesTest test = new LocalVariablesTest();
int num = 10;
test.test1();
}
//练习:
public static void testStatic(){
LocalVariablesTest test = new LocalVariablesTest();
Date date = new Date();
int count = 10;
System.out.println(count);
//因为this变量不存在于当前方法的局部变量表中!!
// System.out.println(this.count);
}
//关于Slot的使用的理解
public LocalVariablesTest(){
this.count = 1;
}
public void test1() {
Date date = new Date();
String name1 = "atguigu.com";
test2(date, name1);
System.out.println(date + name1);
}
public String test2(Date dateP, String name2) {
dateP = null;
name2 = "songhongkang";
double weight = 130.5;//占据两个slot
char gender = '男';
return dateP + name2;
}
public void test3() {
this.count++;
}
public void test4() {
int a = 0;
{
int b = 0;
b = a + 1;
}
//变量c使用之前已经销毁的变量b占据的slot的位置
int c = a + 1;
}
}
看完字节码后,可得结论:所以局部变量表所需的容量大小是在编译期确定下来的。
为了更好讲解,我们直接用jclasslib来看字节码,以main方法为例来讲解。一些一目了然的就不讲了
1、0-15 也就是有16行字节码
2、方法异常信息表
3、Misc
4、行号表
Java代码的行号和字节码指令行号的对应关系
5、注意:生效行数和剩余有效行数都是针对于字节码文件的行数
1、图中圈的东西表示该局部变量的作用域
2、Start PC==11表示在字节码的11行开始生效,也就是Java代码对应的第15行,作用域就是从11行开始。而声明int num在java代码的是第14行,说明是从声明的下一行开始生效
3、Length== 5表示局部变量剩余有效行数,main方法字节码指令总共有16行,从11行开始生效,那么剩下就是16-11 ==5。相当于作用域从11开始,作用域范围是5
4、Ljava/lang/String
前面的L表示引用类型
方法内的局部变量是否是线程安全的?
从图中得出:局部变量如果是静态的可以被多个线程共享,那么就存在线程安全问题。如果是非静态的只存在于某个方法作用范围内,被线程私有,那么就是线程安全的!
/**
* 局部变量的线程安全问题
*/
public class Demo02 {
public static void main(String[] args) {// main 函数主线程
StringBuilder sb = new StringBuilder();
sb.append(4);
sb.append(5);
sb.append(6);
new Thread(() -> {// Thread新创建的线程
m2(sb);
}).start();
}
public static void m1() {
// sb 作为方法m1()内部的局部变量,是线程私有的 ---> 线程安全
StringBuilder sb = new StringBuilder();
sb.append(1);
sb.append(2);
sb.append(3);
System.out.println(sb.toString());
}
public static void m2(StringBuilder sb) {
// sb 作为方法m2()外部的传递来的参数,sb 不在方法m2()的作用范围内
// 不是线程私有的 ---> 非线程安全
sb.append(1);
sb.append(2);
sb.append(3);
System.out.println(sb.toString());
}
public static StringBuilder m3() {
// sb 作为方法m3()内部的局部变量,是线程私有的
StringBuilder sb = new StringBuilder();// sb 为引用类型的变量
sb.append(1);
sb.append(2);
sb.append(3);
return sb;// 然而方法m3()将sb返回,sb逃离了方法m3()的作用范围,且sb是引用类型的变量
// 其他线程也可以拿到该变量的 ---> 非线程安全
// 如果sb是非引用类型,即基本类型(int/char/float...)变量的话,逃离m3()作用范围后,则不会存在线程安全
}
}
该面试题答案:
this 存放在 index = 0 的位置:
代码
public void test3() {
this.count++;
}
局部变量表:实例方法中的this 存放在 index = 0 的位置
构造器中的this存放在 index = 0 的位置
64位的类型(1ong和double)占用两个slot
代码
public String test2(Date dateP, String name2) { dateP = null; name2 = "songhongkang"; double weight = 130.5;//占据两个slot char gender = '男'; return dateP + name2; }
weight 为 double 类型,index 直接从 3 蹦到了 5
static 无法调用 this
this 不存在与 static 方法的局部变量表中,所以无法调用。因为this变量代表对象实例,而static是随类的加载而加载,先于实例之前就有的。
public static void testStatic(){ LocalVariablesTest test = new LocalVariablesTest(); Date date = new Date(); int count = 10; System.out.println(count); //因为this变量不存在于当前方法的局部变量表中!!// System.out.println(this.count); }
栈帧中的局部变量表中的槽位是可以重用的,如果一个局部变量过了其作用域,那么在其作用域之后申明新的局部变量变就很有可能会复用过期局部变量的槽位,从而达到节省资源的目的。
代码
public void test4() { int a = 0; { int b = 0; b = a + 1; } //变量c使用之前已经销毁的变量b占据的slot的位置 int c = a + 1; }
局部变量 c 重用了局部变量 b 的 slot 位置
变量的分类:1、按照数据类型分:① 基本数据类型 ② 引用数据类型2、按照在类中声明的位置分: 2-1、成员变量:在使用前,都经历过默认初始化赋值 2-1-1、类变量: linking的prepare阶段:给类变量默认赋值 ---> initial阶段:给类变量显式赋值即静态代码块赋值 2-1-2、实例变量:随着对象的创建,会在堆空间中分配实例变量空间,并进行默认赋值 2-2、局部变量:在使用前,必须要进行显式赋值的!否则,编译不通过。
在栈帧中,与性能调优关系最为密切的部分就是前面提到的局部变量表。在方法执行时,虚拟机使用局部变量表完成方法的传递。
局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收。
案例1:CPU占用过高
Linux环境下运行某些程序的时候,可能导致CPU的占用过高,这时需要定位占用CPU过高的线程
top命令,查看是哪个进程占用CPU过高
ps H -eo pid, tid(线程id), %cpu | grep 刚才通过top查到的进程号 通过ps命令进一步查看具体是哪个线程占用CPU过高!
jstack 进程id 通过查看进程中的线程的nid,刚才通过ps命令看到的tid来对比定位,注意jstack查找出的线程id是16进制的,需要转换
可以通过线程id,找到有问题的线程,进一步定位到问题代码的源码行数!
我们可以看到上图中的thread1 线程一直在运行(runnable)中,说明就是它占用了较高的CPU内存;
每一个独立的栈帧除了包含局部变量表以外,还包含一个后进先出(Last - In - First -Out)的 操作数栈,也可以称之为表达式栈(Expression Stack)
操作数栈,在方法执行过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈(push)和 出栈(pop)
操作数栈,主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间。
操作数栈就是JVM执行引擎的一个工作区,当一个方法刚开始执行的时候,一个新的栈帧也会随之被创建出来,这时方法的操作数栈是空的,虽然是空的但是已经创建好了,其长度是固定的。
每一个操作数栈都会拥有一个明确的栈深度用于存储数值,其所需的最大深度在编译期就定义好了,保存在方法的Code属性中,为maxstack的值。
栈中的任何一个元素都是可以任意的Java数据类型
操作数栈并非采用访问索引的方式来进行数据访问的,而是只能通过标准的入栈和出栈操作来完成一次数据访问。只不过操作数栈是用数组这个结构来实现的而已
如果被调用的方法带有返回值的话,其返回值将会被压入当前栈帧的操作数栈中,并更新PC寄存器中下一条需要执行的字节码指令。
操作数栈中元素的数据类型必须与字节码指令的序列严格匹配,这由编译器在编译器期间进行验证,同时在类加载过程中的类检验阶段的数据流分析阶段要再次验证。
另外,我们说Java虚拟机的解释引擎是基于栈的执行引擎,其中的栈指的就是操作数栈。
局部变量表就相当于食材
操作数栈就相当于做法步骤
public void testAddOperation() { //byte、short、char、boolean:都以int型来保存 byte i = 15; int j = 8; int k = i + j; // int m = 800; }
对应字节码指令
0 bipush 15 2 istore_1 3 bipush 8 5 istore_2 6 iload_1 7 iload_2 8 iadd 9 istore_310 return
此处的指令地址处的行数其实不是行数,而是指令的偏移地址,也就是说偏移地址为2的指令是istore_1
1、首先执行第一条语句,PC寄存器指向的是0,也就是指令地址为0,然后使用bipush让操作数15入操作数栈。
2、执行完后,PC寄存器往下移,指向下一行代码,下一行代码就是将操作数栈的元素存储到局部变量表1的位置(istore_1),我们可以看到局部变量表的已经增加了一个元素。并且操作数栈为空了
3、然后PC下移,指向的是下一行。让操作数8也入栈,同时执行store操作,存入局部变量表中
4、然后从局部变量表中,依次将数据放在操作数栈中,等待执行 add 操作
iload_1:取出局部变量表中索引为1的数据入操作数栈
iload_2:取出局部变量表中索引为2的数据入操作数栈
5、然后将操作数栈中的两个元素执行相加操作,并存储在局部变量表3的位置
iadd:相加操作数栈中的两个元素
istore_3:存到局部变量表的索引3的位置
关于类型转换的说明
能byte就bipush,能short就sipush
如果被调用的方法带有返回值,返回值入操作数栈
public int getSum(){ int m = 10; int n = 20; int k = m + n; return k; } public void testGetSum(){ //获取上一个栈桢返回的结果,并保存在操作数栈中 int i = getSum(); int j = 10; }
getSum() 方法字节码指令:最后带着个 ireturn
testGetSum() 方法字节码指令:aload_0是加载的this变量,然后invokevirtual执行的是this的getSum方法,istore_1将方法的返回值存储到局部变量表的1位置。
栈顶缓存技术:Top Of Stack Cashing 《深入理解JAVA虚拟机》p329中间有提到
前面提过,基于栈式架构的虚拟机所使用的零地址指令更加紧凑,但完成一项操作的时候必然需要使用更多的入栈和出栈指令,这同时也就意味着将需要更多的指令分派(instruction dispatch)次数(也就是你会发现指令很多)和导致内存读/写次数多,效率不高。
由于操作数是存储在内存中的,因此频繁地执行内存读/写操作必然会影响执行速度。为了解决这个问题,HotSpot JVM的设计者们提出了栈顶缓存(Tos,Top-of-Stack Cashing)技术,将栈顶元素全部缓存在物理CPU的寄存器中,以此降低对内存的读/写次数,提升执行引擎的执行效率。
寄存器的主要优点:指令更少,执行速度快,但是指令集(也就是指令种类)很多
动态链接(或指向运行时常量池的方法引用)
每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接(Dynamic Linking),比如:invokedynamic指令
在Java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用(Symbolic Reference)保存在class文件的常量池里。比如:描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用
所以在栈帧里面动态链接究竟是个啥?是一个地址吗?
我觉着就是一个地址,这个地址存着属于该栈帧在运行时常量池的方法引用的地址,拿着这个地址就能在常量池中找到属于该栈帧的方法的引用(如#2,#3究竟代表着什么地址)。
那什么时机将这些符号引用替换成直接引用呢?
动态链接只是找到了这些符号引用,invokevirtual指令才是真正的去替换成直接引用。见下文重写的本质那里。
JVM里的符号引用如何存储?https://www.zhihu.com/question/30300585
https://www.zhihu.com/question/50258991
回答一:符号引用就是字符串,这个字符串包含足够的信息,以供实际使用时可以找到相应的位置。你比如说某个方法的符号引用,如:“java/io/PrintStream.println:(Ljava/lang/String;)V”。里面有类的信息,方法名,方法参数等信息。
当第一次运行时,要根据字符串的内容,到该类的方法表中搜索这个方法。运行一次之后,符号引用会被替换为直接引用,下次就不用搜索了。直接引用就是偏移量,通过偏移量虚拟机可以直接在该类的内存区域中找到方法字节码的起始位置。
回答二:总结了下:第一次运行的时候,发现指令没有被解析,根据指令去把常量池中有关系的所有项找出来,得到以“UTF-8”编码描述的此方法所属的“类,方法名,描述符”的常量池项,这就是“符号引用”。
之后根据这些信息去对应类的方法表里寻找对应的方法,得到方法表的偏移量(指针),这个偏移量(指针)就是“直接引用”,再将偏移量赋给常量池项#2(根据指令,在常量池里找到的第一个项)。 最后再将指令修改为:invokevirtual_quick,并把操作数修改成指向方法表的偏移量(指针), 并加上参数个数。
最后说下我对“多态”实现的理解,依据的是方法表实现原理,由父类得到想要调用的方法在方法表里的偏移量(解析过程),这个偏移量由父类虚方法表得到的,子类继承父类也必然有此方法(private、static修饰的除外),并且对于继承的方法,在子、父类虚方法表中偏移量是相同的(这个是多态实现的关键),并且,如果子类重写了该方法则会覆盖继承的方法(偏移量不变)。解析完成之后,符号引用替换成直接引用。然后开始实际调用,由传入的实际指向this来确定方法的接收者(receiver)动态绑定(分派)具体对象的类型(因为是多态,所以指向的是子类对象的类型),继而找到方法区里子类的方法表,根据父类方法表对应的该方法的偏移量找到子类方法表对应的方法,实现多态性。多态性:一个方法,不同的实现(一个接口,多种实现)。在子、父类方法表中偏移量是相同的(这个是多态实现的关键)!!
朱永泰理解:每个我们新建的java文件编译后就是一个.class。一般我们举例或者平常写代码,都是一个java文件里面实现一个类,然后这个文件被编译成.class文件。然后当我们使用这个java类的时候,就会启动类加载流程,对这个.class进行(加载、链接(验证、准备、解析)、初始化)。所以在链接阶段,就会用到java虚拟机栈,那么就会用到操作数栈,所以其实这些流程都是并行的,并不是上下级的关系。
在编译的时候一个每个java类都会被编译成一个class文件,但在编译的时候虚拟机并不知道所引用类的地址,多以就用符号引用来代替,而在这个解析阶段就是为了把这个符号引用转化成为真正的地址的阶段。
深入理解JVM虚拟机在P301页说,Class文件的编译过程中不包含传统程序语言编译的连接步骤,一切方法的调用在Class文件里面存储的都只是符号引用,而不是方法在实际运行时内存布局中的入口地址(也就是直接引用)。这个特性给java带来了更强大的动态扩展能力,但也使得java方法调用过程变得相对复杂,某些调用需要在类加载期间,甚至到运行期间才能确定目标方法的直接引用。
public class DynamicLinkingTest { int num = 10; public void methodA(){ System.out.println("methodA()...."); } public void methodB(){ System.out.println("methodB()...."); methodA(); num++; }}
对应字节码
Classfile /F:/IDEAWorkSpaceSourceCode/JVMDemo/out/production/chapter05/com/atguigu/java1/DynamicLinkingTest.class Last modified 2020-11-10; size 712 bytes MD5 checksum e56913c945f897c7ee6c0a608629bca8 Compiled from "DynamicLinkingTest.java"public class com.atguigu.java1.DynamicLinkingTest minor version: 0 major version: 52 flags: ACC_PUBLIC, ACC_SUPERConstant pool: #1 = Methodref #9.#23 // java/lang/Object."":()V #2 = Fieldref #8.#24 // com/atguigu/java1/DynamicLinkingTest.num:I #3 = Fieldref #25.#26 // java/lang/System.out:Ljava/io/PrintStream; #4 = String #27 // methodA().... #5 = Methodref #28.#29 // java/io/PrintStream.println:(Ljava/lang/String;)V #6 = String #30 // methodB().... #7 = Methodref #8.#31 // com/atguigu/java1/DynamicLinkingTest.methodA:()V #8 = Class #32 // com/atguigu/java1/DynamicLinkingTest #9 = Class #33 // java/lang/Object #10 = Utf8 num #11 = Utf8 I #12 = Utf8 #13 = Utf8 ()V #14 = Utf8 Code #15 = Utf8 LineNumberTable #16 = Utf8 LocalVariableTable #17 = Utf8 this #18 = Utf8 Lcom/atguigu/java1/DynamicLinkingTest; #19 = Utf8 methodA #20 = Utf8 methodB #21 = Utf8 SourceFile #22 = Utf8 DynamicLinkingTest.java #23 = NameAndType #12:#13 // "":()V #24 = NameAndType #10:#11 // num:I #25 = Class #34 // java/lang/System #26 = NameAndType #35:#36 // out:Ljava/io/PrintStream; #27 = Utf8 methodA().... #28 = Class #37 // java/io/PrintStream #29 = NameAndType #38:#39 // println:(Ljava/lang/String;)V #30 = Utf8 methodB().... #31 = NameAndType #19:#13 // methodA:()V #32 = Utf8 com/atguigu/java1/DynamicLinkingTest #33 = Utf8 java/lang/Object #34 = Utf8 java/lang/System #35 = Utf8 out #36 = Utf8 Ljava/io/PrintStream; #37 = Utf8 java/io/PrintStream #38 = Utf8 println #39 = Utf8 (Ljava/lang/String;)V{ int num; descriptor: I flags: public com.atguigu.java1.DynamicLinkingTest(); descriptor: ()V flags: ACC_PUBLIC Code: stack=2, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."":()V 4: aload_0 5: bipush 10 7: putfield #2 // Field num:I 10: return LineNumberTable: line 7: 0 line 9: 4 LocalVariableTable: Start Length Slot Name Signature 0 11 0 this Lcom/atguigu/java1/DynamicLinkingTest; public void methodA(); descriptor: ()V flags: ACC_PUBLIC Code: stack=2, locals=1, args_size=1 0: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream; 3: ldc #4 // String methodA().... 5: invokevirtual #5 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 8: return LineNumberTable: line 12: 0 line 13: 8 LocalVariableTable: Start Length Slot Name Signature 0 9 0 this Lcom/atguigu/java1/DynamicLinkingTest; public void methodB(); descriptor: ()V flags: ACC_PUBLIC Code: stack=3, locals=1, args_size=1 0: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream; 3: ldc #6 // String methodB().... 5: invokevirtual #5 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 8: aload_0 9: invokevirtual #7 // Method methodA:()V 12: aload_0 13: dup 14: getfield #2 // Field num:I 17: iconst_1 18: iadd 19: putfield #2 // Field num:I 22: return LineNumberTable: line 16: 0 line 18: 8 line 20: 12 line 21: 22 LocalVariableTable: Start Length Slot Name Signature 0 23 0 this Lcom/atguigu/java1/DynamicLinkingTest;}SourceFile: "DynamicLinkingTest.java"
1、在字节码指令中,methodB() 方法中通过 invokevirtual #7 指令调用了方法 A ,那么 #7 是个啥呢?
2、往上面翻,找到常量池的定义:#7 = Methodref #8.#31
#8 = Class #32
:去找 #32#32 = Utf8 com/atguigu/java1/DynamicLinkingTest
DynamicLinkingTest
这个类#31 = NameAndType #19:#13
:去找 #19 和 #13#19 = Utf8 methodA
:方法名为 methodA#13 = Utf8 ()V
:方法没有形参,返回值为 void3、结论:通过 #7 我们就能找到需要调用的 DynamicLinkingTest类的methodA() 方法,并进行调用
4、在上面,其实还有很多符号引用,比如 Object、System、PrintStream 等等
运行时常量池在方法区里,方法区是所有线程共享的数据区。其实方法区是逻辑划分,字符串常量和静态类型变量真正的存在是在堆中。
为什么要用常量池呢?
深入理解JVM虚拟机在P301页说,Class文件的编译过程中不包含传统程序语言编译的连接步骤,一切方法的调用在Class文件里面存储的都只是符号引用,而不是方法在实际运行时内存布局中的入口地址(也就是直接引用)。这个特性给java带来了更强大的动态扩展能力,但也使得java方法调用过程变得相对复杂,某些调用需要在类加载期间,甚至到运行期间才能确定目标方法的直接引用。
在JVM中,将符号引用转换为调用方法的直接引用与方法的绑定机制相关
当一个字节码文件被装载进JVM内部时,如果被调用的目标方法在编译期确定,且运行期保持不变时,这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接
如果被调用的方法在编译期无法被确定下来,也就是说,只能够在程序运行期将调用的方法的符号转换为直接引用,由于这种引用转换过程具备动态性,因此也被称之为动态链接。
静态链接与动态链接针对的是方法。早期绑定和晚期绑定范围更广(比如绑定值?)。早期绑定涵盖了静态链接,晚期绑定涵盖了动态链接。
静态链接和动态链接对应的方法的绑定机制为:早期绑定(Early Binding)和晚期绑定(Late Binding)。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程,这仅仅发生一次。
早期绑定就是指被调用的目标方法如果在编译期可知,且运行期保持不变时,即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。
如果被调用的方法在编译期无法被确定下来,只能够在程序运行期根据实际的类型绑定相关的方法,这种绑定方式也就被称之为晚期绑定。
class Animal { public void eat() { System.out.println("动物进食"); }}interface Huntable { void hunt();}class Dog extends Animal implements Huntable { @Override public void eat() { System.out.println("狗吃骨头"); } @Override public void hunt() { System.out.println("捕食耗子,多管闲事"); }}class Cat extends Animal implements Huntable { public Cat() { super();//表现为:早期绑定 } public Cat(String name) { this();//表现为:早期绑定 } @Override public void eat() { super.eat();//表现为:早期绑定 System.out.println("猫吃鱼"); } @Override public void hunt() { System.out.println("捕食耗子,天经地义"); }}public class AnimalTest { public void showAnimal(Animal animal) { animal.eat();//表现为:晚期绑定 } public void showHunt(Huntable h) { h.hunt();//表现为:晚期绑定 }}
部分字节码
{ public com.atguigu.java2.AnimalTest(); descriptor: ()V flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."":()V 4: return LineNumberTable: line 54: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lcom/atguigu/java2/AnimalTest; public void showAnimal(com.atguigu.java2.Animal); descriptor: (Lcom/atguigu/java2/Animal;)V flags: ACC_PUBLIC Code: stack=1, locals=2, args_size=2 0: aload_1 1: invokevirtual #2 // Method com/atguigu/java2/Animal.eat:()V 4: return LineNumberTable: line 56: 0 line 57: 4 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lcom/atguigu/java2/AnimalTest; 0 5 1 animal Lcom/atguigu/java2/Animal; public void showHunt(com.atguigu.java2.Huntable); descriptor: (Lcom/atguigu/java2/Huntable;)V flags: ACC_PUBLIC Code: stack=1, locals=2, args_size=2 0: aload_1 1: invokeinterface #3, 1 // InterfaceMethod com/atguigu/java2/Huntable.hunt:()V 6: return LineNumberTable: line 60: 0 line 61: 6 LocalVariableTable: Start Length Slot Name Signature 0 7 0 this Lcom/atguigu/java2/AnimalTest; 0 7 1 h Lcom/atguigu/java2/Huntable;}SourceFile: "AnimalTest.java"
invokevirtual 体现为晚期绑定
invokeinterface 也体现为晚期绑定
invokespecial 体现为早期绑定
随着高级语言的横空出世,类似于Java一样的基于面向对象的编程语言如今越来越多,尽管这类编程语言在语法风格上存在一定的差别,但是它们彼此之间始终保持着一个共性,那就是都支持封装、继承和多态等面向对象特性,既然这一类的编程语言具备多态特性,那么自然也就具备早期绑定和晚期绑定两种绑定方式。
Java中任何一个普通的方法其实都具备虚函数的特征,它们相当于C++语言中的虚函数(C++中则需要使用关键字virtual来显式定义)。如果在Java程序中不希望某个方法拥有虚函数的特征时,则可以使用关键字final来标记这个方法。
虚方法与非虚方法的区别
子类对象的多态的使用前提:
虚拟机中调用方法的指令
方法、私有及父类方法,解析阶段确定唯一方法版本。非虚方法invokedynamic:动态解析出需要调用的方法,然后执行
前四条指令固化在虚拟机内部,方法的调用执行不可人为干预。而invokedynamic指令则支持由用户确定方法版本。其中invokestatic指令和invokespecial指令调用的方法称为非虚方法,其余的(final修饰的除外)称为虚方法。
class Father { public Father() { System.out.println("father的构造器"); } public static void showStatic(String str) { System.out.println("father " + str); } public final void showFinal() { System.out.println("father show final"); } public void showCommon() { System.out.println("father 普通方法"); }}public class Son extends Father { public Son() { //invokespecial super(); } public Son(int age) { //invokespecial this(); } //不是重写的父类的静态方法,因为静态方法不能被重写! public static void showStatic(String str) { System.out.println("son " + str); } private void showPrivate(String str) { System.out.println("son private" + str); } public void show() { //invokestatic showStatic("atguigu.com"); //invokestatic super.showStatic("good!"); //invokespecial showPrivate("hello!"); //invokespecial super.showCommon(); //invokevirtual showFinal();//因为此方法声明有final,不能被子类重写,所以也认为此方法是非虚方法。 //虚方法如下: /* invokevirtual 你没有显示的加super.,编译器认为你可能调用子类的showCommon(即使son子类没有重写,也 会认为),所以编译期间确定不下来,就是虚方法。 */ showCommon(); info(); MethodInterface in = null; //invokeinterface in.methodA(); } public void info() { } public void display(Father f) { f.showCommon(); } public static void main(String[] args) { Son so = new Son(); so.show(); }}interface MethodInterface { void methodA();}
Son 类中 show() 方法的字节码指令如下
JVM字节码指令集一直比较稳定,一直到Java7中才增加了一个invokedynamic指令,这是Java为了实现【动态类型语言】支持而做的一种改进。
但是在Java7中并没有提供直接生成invokedynamic指令的方法,需要借助ASM这种底层字节码工具来产生invokedynamic指令。直到Java8的Lambda表达式的出现,invokedynamic指令的生成,在Java中才有了直接的生成方式。
Java7中增加的动态语言类型支持的本质是对Java虚拟机规范的修改,而不是对Java语言规则的修改,这一块相对来讲比较复杂,增加了虚拟机中的方法调用,最直接的受益者就是运行在Java平台的动态语言的编译器。
@FunctionalInterfaceinterface Func { public boolean func(String str);}public class Lambda { public void lambda(Func func) { return; } public static void main(String[] args) { Lambda lambda = new Lambda(); Func func = s -> { //右边看似是实现了接口的一个对象,但是具体是实现接口的哪一个实现类的对象,我们不知道,必须在运行时才能确定 //此处是根据括号里实现什么方法,也就是说明Func的哪一个具体的实现类,才能确定s是什么类型 return true; }; lambda.lambda(func); lambda.lambda(s -> { return true; }); }}
动态类型语言和静态类型语言两者的区别就在于对类型的检查是在编译期还是在运行期,满足前者就是静态类型语言,反之是动态类型语言。
说的再直白一点就是,静态类型语言是判断变量自身的类型信息;动态类型语言是判断变量值的类型信息,变量没有类型信息,变量值才有类型信息,这是动态语言的一个重要特征。
Java:String info = “mogu blog”; (Java是静态类型语言的,会先编译就进行类型检查)
JS:var name = “shkstart”; var name = 10; (运行时才进行检查)
Python: info = 130.5 (运行时才检查)
正是因为invokevirtual指令执行的第一步就是在运行期确定接收者的实际类型,所以两次调用中的invokevirtual指令并不是把常量池中的符号引用解析到直接引用就结束了,还会根据方法接受者的实际类型来选择方法版本,这个过程就是java中的方法重写的本质。
多态性根源就是虚方法调用指令invokevirtual的执行逻辑:
上面这个过程称为动态分派
IllegalAccessError介绍
解析只能是静态的,分派可能是静态的也可能是动态的。说白了分派就是确定了究竟应该解析哪个目标。解析就是把符号引用转换为直接引用(还有其他的操作)。所以分派是动态的也可能是静态的,但是解析就是静态的,因为分派已经把目标选好了。
静态分派:静态方法在编译期确定、类加载期间解析。但是静态方法也会有重载,那么选择重载的过程是通过静态分派完成的。分派就是确定了究竟应该解析哪个目标。静态分派就是在编译期间去确定这个方法应该是哪一个类的哪一个方法,然后静态解析再去把符号引用转换为这个方法的直接引用。
将符号引用转为直接引用。
类加载阶段的解析是连接阶段的最后一步,连接的目的是将经读入到内存的类的二进制数据合并到虚拟机的运行时环境中去,解析过程就是为了达成这个目的。
运行期的解析是为了将动态分派期间确定的方法接收者的数据合并到内存中
确定方法的接收者。
静态分派:编译期间确定方法的接收者。在类加载阶段解析。
动态分派:运行期间确定方法的接收者。在运行期第一次使用时解析。
类加载或者运行期 (虚拟机)
解析的前提是编译器确定,不是发生在编译期
编译期 (编译器)
运行期 (虚拟机)。
动态分派的实现是通过虚方法表
静态分派[编译期] -> 解析[类加载]
动态分派[运行期] -> 解析[运行期]
静态分派和动态分派可以同时存在,也就是编译期间进行了静态分派,但是运行时可能会重新动态分配。见深入理解JVM虚拟机p313
在面向对象的编程中,会很频繁的使用到动态分派,如果在每次动态分派的过程中都要重新在类的方法元数据中搜索合适的目标的话就可能影响到执行效率。因此,为了提高性能,JVM采用在类的方法区建立一个虚方法表(virtual method table)来实现,非虚方法不会出现在表中。使用索引表来代替查找。【上面动态分派的过程,我们可以看到如果子类找不到,还要从下往上找其父类,非常耗时】
每个类中都有一个虚方法表,表中存放着各个方法的实际入口。
虚方法表是什么时候被创建的呢?虚方法表会在类加载的链接阶段被创建并开始初始化,类的变量初始值准备完成之后,JVM会把该类的虚方法表也初始化完毕。
例子1
如图所示:如果类中重写了方法,那么调用的时候,就会直接在该类的虚方法表中查找
1、比如说son在调用toString的时候,Son没有重写过,Son的父类Father也没有重写过,那就直接调用Object类的toString。那么就直接在虚方法表里指明toString直接指向Object类。
2、下次Son对象再调用toString就直接去找Object,不用先找Son–>再找Father–>最后才到Object的这样的一个过程。
例子2
在一些帖子里,方法返回地址、动态链接、一些附加信息 也叫做帧数据区
存放调用该方法的pc寄存器的值。一个方法的结束,有两种方式:
无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。方法正常退出时,调用者的pc计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。而通过异常退出的,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。
本质上,方法的退出就是当前栈帧出栈的过程。此时,需要恢复上层方法的局部变量表、操作数栈、将返回值压入调用者栈帧的操作数栈、设置PC寄存器值等,让调用者方法继续执行下去。
正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。
所以方法返回地址就是调用者的PC计数器的值
方法退出的两种方式
当一个方法开始执行后,只有两种方式可以退出这个方法,
正常退出:
ireturn:当返回值是boolean,byte,char,short和int类型时使用
lreturn:Long类型
freturn:Float类型
dreturn:Double类型
areturn:引用类型
return:返回值类型为void的方法、实例初始化方法、类和接口的初始化方法
异常退出:
如果是4-16行(字节码行数)出现异常,就去19行处理,任意类型异常。
异常处理表:
栈帧中还允许携带与Java虚拟机实现相关的一些附加信息。例如:对程序调试提供支持的信息。
SOF(StackOverflowError),栈大小分为固定的,和动态变化。如果是固定的就可能出现StackOverflowError。如果是动态变化的,内存不足时就可能出现OOM(OutOfMemoryError)
不能保证不溢出,只能保证SOF出现的几率小
不是,一定时间内降低了OOM概率,但是会挤占其它的线程空间,因为整个虚拟机的内存空间是有限的
不会
位置 | 是否有Error | 是否存在GC |
---|---|---|
PC计数器 | 无 | 不存在 |
虚拟机栈 | 有,SOF | 不存在 |
本地方法栈(在HotSpot的实现中和虚拟机栈一样) | ||
堆 | 有,OOM | 存在 |
方法区 | 有 | 存在 |
具体问题具体分析
具体问题具体分析:
/**
* 面试题:
* 方法中定义的局部变量是否线程安全?具体情况具体分析
*
* 何为线程安全?
* 如果只有一个线程才可以操作此数据,则必是线程安全的。
* 如果有多个线程操作此数据,则此数据是共享数据。如果不考虑同步机制的话,会存在线程安全问题。
*/
public class StringBuilderTest {
int num = 10;
//s1的声明方式是线程安全的(只在方法内部用了)
public static void method1(){
//StringBuilder:线程不安全
StringBuilder s1 = new StringBuilder();
s1.append("a");
s1.append("b");
//...
}
//sBuilder的操作过程:是线程不安全的(作为参数传进来,可能被其它线程操作)
public static void method2(StringBuilder sBuilder){
sBuilder.append("a");
sBuilder.append("b");
//...
}
//s1的操作:是线程不安全的(有返回值,可能被其它线程操作)
public static StringBuilder method3(){
StringBuilder s1 = new StringBuilder();
s1.append("a");
s1.append("b");
return s1;
}
//s1的操作:是线程安全的(s1自己消亡了,最后返回的智商s1.toString的一个新对象)
public static String method4(){
StringBuilder s1 = new StringBuilder();
s1.append("a");
s1.append("b");
return s1.toString();
}
public static void main(String[] args) {
StringBuilder s = new StringBuilder();
new Thread(() -> {
s.append("a");
s.append("b");
}).start();
method2(s);
}
}