我所知道JVM虚拟机之运行时数据区的虚拟机栈

前言

上篇文章介绍了运行时数据区的概述、以及PC寄存器,这篇文章介绍的是虚拟机栈

一、虚拟机栈的概述


虚拟机栈出现的背景

================================

我们知道Java虚拟机是基于栈的一种设计架构,优点是跨平台指令集小编译器容易实现,缺点是性能下降,实现同样的功能需要更多的指令

因为跨平台性所以不能设计为基于寄存器的(设计成基于寄存器的,耦合度高,性能会有所提升,因为可以对具体的CPU架构进行优化,但是跨平台性大大降低

内存中的栈与堆

================================

栈是运行时的单位,而堆是存储的单位

  • 栈解决程序的运行问题,即程序如何执行,或者说如何处理数据。
  • 堆解决的是数据存储的问题,即数据怎么放,放哪里

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第1张图片

可以看看以下这幅图有点形象的意思

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第2张图片

虚拟机栈基本内容

================================

Java虚拟机栈(Java Virtual Machine Stack),早期也叫Java栈。

每个线程在创建时都会创建一个虚拟机栈,其内部保存一个个的栈帧(Stack Frame),对应着一次次的Java方法调用,栈是线程私有的

我们使用一个示例体会一下

public class StackTest {

    public void methodA() {
        int i = 10;
        int j = 20;
        methodB();
    }

    public void methodB(){
        int k = 30;
        int m = 40;
    }
    
    public static void main(String[] args) {
        StackTest test = new StackTest();
        test.methodA();
    }
}

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第3张图片

而虚拟机栈呢是随着线程创建而创建的,所以它的生命周期也就是线程结束了,该虚拟机栈也销毁了

它主管着Java程序的运行,保存方法的局部变量、部分结果、并参与方法的调用和返回

虚拟机栈的特点

================================

因为栈是一种快速有效的分配存储方式,访问速度仅次于程序计数器。

所以JVM直接对Java栈的操作只有两个

  • 每个方法执行,伴随着进栈(入栈、压栈)
  • 执行结束后的出栈工作

所以对于栈来说不存在垃圾回收问题(不需要GC),但是可能存在OOM

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第4张图片

面试题:开发中遇见的异常有哪些?

================================

思路:可以提到开发中的问题、框架的问题、以及JVM虚拟机的内存溢出等等

我们这里说明一下:栈中可能出现的异常

Java 虚拟机规范允许Java栈的大小是动态的或者是固定不变的

如果采用固定大小的Java虚拟机栈,那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。

如果线程请求分配的栈容量超过Java虚拟机栈允许的最大容量,Java虚拟机将会抛出一个StackoverflowError 异常

如果Java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,那Java虚拟机将会抛出一个 OutofMemoryError 异常

我们通过例子演示一下StackoverflowError这个异常情况

public class StackErrorTest {
    public static void main(String[] args) {
        main(args);
    }
}
//运行结果如下:
Exception in thread "main" java. lang.]StackOverflowError
atcom.atguigu.java.StackErrorTest.main(StackErrorTest. java:11)

这种自己调自己的情况很容易出现StackoverflowError这个异常情况

那么我们说允许Java栈的大小是动态的或者是固定不变的,那么如何设置栈的大小呢?

我们可以使用参数 -Xss 选项来设置线程的最大栈空间,栈的大小直接决定了函数调用的最大可达深度。

以下是一个官方的规范说明:

-Xss size

Sets the thread stack size (in bytes). Append the letter k or K to indicate KB,
m or M to indicate MB, and g or G to indicate GB. The default value depends on the platform:

Linux/x64 (64-bit): 1024 KB
macOS (64-bit): 1024 KB
Oracle Solaris/x64 (64-bit): 1024 KB
Windows: The default value depends on virtual memory

接下来我们在刚刚的示例上演示一下我们现在的栈是多少大小

public class StackErrorTest {
    private static int count = 1;
    public static void main(String[] args) {
        System.out.println(count);
        count++;
        main(args);
    }
}
//运行结果如下:
1
....
11420
Exception in thread "main" java. lang.]StackOverflowError

当我们打印到11420的时候就出现异常了,这说明默认情况下大小为11420,接下来我们设置一下大小

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第5张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第6张图片

这时我们再运行起方法就可以看到我们修改了栈的大小容量了

public class StackErrorTest {
    private static int count = 1;
    public static void main(String[] args) {
        System.out.println(count);
        count++;
        main(args);
    }
}
//运行结果如下:
1
....
2465
Exception in thread "main" java. lang.]StackOverflowError

二、虚拟机栈的存储单位


栈中存储什么呢?

================================

每个线程都有自己的栈,栈中的数据都是以栈帧(Stack Frame)的格式存在

在这个线程上正在执行的每个方法都各自对应一个栈帧(Stack Frame)

栈帧是一个内存区块是一个数据集,维系着方法执行过程中的各种数据信息。

栈运行原理

================================

JVM直接对Java栈的操作只有两个,就是对栈帧的压栈和出栈,遵循先进后出(后进先出)原则

在一条活动线程中一个时间点上,只会有一个活动的栈帧。

即只有当前正在执行的方法的栈帧(栈顶栈帧)是有效的,它被称为当前栈帧(Current Frame)

与当前栈帧相对应的方法就是当前方法(Current Method),定义这个方法的类就是当前类(Current Class)

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第7张图片

而我们执行引擎运行的所有字节码指令只针对当前栈帧进行操作,即操作那个方法就那个有效

若在一个方法中调用了其他方法,对应的新的栈帧会被创建出来,放在栈的顶端,成为新的当前帧。

栈桢的内部结构

================================

上面我们说了栈的基本存储结构是栈桢还熟悉了栈的执行原理 那么我们思考一下:栈桢里有啥呢?

首先我们先介绍一下栈桢中存储了些什么?主要分成以下几部分

  • 局部变量表(Local Variables)
  • 操作数栈(Operand Stack)(或表达式栈)
  • 动态链接(Dynamic Linking)(或指向运行时常量池的方法引用)
  • 方法返回地址(Return Address)(或方法正常退出或者异常退出的定义)
  • 一些附加信息

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第8张图片

我们前面说到一个栈可以设置固定大小或者动态扩展,那么栈到底能放多少栈桢呢?取决于栈桢大小

而栈桢的大小又是什么因数决定的呢?取决于这几个部分,主要是局部变量表与操作数栈

我们现在看到的是单线程下的情况,我们可以看看多个线程下是怎么样的?

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第9张图片

因为我们前面提到每个线程下的栈都是私有的,所以有自己各自的栈并且每个栈里面都有很多栈帧

三、栈桢的局部变量表


刚刚在上面介绍了栈桢大致由几种部分组成:局部变量表、操作数栈、动态链接、方法返回地、一些附加信息

我们现在就从局部变量表开始了解这个栈桢的内部结构

局部变量表介绍

================================

局部变量表也被称之为局部变量数组或本地变量表

其实是定义为一个数字数组主要用于存储方法参数和定义在方法体内的局部变量,这些数据类型包括各类基本数据类型、对象引用(reference),以及returnAddress返回值类型

由于局部变量表是建立在线程的栈上是线程的私有数据,因此不存在数据安全问题

局部变量表所需的容量大小是在编译期确定下来的,并保存在方法的Code属性的maximum local variables数据项中。在方法运行期间是不会改变局部变量表的大小

关于编译期确定下来这件事情呢,我们可以使用示例来体会与验证一下

public class LocalVariablesTest {

    private int count = 0;

    public static void main(String[] args) {
        LocalVariablesTest test = new LocalVariablesTest();
        int num = 10;
        test.test1();
    }
    
    public void test1() {
        Date date = new Date();
        String name1 = "atguigu.com";
        System.out.println(date + name1);
    }
}

然后我们再通过字节码的观察一下是否是在编译期确定下来大小

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第10张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第11张图片

以及方法嵌套调用的次数由栈的大小决定。一般来说,栈越大,方法嵌套调用次数越多

  • 对一个函数而言,它的参数和局部变量越多,使得局部变量表膨胀,它的栈帧就越大,以满足方法调用所需传递的信息增大的需求
  • 进而函数调用就会占用更多的栈空间,导致其嵌套调用次数就会减少

并且局部变量表中的变量只在当前方法调用中有效

  • 在方法执行时,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程
  • 当方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁

为了对局部变量表有一个更清楚的理解,我们直接用jclasslib来看字节码,以main方法为例来讲解。

我们通过插件可以打开这个类观看具体的Code里的信息

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第12张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第13张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第14张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第15张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第16张图片

局部变量表存储单位

================================

在局部变量表,最基本的存储单元是Slot(变量槽)

而参数值的存放总是从局部变量数组索引 0 的位置开始,到数组长度-1的索引结束

在局部变量表里,32位以内的类型只占用一个slot (包括returnAddress类型),64位的类型(long和double)占用两个slot。

  • byte、short、char在储存前辈转换为int,boolean也被转换为int,0表示false,非0表示true
  • long和double则占据两个slot

JVM会为局部变量表中的每一个Slot都分配一个访问索引,通过这个索引即可成功访问到局部变量表中指定的局部变量值

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第17张图片

当一个实例方法被调用的时候,它的方法参数和方法体内部定义的局部变量将会按照顺序被复制到局部变量表中的每一个slot上

如果当前帧是由构造方法或者实例方法创建的,那么该对象引用this将会存放在index为0的slot处,其余的参数按照参数表顺序继续排列。(this也相当于一个变量)

我们可以使用代理示例体会一下this这个变量

public void test3() {
   this.count++;
}

接着我们运行插件查看这个类的字节码与test3这个方法的局部变量表

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第18张图片

所以当我们能在构造方法与方法中使用this变量是因为它存储在局部变量表,无法再static方法中使用是因为它不存在所以不能调用

关于Slot的重复利用

================================

其实栈帧中的局部变量表中的槽位是可以重用的

如果一个局部变量过了其作用域,那么在其作用域之后申明新的局部变量变就很有可能会复用过期局部变量的槽位,从而达到节省资源的目的

我们添加多一个方法在原来的类中并使用示例代码来体会一下这个意思

public void test4() {
    int a = 0;
    {
        int b = 0;
        b = a + 1;
    }
    //变量c使用之前已经销毁的变量b占据的slot的位置
    int c = a + 1;
}

按照我们的思路运行起来并且查看test4的字节码与相关信息

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第19张图片

静态变量与局部变量的对比

================================

首先我们先介绍一般有哪几种方式分变量

  • 按照数据类型分:① 基本数据类型 ② 引用数据类型
  • 按照在类中声明位置分有:成员变量、局部变量

成员变量:在使用前都经历过默认初始化赋值并且有类变量、实例变量区分

局部变量:在使用前,必须要进行显式赋值的!否则编译不通过。

//局部变量未赋值的错误示范
public void test5Temp(){
    int num;
    System.out.println(num);//错误信息:变量num 未进行初始化
}

对于类变量有两次初始化的机会

  • 一次在linking的prepare阶段给类变量默认赋值
  • 一次在initial阶段给类变量显式赋值(即静态代码块赋值)

而实例变量:随着对象的创建,会在堆空间中分配实例变量空间,并进行默认赋值

补充说明

在栈帧中,与性能调优关系最为密切的部分就是前面提到的局部变量表。在方法执行时,虚拟机使用局部变量表完成方法的传递

局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收

四、栈桢的操作数栈


每一个独立的栈帧除了包含局部变量表以外,还包含一个后进先出(Last - In - First -Out)的 操作数栈,也可以称之为表达式栈(Expression Stack)

而操作数栈,在方法执行过程中会根据字节码指令,往栈中写入数据或提取数据即入栈(push)和 出栈(pop)

  • 某些字节码指令将值压入操作数栈,其余的字节码指令将操作数取出栈。使用它们后再把结果压入栈
  • 比如:执行复制、交换、求和等操作

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第20张图片

我们根据类的示例方法代码块与字节码来看看这些信息

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第21张图片

由此可见操作数栈,主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间。

可以说操作数栈就是JVM执行引擎的一个工作区,当一个方法刚开始执行的时候,一个新的栈帧也会随之被创建出来,这时方法的操作数栈是空的

每一个操作数栈都会拥有一个明确的栈深度用于存储数值,其所需的最大深度在编译期就定义好了,保存在方法的Code属性中,为maxstack的值

可查看testAddOperation()方法的字节码查看相关信息,原locals是局部变量的深度

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第22张图片

栈中的任何一个元素都是可以任意的Java数据类型,我们之前也说过

  • 32bit的类型占用一个栈单位(槽)深度
  • 64bit的类型占用两个栈单位(槽)深度

与槽不是一样通过索引访问方式访问数据,而是只能通过标准的入栈和出栈操作来完成一次数据访问

如果被调用的方法带有返回值的话,其返回值将会被压入当前栈帧的操作数栈中,并更新PC寄存器中下一条需要执行的字节码指令

以及操作数栈中元素的数据类型必须与字节码指令的序列严格匹配,这由编译器在编译器期间进行验证,同时在类加载过程中的类检验阶段的数据流分析阶段要再次验证

另外我们说Java虚拟机的解释引擎是基于栈的执行引擎,其中的栈指的就是操作数栈

操作数栈的代码追踪

================================

我们采用刚刚示例来进行代码追踪一下刚刚上面提到操作数栈具体实现

public void testAddOperation() {
   //byte、short、char、boolean:都以int型来保存
   byte i = 15;
   int j = 8;
   int k = i + j;
}

在上面图中,我们也看到有相对应的字节码指令

 0 bipush 15
 2 istore_1
 3 bipush 8
 5 istore_2
 6 iload_1
 7 iload_2
 8 iadd
 9 istore_3
10 return

我们分析这些字节码指令哪些是操作数栈相关,哪些又与局部变量表相关

从第一步开始bipush 15,这时将15push进操作数栈(代码中byte、short、char、boolean:都以int型来保存)

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第23张图片

第二步PC寄存器往下移将操作数栈的元素存储到局部变量表1的位置,并且局部变量表的增加了一个元素,而操作数栈为空

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第24张图片

我们之前提到过因为在非静态方法,局部变量表索引为:0的位置是存放的而是this变量

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第25张图片

第三步PC寄存器下移指向的是下一行。让操作数8也入栈并且执行store操作,存入局部变量表中

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第26张图片

第四步PC寄存器往下移将操作数栈的元素存储到局部变量表2的位置,并且局部变量表的增加了一个元素,而操作数栈为空

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第27张图片

第五步从局部变量表中,依次将数据放在操作数栈中iload_1:取出索引为1,iload_2:取出索引为2
我所知道JVM虚拟机之运行时数据区的虚拟机栈_第28张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第29张图片

第六步执行iadd操作指令将操作数栈中的两个元素执行相加操作

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第30张图片

第七步PC寄存器往下移动执行istore_3,并且局部变量表的增加了一个元素,而操作数栈为空

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第31张图片

第八步由于后面没有相关操作并且也没有返回值,所以就直接返回结束操作

四、栈顶缓存技术


前面提过,基于栈式架构的虚拟机所使用的零地址指令更加紧凑,但完成一项操作的时候必然需要使用更多的入栈和出栈指令

这同时也就意味着将需要更多的指令分派(instruction dispatch)次数(也就是你会发现指令很多)和导致内存读/写次数多,效率不高

所以我们将栈顶元素全部缓存在物理CPU的寄存器中,以此降低对内存的读/写次数,提升执行引擎的执行效率

寄存器的主要优点:指令更少,执行速度快,但是指令集(也就是指令种类)很多

五、栈桢的动态链接


每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用,目的就是为了支持当前方法的代码能够实现动态链接(Dynamic Linking),比如:invokedynamic指令

在Java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用(Symbolic Reference)保存在class文件的常量池里

比如说当我们一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用

我们使用一个例子来体会一下这个动态链接

public class DynamicLinkingTest {

    int num = 10;

    public void methodA(){
        System.out.println("methodA()....");
    }
    public void methodB(){
        System.out.println("methodB()....");
        methodA();
        num++;
    }
}

这时我们运行这个类的字节码并且看看方法B调用方法A时是什么情况

public void methodB();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=3, locals=1, args_size=1
         0: getstatic     #3                  // Field java/lang/System.out:Ljava/io/PrintStream;
         3: ldc           #6                  // String methodB()....
         5: invokevirtual #5                  // Method java/io/PrintStream.println:(Ljava/lang/String;)V
         8: aload_0
         9: invokevirtual #7                  // Method methodA:()V
        12: aload_0
        13: dup
        14: getfield      #2                  // Field num:I
        17: iconst_1
        18: iadd
        19: putfield      #2                  // Field num:I
        22: return
      LineNumberTable:
        line 16: 0
        line 18: 8
        line 20: 12
        line 21: 22
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      23     0  this   Lcom/atguigu/java1/DynamicLinkingTest;
}

发现没有,我们的方法b在字节码指令中,通过 invokevirtual #7 指令调用了方法 A ,那么 #7 是个啥呢?

我们可以看看常量池里的定义是怎么定义的

Constant pool:
   #1 = Methodref          #9.#23         // java/lang/Object."":()V
   #2 = Fieldref           #8.#24         // com/atguigu/java1/DynamicLinkingTest.num:I
   #3 = Fieldref           #25.#26        // java/lang/System.out:Ljava/io/PrintStream;
   #4 = String             #27            // methodA()....
   #5 = Methodref          #28.#29        // java/io/PrintStream.println:(Ljava/lang/String;)V
   #6 = String             #30            // methodB()....
   #7 = Methodref          #8.#31         // com/atguigu/java1/DynamicLinkingTest.methodA:()V
   #8 = Class              #32            // com/atguigu/java1/DynamicLinkingTest
   #9 = Class              #33            // java/lang/Object
  #10 = Utf8               num
  #11 = Utf8               I
  #12 = Utf8               
  #13 = Utf8               ()V
  #14 = Utf8               Code
  #15 = Utf8               LineNumberTable
  #16 = Utf8               LocalVariableTable
  #17 = Utf8               this
  #18 = Utf8               Lcom/atguigu/java1/DynamicLinkingTest;
  #19 = Utf8               methodA
  #20 = Utf8               methodB
  #21 = Utf8               SourceFile
  #22 = Utf8               DynamicLinkingTest.java
  #23 = NameAndType        #12:#13        // "":()V
  #24 = NameAndType        #10:#11        // num:I
  #25 = Class              #34            // java/lang/System
  #26 = NameAndType        #35:#36        // out:Ljava/io/PrintStream;
  #27 = Utf8               methodA()....
  #28 = Class              #37            // java/io/PrintStream
  #29 = NameAndType        #38:#39        // println:(Ljava/lang/String;)V
  #30 = Utf8               methodB()....
  #31 = NameAndType        #19:#13        // methodA:()V
  #32 = Utf8               com/atguigu/java1/DynamicLinkingTest
  #33 = Utf8               java/lang/Object
  #34 = Utf8               java/lang/System
  #35 = Utf8               out
  #36 = Utf8               Ljava/io/PrintStream;
  #37 = Utf8               java/io/PrintStream
  #38 = Utf8               println
  #39 = Utf8               (Ljava/lang/String;)V

我们可以常量池的定义推演一下到底是怎么回事呢?首先我们是看看#7 = Methodref #8.#31

  • 找到#8 :#8 = Class #32
  • 找到#32 :#32 = Utf8 com/atguigu/java1/DynamicLinkingTest

结论:通过 #8 我们找到了 DynamicLinkingTest 这个类

  • 找到#31 :#31 = NameAndType #19:#13
  • 找到#19:#19 = Utf8 methodA
  • 找到#13 :#13 = Utf8 ()V

结论:通过 #7 我们就能找到需要调用的 methodA() 方法,并进行调用

在上面,其实还有很多符号引用,比如 Object、System、PrintStream 等等

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第32张图片

为什么要用常量池呢?

因为在不同的方法,都可能调用常量或者方法,所以只需要存储一份即可,然后记录其引用即可,节省了空间。

常量池的作用:就是为了提供一些符号和常量,便于指令的识别

六、方法的调用


在JVM中,将符号引用转换为调用方法的直接引用,它与方法的绑定机制相关

静态链接:

当一个字节码文件被装载进JVM内部时,如果被调用的目标方法在编译期确定,且运行期保持不变时,这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接

动态链接:

如果被调用的方法在编译期无法被确定下来,也就是说,只能够在程序运行期将调用的方法的符号转换为直接引用,由于这种引用转换过程具备动态性,因此也被称之为动态链接

那么对于对应的方法的绑定机制为:早期绑定(Early Binding) 和晚期绑定(Late Binding)

绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程,这仅仅发生一次。

早期绑定:

早期绑定就是指被调用的目标方法如果在编译期可知,且运行期保持不变时,即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。

晚期绑定:

如果被调用的方法在编译期无法被确定下来,只能够在程序运行期根据实际的类型绑定相关的方法,这种绑定方式也就被称之为晚期绑定

我们举一个例子来体会一下这种早期绑定与晚期绑定

//定义一个动物进食的父类
class Animal {
    public void eat() {
        System.out.println("动物进食");
    }
}
//定义一个捕猎的接口
interface Huntable {
    void hunt();
}

这时我们有两个动物:猫和狗,去做一些具体的事情信息

class Dog extends Animal implements Huntable {
    @Override
    public void eat() {
        System.out.println("狗吃骨头");
    }

    @Override
    public void hunt() {
        System.out.println("捕食耗子,多管闲事");
    }
}
class Cat extends Animal implements Huntable {

    @Override
    public void eat() {
        super.eat();//表现为:早期绑定
        System.out.println("猫吃鱼");
    }

    @Override
    public void hunt() {
        System.out.println("捕食耗子,天经地义");
    }
}

这时我们再创建一个Test类调用对应eat方法与hunt方法

public class AnimalTest {
    public void showAnimal(Animal animal) {
        animal.eat();//表现为:晚期绑定
    }

    public void showHunt(Huntable h) {
        h.hunt();//表现为:晚期绑定
    }
}

因为我们在编译期没有对具体的方法确定下来,只能在运行期间绑定实际的类,所以他们都是晚期绑定

我们可以查看一下字节码看看是否是这样,运行起来一起看看吧

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第33张图片

随着高级语言的横空出世,类似于Java一样的基于面向对象的编程语言如今越来越多,尽管这类编程语言在语法风格上存在一定的差别

但是它们彼此之间始终保持着一个共性,那就是都支持封装、继承和多态等面向对象特性,既然这一类的编程语言具备多态特性,那么自然也就具备早期绑定和晚期绑定两种绑定方式

而Java中任何一个普通的方法其实都具备虚函数的特征,它们相当于C++语言中的虚函数(C++中则需要使用关键字virtual来显式定义)。

如果在Java程序中不希望某个方法拥有虚函数的特征时,则可以使用关键字final来标记这个方法

虚方法与非虚方法的区别

================================

如果方法在编译期就确定了具体的调用版本,这个版本在运行时是不可变的。我们称为非虚方法。

静态方法、私有方法、final方法、实例构造器、父类方法都是非虚方法

其他方法称为虚方法

子类对象的多态的使用前提:类的继承关系、方法的重写

虚拟机中调用方法的指令

================================

 普通指令:
  • invokestatic:调用静态方法,解析阶段确定唯一方法版本
  • invokespecial:调用方法、私有及父类方法,解析阶段确定唯一方法版本
  • invokevirtual:调用所有虚方法
  • invokeinterface:调用接口方法
 动态调用指令:
  • invokedynamic:动态解析出需要调用的方法,然后执行

前四条指令固化在虚拟机内部,方法的调用执行不可人为干预

而invokedynamic指令则支持由用户确定方法版本。

其中invokestatic指令和invokespecial指令调用的方法称为非虚方法,其余的(final修饰的除外)称为虚方法

我们使用示例体会一下来区分虚方法与非虚方法,我们先创建一个父类

class Father {
    public Father() {
        System.out.println("father的构造器");
    }
    public static void showStatic(String str) {
        System.out.println("father " + str);
    }
    public final void showFinal() {
        System.out.println("father show final");
    }
    public void showCommon() {
        System.out.println("father 普通方法");
    }
}

接着创建一个子类继承这个父类

public class Son extends Father {
    public Son() {
        //invokespecial
        super();
    }

    public Son(int age) {
        //invokespecial
        this();
    }

    //不是重写的父类的静态方法,因为静态方法不能被重写!
    public static void showStatic(String str) {
        System.out.println("son " + str);
    }

    private void showPrivate(String str) {
        System.out.println("son private" + str);
    }

    public void show() {
        //invokestatic
        showStatic("atguigu.com");
        //invokestatic
        super.showStatic("good!");
        //invokespecial
        showPrivate("hello!");
        //invokespecial
        super.showCommon();

        //invokevirtual
        showFinal();//因为此方法声明有final,不能被子类重写,所以也认为此方法是非虚方法。
        //虚方法如下:
        
        /*
        invokevirtual  你没有显示的加super.,编译器认为你可能调用子类的showCommon(即使son子类没有重写,也          会认为),所以编译期间确定不下来,就是虚方法。
        */
        showCommon();
        info();

        MethodInterface in = null;
        //invokeinterface
        in.methodA();
    }

    public void info() {

    }

    public void display(Father f) {
        f.showCommon();
    }

    public static void main(String[] args) {
        Son so = new Son();
        so.show();
    }
}

interface MethodInterface {
    void methodA();
}

这时我们运行看看结果就可以看到这些方法是否为虚方法

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第34张图片

当我们在编译时确定下来的都是非虚方法,我们也可以对这个show方法运行查看字节码

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第35张图片

invokedynamic 指令

JVM字节码指令集一直比较稳定,一直到Java7中才增加了一个invokedynamic指令,这是Java为了实现【动态类型语言】支持而做的一种改进

但是在Java7中并没有提供直接生成invokedynamic指令的方法,需要借助ASM这种底层字节码工具来产生invokedynamic指令。

直到Java8的Lambda表达式的出现,invokedynamic指令的生成,在Java中才有了直接的生成方式

我们使用一个示例来体会一下这个指令

@FunctionalInterface
interface Func {
    public boolean func(String str);
}

public class Lambda {
    public void lambda(Func func) {
        return;
    }

    public static void main(String[] args) {
        Lambda lambda = new Lambda();

        Func func = s -> {
            return true;
        };

        lambda.lambda(func);

        lambda.lambda(s -> {
            return true;
        });
    }
}

这时我们运行字节码就可以看到具体的指令了

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第36张图片

七、关于动态语言和静态语言


动态类型语言和静态类型语言两者的区别就在于对类型的检查是在编译期还是在运行期,满足前者就是静态类型语言,反之是动态类型语言

静态类型语言是判断变量自身的类型信息;动态类型语言是判断变量值的类型信息,变量没有类型信息,变量值才有类型信息,这是动态语言的一个重要特征

  • Java:String info = “mogu blog”; (Java是静态类型语言的,会先编译就进行类型检查)
  • JS:var name = “shkstart”; var name = 10; (运行时才进行检查)
  • Python: info = 130.5 (运行时才检查)

八、Java语言中方法重写的本质


会找到操作数栈顶的第一个元素所执行的对象的实际类型,记作C

如果在类型C中找到与常量中的描述符合简单名称都相符的方法,则进行访问权限校验

  • 如果通过则返回这个方法的直接引用,查找过程结束
  • 如果不通过,则返回java.lang.IllegalAccessError 异常

否则,按照继承关系从下往上依次对C的各个父类进行第2步的搜索和验证过程

如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常

关于IllegalAccessError介绍

================================

程序试图访问或修改一个属性或调用一个方法,这个属性或方法,你没有权限访问。

一般的,这个会引起编译器异常。这个错误如果发生在运行时,就说明一个类发生了不兼容的改变

比如你把应该有的jar包放从工程中拿走了,或者Maven中存在jar包冲突

我们刚刚再说如果子类找不到,还要从下往上找其父类,非常耗时

因此为了提高性能,JVM采用在类的方法区建立一个虚方法表(virtual method table)来实现,非虚方法不会出现在表中

每个类中都有一个虚方法表,表中存放着各个方法的实际入口

虚方法表会在类加载的链接阶段被创建并开始初始化,类的变量初始值准备完成之后,JVM会把该类的虚方法表也初始化完毕

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第37张图片

比如说son在调用toString的时候,Son没有重写过,Son的父类Father也没有重写过,那就直接调用Object类的toString

避免了之前先找Son–>再找Father–>最后才到Object的这样的一个过程

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第38张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第39张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第40张图片

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第41张图片

九、栈桢的方法的返回地址


我所知道JVM虚拟机之运行时数据区的虚拟机栈_第42张图片

在一些帖子里,方法返回地址、动态链接、一些附加信息 也叫做帧数据区

它存放调用该方法的pc寄存器的值

一个方法的结束,有两种方式:

  • 正常执行完成
  • 出现未处理的异常,非正常退出

无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。

方法正常退出时,调用者的pc计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址

而通过异常退出的,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息

本质上,方法的退出就是当前栈帧出栈的过程。

此时,需要恢复上层方法的局部变量表、操作数栈、将返回值压入调用者栈帧的操作数栈、设置PC寄存器值等,让调用者方法继续执行下去

正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值

方法的正常退出
  • 执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值传递给上层的方法调用者,简称正常完成出口;
  • 一个方法在正常调用完成之后,究竟需要使用哪一个返回指令,还需要根据方法返回值的实际数据类型而定。

在字节码指令中,返回指令包含:

  • ireturn:当返回值是boolean,byte,char,short和int类型时使用
  • lreturn:Long类型
  • freturn:Float类型
  • dreturn:Double类型
  • areturn:引用类型
  • return:返回值类型为void的方法、实例初始化方法、类和接口的初始化方法
方法的异常退出

在方法执行过程中遇到异常(Exception),并且这个异常没有在方法内进行处理,也就是只要在本方法的异常表中没有搜索到匹配的异常处理器,就会导致方法退出,简称异常完成出口

方法执行过程中,抛出异常时的异常处理,存储在一个异常处理表,方便在发生异常的时候找到处理异常的代码

image.png

异常处理表:

反编译字节码文件,可得到 Exception table

  • from :字节码指令起始地址
  • to :字节码指令结束地址
  • target :出现异常跳转至地址为 11 的指令执行
  • type :捕获异常的类型

十、栈桢的一些附加信息


栈帧中还允许携带与Java虚拟机实现相关的一些附加信息。例如:对程序调试提供支持的信息

十一、相关面试题


举例栈溢出的情况?

SOF(StackOverflowError),栈大小分为固定的,和动态变化。如果是固定的就可能出现StackOverflowError。如果是动态变化的,内存不足时就可能出现OOM

调整栈大小,就能保证不出现溢出么?

不能保证不溢出,只能保证SOF出现的几率小

分配的栈内存越大越好么?

不是,一定时间内降低了OOM概率,但是会挤占其它的线程空间,因为整个虚拟机的内存空间是有限的

垃圾回收是否涉及到虚拟机栈?

不会

我所知道JVM虚拟机之运行时数据区的虚拟机栈_第43张图片

方法中定义的局部变量是否线程安全?
具体问题具体分析

  • 如果只有一个线程才可以操作此数据,则必是线程安全的。
  • 如果有多个线程操作此数据,则此数据是共享数据。如果不考虑同步机制的话,会存在线程安全问题。

如果对象是在内部产生,并在内部消亡,没有返回到外部,那么它就是线程安全的,反之则是线程不安全的

/**
 * 面试题:
 * 方法中定义的局部变量是否线程安全?具体情况具体分析
 *
 *   何为线程安全?
 *      如果只有一个线程才可以操作此数据,则必是线程安全的。
 *      如果有多个线程操作此数据,则此数据是共享数据。如果不考虑同步机制的话,会存在线程安全问题。
 */
public class StringBuilderTest {

    int num = 10;

    //s1的声明方式是线程安全的(只在方法内部用了)
    public static void method1(){
        //StringBuilder:线程不安全
        StringBuilder s1 = new StringBuilder();
        s1.append("a");
        s1.append("b");
        //...
    }
    //sBuilder的操作过程:是线程不安全的(作为参数传进来,可能被其它线程操作)
    public static void method2(StringBuilder sBuilder){
        sBuilder.append("a");
        sBuilder.append("b");
        //...
    }
    //s1的操作:是线程不安全的(有返回值,可能被其它线程操作)
    public static StringBuilder method3(){
        StringBuilder s1 = new StringBuilder();
        s1.append("a");
        s1.append("b");
        return s1;
    }
    //s1的操作:是线程安全的(s1自己消亡了,最后返回的智商s1.toString的一个新对象)
    public static String method4(){
        StringBuilder s1 = new StringBuilder();
        s1.append("a");
        s1.append("b");
        return s1.toString();
    }

    public static void main(String[] args) {
        StringBuilder s = new StringBuilder();


        new Thread(() -> {
            s.append("a");
            s.append("b");
        }).start();

        method2(s);

    }

}

参考资料


尚硅谷:JVM虚拟机(宋红康老师)

你可能感兴趣的:(我所知道JVM虚拟机之运行时数据区的虚拟机栈)