【JVM】类加载与字节码技术

文章目录

  • JVM-类加载与字节码技术
    • 1.类文件结构
      • 1-1 魔数
      • 1-2 版本
      • 1-3 常量池
    • 2.字节码指令
      • 2-1 javap工具
      • 2-2 图解方法执行流程
        • (1)原始 Java 代码
        • (2)编译后的字节码文件
        • (3)常量池载入运行时常量池
        • (4)方法字节码载入方法区
        • (5)main 线程开始运行,分配栈帧内存
        • (6)执行引擎开始执行字节码
      • 2-3 练习-判断结果
      • 2-4 构造方法
        • (1)cinit()V
        • (2)init()V
      • 2-5 方法调用
      • 2-6 多态的原理
      • 2-7 异常处理
        • (1)try-catch
        • (2)多个 single-catch 块的情况
        • (3)finally
        • (4)finally中的return
        • (5)finally不带return
      • 2-8 synchronized
    • 3.编译期处理
      • 3-1 默认构造器
      • 3-2 自动拆装箱
      • 3-3 泛型集合取值
      • 3-4 可变参数
      • 3-5 foreach循环
      • 3-6 switch 字符串
      • 3-7 switch 枚举
      • 3-8 枚举类
    • 4.类加载阶段
      • 4-1 加载
      • 4-2 链接
        • (1)验证
        • (2)准备
        • (3)解析
      • 4-3 初始化
        • (1)cinit方法
        • (2)发生的时机
    • 5.类加载器
      • 5-1 启动类加载器
      • 5-2 扩展类加载器
      • 5-3 双亲委派模式
      • 5-4 自定义类加载器
        • (1)使用场景
        • (2)步骤
    • 6.运行期优化
      • 6-1 即时编译
        • (1)分层编译
        • (2)方法内联

JVM-类加载与字节码技术

【JVM】类加载与字节码技术_第1张图片
本文章参考:黑马程序员JVM

1.类文件结构

一个简单的 HelloWorld.java

// HelloWorld 示例
public class HelloWorld {
     
    public static void main(String[] args) {
     
        System.out.println("hello world");
    }
}

执行 javac -parameters -d . HellowWorld.java

编译为 HelloWorld.class 得到的字节码文件是这个样子的:

0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09 
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07 
0000040 00 1c 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29 
0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e 
0000100 75 6d 62 65 72 54 61 62 6c 65 01 00 12 4c 6f 63 
0000120 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 01 
0000140 00 04 74 68 69 73 01 00 1d 4c 63 6e 2f 69 74 63 
0000160 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 6f 
0000200 57 6f 72 6c 64 3b 01 00 04 6d 61 69 6e 01 00 16 
0000220 28 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 
0000240 69 6e 67 3b 29 56 01 00 04 61 72 67 73 01 00 13 
0000260 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 
0000300 6e 67 3b 01 00 10 4d 65 74 68 6f 64 50 61 72 61 
0000320 6d 65 74 65 72 73 01 00 0a 53 6f 75 72 63 65 46 
0000340 69 6c 65 01 00 0f 48 65 6c 6c 6f 57 6f 72 6c 64
0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e 
0000400 00 1f 01 00 0b 68 65 6c 6c 6f 20 77 6f 72 6c 64 
0000420 07 00 20 0c 00 21 00 22 01 00 1b 63 6e 2f 69 74 
0000440 63 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 
0000460 6f 57 6f 72 6c 64 01 00 10 6a 61 76 61 2f 6c 61 
0000500 6e 67 2f 4f 62 6a 65 63 74 01 00 10 6a 61 76 61 
0000520 2f 6c 61 6e 67 2f 53 79 73 74 65 6d 01 00 03 6f 
0000540 75 74 01 00 15 4c 6a 61 76 61 2f 69 6f 2f 50 72 
0000560 69 6e 74 53 74 72 65 61 6d 3b 01 00 13 6a 61 76 
0000600 61 2f 69 6f 2f 50 72 69 6e 74 53 74 72 65 61 6d 
0000620 01 00 07 70 72 69 6e 74 6c 6e 01 00 15 28 4c 6a 
0000640 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 6e 67 3b 
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01 
0000700 00 07 00 08 00 01 00 09 00 00 00 2f 00 01 00 01 
0000720 00 00 00 05 2a b7 00 01 b1 00 00 00 02 00 0a 00 
0000740 00 00 06 00 01 00 00 00 04 00 0b 00 00 00 0c 00 
0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09 00 0e 00 
0001000 0f 00 02 00 09 00 00 00 37 00 02 00 01 00 00 00 
0001020 09 b2 00 02 12 03 b6 00 04 b1 00 00 00 02 00 0a 
0001040 00 00 00 0a 00 02 00 00 00 06 00 08 00 07 00 0b 
0001060 00 00 00 0c 00 01 00 00 00 09 00 10 00 11 00 00 
0001100 00 12 00 00 00 05 01 00 10 00 00 00 01 00 13 00 
0001120 00 00 02 00 14

根据 JVM 规范,类文件结构如下

u4 			 magic
u2             minor_version;    
u2             major_version;    
u2             constant_pool_count;    
cp_info        constant_pool[constant_pool_count-1];    
u2             access_flags;    
u2             this_class;    
u2             super_class;   
u2             interfaces_count;    
u2             interfaces[interfaces_count];   
u2             fields_count;    
field_info     fields[fields_count];   
u2             methods_count;    
method_info    methods[methods_count];    
u2             attributes_count;    
attribute_info attributes[attributes_count];

1-1 魔数

对应字节码文件 0~3 字节,表示它是否是【class】类型的文件

0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09

1-2 版本

对应字节码文件 4~7 字节,表示类的版本 00 34(52) 表示是 Java 8

0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09

1-3 常量池

太多,这里不便讲解,请参考官方文档:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html#jvms-6.5

2.字节码指令

2-1 javap工具

Oracle 提供了 javap 工具来反编译 class 文件

javap -v 类名.class
C:\Users\30287\IdeaProjects\paiXppLL\src\main>javap -v Main.class
Classfile /C:/Users/30287/IdeaProjects/paiXppLL/src/main/Main.class
  Last modified 2021-10-14; size 419 bytes
  MD5 checksum eda2e7897356a975438fe5899c0b4a6c
  Compiled from "Main.java"
public class main.Main
  minor version: 0
  major version: 52
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #6.#15         // java/lang/Object."":()V
   #2 = Fieldref           #16.#17        // java/lang/System.out:Ljava/io/PrintStream;
   #3 = String             #18            // hello world!
   #4 = Methodref          #19.#20        // java/io/PrintStream.println:(Ljava/lang/String;)V
   #5 = Class              #21            // main/Main
   #6 = Class              #22            // java/lang/Object
   #7 = Utf8               <init>
   #8 = Utf8               ()V
   #9 = Utf8               Code
  #10 = Utf8               LineNumberTable
  #11 = Utf8               main
  #12 = Utf8               ([Ljava/lang/String;)V
  #13 = Utf8               SourceFile
  #14 = Utf8               Main.java
  #15 = NameAndType        #7:#8          // "":()V
  #16 = Class              #23            // java/lang/System
  #17 = NameAndType        #24:#25        // out:Ljava/io/PrintStream;
  #18 = Utf8               hello world!
  #19 = Class              #26            // java/io/PrintStream
  #20 = NameAndType        #27:#28        // println:(Ljava/lang/String;)V
  #21 = Utf8               main/Main
  #22 = Utf8               java/lang/Object
  #23 = Utf8               java/lang/System
  #24 = Utf8               out
  #25 = Utf8               Ljava/io/PrintStream;
  #26 = Utf8               java/io/PrintStream
  #27 = Utf8               println
  #28 = Utf8               (Ljava/lang/String;)V
{
     
  public main.Main();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."":()V
         4: return
      LineNumberTable:
        line 13: 0

  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=1, args_size=1
         0: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
         3: ldc           #3                  // String hello world!
         5: invokevirtual #4                  // Method java/io/PrintStream.println:(Ljava/lang/String;)V
         8: return
      LineNumberTable:
        line 15: 0
        line 16: 8
}

2-2 图解方法执行流程

(1)原始 Java 代码

/**
* 演示 字节码指令 和 操作数栈、常量池的关系
*/
public class Demo3_1 {
        
	public static void main(String[] args) {
             
		int a = 10;        
		int b = Short.MAX_VALUE + 1;        
		int c = a + b;        
		System.out.println(c);   
    } 
}

(2)编译后的字节码文件

[root@localhost ~]# javap -v Demo3_1.class
Classfile /root/Demo3_1.class
Last modified Jul 7, 2019; size 665 bytes
MD5 checksum a2c29a22421e218d4924d31e6990cfc5
Compiled from "Demo3_1.java"
public class cn.itcast.jvm.t3.bytecode.Demo3_1
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #7.#26 // java/lang/Object."":()V
#2 = Class #27 // java/lang/Short
#3 = Integer 32768
#4 = Fieldref #28.#29 //
java/lang/System.out:Ljava/io/PrintStream;
#5 = Methodref #30.#31 // java/io/PrintStream.println:(I)V
#6 = Class #32 // cn/itcast/jvm/t3/bytecode/Demo3_1
#7 = Class #33 // java/lang/Object
#8 = Utf8 <init>
#9 = Utf8 ()V
#10 = Utf8 Code
#11 = Utf8 LineNumberTable
#12 = Utf8 LocalVariableTable
#13 = Utf8 this
#14 = Utf8 Lcn/itcast/jvm/t3/bytecode/Demo3_1;
#15 = Utf8 main
#16 = Utf8 ([Ljava/lang/String;)V
#17 = Utf8 args
#18 = Utf8 [Ljava/lang/String;
#19 = Utf8 a
#22 = Utf8 c
#23 = Utf8 MethodParameters
#24 = Utf8 SourceFile
#25 = Utf8 Demo3_1.java
#26 = NameAndType #8:#9 // "":()V
#27 = Utf8 java/lang/Short
#28 = Class #34 // java/lang/System
#29 = NameAndType #35:#36 // out:Ljava/io/PrintStream;
#30 = Class #37 // java/io/PrintStream
#31 = NameAndType #38:#39 // println:(I)V
#32 = Utf8 cn/itcast/jvm/t3/bytecode/Demo3_1
#33 = Utf8 java/lang/Object
#34 = Utf8 java/lang/System
#35 = Utf8 out
#36 = Utf8 Ljava/io/PrintStream;
#37 = Utf8 java/io/PrintStream
#38 = Utf8 println
#39 = Utf8 (I)V
{
     
public cn.itcast.jvm.t3.bytecode.Demo3_1();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."
<init>":()V
4: return
LineNumberTable:
line 6: 0
LocalVariableTable:
Start Length Slot Name Signature
0 5 0 this Lcn/itcast/jvm/t3/bytecode/Demo3_1;
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=4, args_size=1
0: bipush 10
2: istore_1
3: ldc #3 // int 32768
5: istore_2
6: iload_1
7: iload_2
8: iadd
9: istore_3
10: getstatic #4 // Field
java/lang/System.out:Ljava/io/PrintStream;
13: iload_3
14: invokevirtual #5 // Method
java/io/PrintStream.println:(I)V
17: return
LineNumberTable:
line 8: 0
line 9: 3
line 12: 17
LocalVariableTable:
Start Length Slot Name Signature
0 18 0 args [Ljava/lang/String;
3 15 1 a I
6 12 2 b I
10 8 3 c I
MethodParameters:
Name Flags
args
}

(3)常量池载入运行时常量池

【JVM】类加载与字节码技术_第2张图片

(4)方法字节码载入方法区

【JVM】类加载与字节码技术_第3张图片

(5)main 线程开始运行,分配栈帧内存

stack=2,locals=4) 对应操作数栈有2个空间(每个空间4个字节),局部变量表中有4个槽位

【JVM】类加载与字节码技术_第4张图片

(6)执行引擎开始执行字节码

bipush 10

  • 将一个 byte 压入操作数栈(其长度会补齐 4 个字节),类似的指令还有
    • sipush 将一个 short 压入操作数栈(其长度会补齐 4 个字节)
    • ldc 将一个 int 压入操作数栈
    • ldc2_w 将一个 long 压入操作数栈(分两次压入,因为 long 是 8 个字节)
    • 这里小的数字都是和字节码指令存在一起,超过 short 范围的数字存入了常量池

【JVM】类加载与字节码技术_第5张图片

istore 1

  • 将操作数栈栈顶元素弹出,放入局部变量表的slot 1中

【JVM】类加载与字节码技术_第6张图片

ldc #3

  • 从常量池加载 #3 数据到操作数栈
  • 注意 Short.MAX_VALUE 是 32767,所以 32768 = Short.MAX_VALUE + 1 实际是在编译期间计算好的
    【JVM】类加载与字节码技术_第7张图片

istore_2

将操作数栈中的元素弹出,放到局部变量表的2号位置
【JVM】类加载与字节码技术_第8张图片

iload1

将局部变量表中1号位置的元素放入操作数栈中

【JVM】类加载与字节码技术_第9张图片

iload2

将局部变量表中2号位置的元素放入操作数栈中

【JVM】类加载与字节码技术_第10张图片

iadd

将操作数栈中的两个元素弹出栈并相加,结果在压入操作数栈中

【JVM】类加载与字节码技术_第11张图片

istore 3

将操作数栈中的元素弹出,放入局部变量表的3号位置

【JVM】类加载与字节码技术_第12张图片

getstatic #4

在运行时常量池中找到#4,发现是一个对象

在堆内存中找到该对象,并将其引用放入操作数栈中

【JVM】类加载与字节码技术_第13张图片

iload 3

【JVM】类加载与字节码技术_第14张图片

invokevirtual 5

  • 找到常量池 #5 项
  • 定位到方法区 java/io/PrintStream.println:(I)V 方法
  • 生成新的栈帧(分配 locals、stack等)
  • 传递参数,执行新栈帧中的字节码

【JVM】类加载与字节码技术_第15张图片

  • 执行完毕,弹出栈帧
  • 清除 main 操作数栈内容

【JVM】类加载与字节码技术_第16张图片

return

  • 完成 main 方法调用,弹出 main 栈帧
  • 程序结束

2-3 练习-判断结果

Java代码:

public class Main {
     
    public static void main(String[] args) {
     
        int i = 0;
        int x = 0;
        while (i < 10) {
     
            x = x++;
            i++;
        }
        System.out.println(x); //输出为0
    }
}

分析字节码指令:

 Code:
      stack=2, locals=3, args_size=1 //操作数栈分配两个空间,局部变量表分配3个空间
         0: iconst_0 //常数0
         1: istore_1 //将常数0放入局部变量表的1号位 i=0
         2: iconst_0 //常数0
         3: istore_2 //将常数0放入局部变量表的2号位 x=0
         4: iload_1 //将局部变量表1号位的数放入操作数栈中
         5: bipush        10 //将数字10放入操作数栈
         7: if_icmpge     21 //比较操作数栈中的两个数,如果下面的数大于上面的数,就跳转到21。这里的比较是将两个数做减法。因为涉及运算操作,所以会将两个数弹出操作数栈来进行运算。运算结束后操作数栈为空
        10: iload_2 //将局部变量2号位的数放入操作数栈中,放入的值为为0
        11: iinc          2, 1 //将局部变量2号位的数加1,自增后,槽位中的值为1
        14: istore_2 //将操作数栈中的数放入到局部变量表的2号位,2号位的值又变为了0
        15: iinc          1, 1 //1号位的值自增1
        18: goto          4 //跳转到第4条指令
        21: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
        24: iload_2
        25: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
        28: return

2-4 构造方法

(1)cinit()V

Java代码:

public class Main {
     
    static int i = 10;
    static {
     
        i = 20;
    }
    static {
     
        i = 30;
    }
}

编译器会按从上至下的顺序,收集所有 static 静态代码块和静态成员赋值的代码,合并为一个特殊的方法 cinit()V

0: bipush 10
2: putstatic #2 // Field i:I
5: bipush 20
7: putstatic #2 // Field i:I
10: bipush 30
12: putstatic #2 // Field i:I
15: return

cinit()V 方法会在类加载的初始化阶段被调用

(2)init()V

Java代码:

public class Main {
     
    private String a = "s1";

    {
     
        b = 20;
    }

    private int b = 10;

    {
     
        a = "s2";
    }

    public Main(String a, int b) {
     
        this.a = a;
        this.b = b;
    }

    public static void main(String[] args) {
     
        Main d = new Main("s3", 30);
        System.out.println(d.a);//s3
        System.out.println(d.b);//30
    }    
}

编译器会按从上至下的顺序,收集所有 {} 代码块和成员变量赋值的代码,形成新的构造方法,但原始构造方法内的代码总是在后

Code:
stack=2, locals=3, args_size=3
0: aload_0
1: invokespecial #1 // super.()V
4: aload_0
5: ldc #2         // <- "s1"
7: putfield #3    // -> this.a
10: aload_0
11: bipush 20     // <- 20
13: putfield #4   // -> this.b
16: aload_0
17: bipush 10     // <- 10
19: putfield #4   // -> this.b
22: aload_0
23: ldc #5        // <- "s2"
25: putfield #3   // -> this.a
28: aload_0       // ------------------------------
29: aload_1       // <- slot 1(a) "s3"            |
30: putfield #3   // -> this.a                    |
33: aload_0                                       |
34: iload_2       // <- slot 2(b) 30              |
35: putfield #4   // -> this.b --------------------
38: return

2-5 方法调用

看一下几种不同的方法调用对应的字节码指令

package main;


public class Main {
     
    public Main() {
     

    }

    private void test1() {
     

    }

    private final void test2() {
     

    }

    public void test3() {
     

    }

    public static void test4() {
     

    }

    public static void main(String[] args) {
     
        Main m = new Main();
        m.test1();
        m.test2();
        m.test3();
        Main.test4();
    }
}

不同方法在调用时,对应的虚拟机指令有所区别:

  • 私有构造、被final修饰的方法,在调用时都使用invokespecial指令,属于静态绑定
  • 普通成员方法在调用时,使用invokevirtual指令。因为编译期间无法确定该方法的内容,只有在运行期间才能确定,属于动态绑定,即支持多态
  • 静态方法在调用时使用invokestatic指令

对应的字节码文件:

 Code:
      stack=2, locals=2, args_size=1
         0: new           #2                  // class main/Main
         3: dup
         4: invokespecial #3                  // Method "":()V
         7: astore_1
         8: aload_1
         9: invokespecial #4                  // Method test1:()V
        12: aload_1
        13: invokespecial #5                  // Method test2:()V
        16: aload_1
        17: invokevirtual #6                  // Method test3:()V
        20: invokestatic  #7                  // Method test4:()V
        23: return
  • new 是创建【对象】,给对象分配堆内存,执行成功会将【对象引用】压入操作数栈
  • dup 是赋值操作数栈栈顶的内容,本例即为【对象引用】,为什么需要两份引用呢,一个是要配合 invokespecial 调用该对象的构造方法 "":()V (会消耗掉栈顶一个引用),另一个要配合 astore_1 赋值给局部变量
  • 成员方法与静态方法调用的另一个区别是,执行方法前是否需要【对象引用】

2-6 多态的原理

因为普通成员方法需要在运行时才能确定具体的内容,所以虚拟机需要调用invokevirtual指令

在执行invokevirtual指令时,经历了以下几个步骤

  • 先通过栈帧中对象的引用找到对象
  • 分析对象头,找到对象实际的Class
  • Class结构中有vtable,它在类加载的链接阶段就已经根据方法的重写规则生成好了
  • 查询vtable找到方法的具体地址
  • 执行方法的字节码

2-7 异常处理

(1)try-catch

public class Main {
     
    public static void main(String[] args) {
     
        int i = 0;
        try {
     
            i = 10;
        } catch (Exception e) {
     
            i = 20;
        }
    }
}

对应的字节码文件(为了抓住重点,下面的字节码省略了不重要的部分):

  Code:
      stack=1, locals=3, args_size=1
         0: iconst_0
         1: istore_1
         2: bipush        10
         4: istore_1
         5: goto          12
         8: astore_2
         9: bipush        20
        11: istore_1
        12: return
      Exception table:
         from    to  target type
             2     5     8   Class java/lang/Exception
  • 可以看到多出来一个 Exception table 的结构,[from, to) 是前闭后开(也就是检测2~4行)的检测范围,一旦这个范围内的字节码执行出现异常,则通过 type 匹配异常类型,如果一致,进入 target 所指示行号
  • 8行的字节码指令 astore_2 是将异常对象引用存入局部变量表的2号位置(为e)

(2)多个 single-catch 块的情况

public class Main {
     
    public static void main(String[] args) {
     
        int i = 0;
        try {
     
            i = 10;
        } catch (ArithmeticException e) {
     
            i = 20;
        } catch (Exception e) {
     
            i = 30;
        }
    }
}

对应的字节码文件:

 Code:
      stack=1, locals=3, args_size=1
         0: iconst_0
         1: istore_1
         2: bipush        10
         4: istore_1
         5: goto          19
         8: astore_2
         9: bipush        20
        11: istore_1
        12: goto          19
        15: astore_2
        16: bipush        30
        18: istore_1
        19: return
      Exception table:
         from    to  target type
             2     5     8   Class java/lang/ArithmeticException
             2     5    15   Class java/lang/Exception
  • 因为异常出现时,只能进入 Exception table 中一个分支,所以局部变量表 slot 2 位置被共用

(3)finally

public class Main {
     
    public static void main(String[] args) {
     
        int i = 0;
        try {
     
            i = 10;
        } catch (Exception e) {
     
            i = 20;
        } finally {
     
            i = 30;
        }
    }
}

对应的字节码文件:

   Code:
      stack=1, locals=4, args_size=1
          
         0: iconst_0
         1: istore_1
          //try块
         2: bipush        10
         4: istore_1
         5: bipush        30
         //try块执行完后,会执行finally 
         7: istore_1
         8: goto          27
         //catch块
        11: astore_2
        12: bipush        20
        14: istore_1
         //catch块执行完,会执行finally
        15: bipush        30
        17: istore_1
        18: goto          27
        //出现异常,但未被Exception捕获,会抛出其他异常,这时也需要执行finally块中的代码   
        21: astore_3
        22: bipush        30
        24: istore_1
        25: aload_3
        26: athrow //抛出异常
        27: return
      Exception table:
         from    to  target type
             2     5    11   Class java/lang/Exception
             2     5    21   any //剩余的异常类型,比如 Error
            11    15    21   any //剩余的异常类型,比如 Erro

可以看到 finally 中的代码被复制了 3 份,分别放入 try 流程,catch 流程以及 catch 剩余的异常类型流程

注意:

虽然从字节码指令看来,每个块中都有finally块,但是finally块中的代码只会被执行一次

(4)finally中的return

public class Main {
     
    public static void main(String[] args) {
     
        int result = test();
        System.out.println(result);//20
    }

    public static int test() {
     
        try {
     
            return 10;
        } finally {
     
            return 20;
        }
    }
}

对应的字节码文件:

  Code:
      stack=1, locals=2, args_size=0
         0: bipush        10
         2: istore_0
         3: bipush        20
         5: ireturn  // 返回栈顶 int(20)
         6: astore_1
         7: bipush        20
         9: ireturn  // 返回栈顶 int(20)
      Exception table:
         from    to  target type
             0     3     6   any
  • 由于 finally 中的 ireturn 被插入了所有可能的流程,因此返回结果肯定以 finally 的为准
  • 跟前一个中的 finally 相比,发现没有 athrow 了,这告诉我们:如果在 finally 中出现了 return,会吞掉异常

运行下面的代码,不会抛出异常:

public class Main {
     
    public static void main(String[] args) {
     
        int result = test();
        System.out.println(result);
    }

    public static int test() {
     
        try {
     
            int i = 1 / 0;
            return 10;
        } finally {
     
            return 20;
        }
    }
}

(5)finally不带return

public class Main {
     
    public static void main(String[] args) {
     
        int i = Main.test();
        System.out.println(i);//输出为10
    }

    public static int test() {
     
        int i = 10;
        try {
     
            return i;
        } finally {
     
            i = 20;
        }
    }
}

对应的字节码文件:

Code:
      stack=1, locals=3, args_size=0
      	0: bipush        10
        2: istore_0 //赋值给i 10
        3: iload_0	//加载到操作数栈顶
        4: istore_1 //加载到局部变量表的1号位置
        5: bipush        20
        7: istore_0 //赋值给i 20
        8: iload_1 //加载局部变量表1号位置的数10到操作数栈
        9: ireturn //返回操作数栈顶元素 10
       10: astore_2
       11: bipush        20
       13: istore_0
       14: aload_2 //加载异常
       15: athrow //抛出异常
      Exception table:
         from    to  target type
             3     5    10   any

2-8 synchronized

public class Main {
     
    public static void main(String[] args) {
     
        int i = 10;
        Object lock = new Object();
        synchronized (lock) {
     
            System.out.println(i);
        }
    }
}

对应的字节码文件:

 Code:
      stack=2, locals=5, args_size=1
         0: bipush        10
         2: istore_1
         3: new           #2                  // class java/lang/Object
         6: dup
         7: invokespecial #1                  // Method java/lang/Object."":()V
        10: astore_2
        11: aload_2
        12: dup
        13: astore_3
        14: monitorenter //加锁
        15: getstatic     #3                  // Field java/lang/System.out:Ljava/io/PrintStream;
        18: iload_1
        19: invokevirtual #4                  // Method java/io/PrintStream.println:(I)V
        22: aload_3
        23: monitorexit //解锁
        24: goto          34
        //异常操作
        27: astore        4
        29: aload_3
        30: monitorexit //解锁
        31: aload         4
        33: athrow
        34: return
      Exception table:
         from    to  target type
            15    24    27   any
            27    31    27   any

3.编译期处理

所谓的 语法糖 ,其实就是指 java 编译器把 *.java 源码编译为 *.class 字节码的过程中,自动生成和转换的一些代码,主要是为了减轻程序员的负担,算是 java 编译器给我们的一个额外福利(给糖吃嘛)

3-1 默认构造器

public class Candy1 {
     
}

编译成class后的代码:

public class Candy1 {
     
    // 这个无参构造是编译器帮助我们加上的
    public Candy1() {
     
        super(); // 即调用父类 Object 的无参构造方法,即调用 java/lang/Object."":()V
    }
}

3-2 自动拆装箱

这个特性是 JDK 5 开始加入的, 如下代码 :

public class Candy2 {
     
    public static void main(String[] args) {
     
        Integer x = 1;
        int y = x;
    }
}

这段代码在 JDK 5 之前是无法编译通过的,必须改写下面这样 :

public class Candy2 {
     
    public static void main(String[] args) {
     
        //基本类型转包装类型→装箱
        Integer x = Integer.valueOf(1);
        //包装类型转基本类型→拆箱
        int y = x.intValue();
    }
}

3-3 泛型集合取值

泛型也是在 JDK 5 开始加入的特性,但 java 在编译泛型代码后会执行泛型擦除 的动作,即泛型信息在编译为字节码之后就丢失了,实际的类型都当做了 Object 类型来处理:

public class Candy3 {
     
    public static void main(String[] args) {
     
        List<Integer> list = new ArrayList<>();
        list.add(10); // 实际调用的是 List.add(Object e)
        Integer x = list.get(0); // 实际调用的是 Object obj = List.get(int index);
    }
}

所以在取值时,编译器真正生成的字节码中,还要额外做一个类型转换的操作:

// 需要将 Object 转为 Integer
Integer x = (Integer)list.get(0);

如果前面的 x 变量类型修改为 int 基本类型那么最终生成的字节码是:

// 需要将 Object 转为 Integer, 并执行拆箱操作
int x = ((Integer)list.get(0)).intValue();

对应字节码:

Code:
    stack=2, locals=3, args_size=1
       0: new           #2                  // class java/util/ArrayList
       3: dup
       4: invokespecial #3                  // Method java/util/ArrayList."":()V
       7: astore_1
       8: aload_1
       9: bipush        10
      11: invokestatic  #4                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      //这里进行了泛型擦除,实际调用的是add(Objcet o)
      14: invokeinterface #5,  2            // InterfaceMethod java/util/List.add:(Ljava/lang/Object;)Z

      19: pop
      20: aload_1
      21: iconst_0
      //这里也进行了泛型擦除,实际调用的是get(Object o)   
      22: invokeinterface #6,  2            // InterfaceMethod java/util/List.get:(I)Ljava/lang/Object;
//这里进行了类型转换,将Object转换成了Integer
      27: checkcast     #7                  // class java/lang/Integer
      30: astore_2
      31: return

3-4 可变参数

可变参数也是 JDK 5 开始加入的新特性: 例如:

public class Candy4 {
     
    public static void foo(String... args) {
     
        String[] array = args; // 直接赋值
        System.out.println(array);
    }
    public static void main(String[] args) {
     
        foo("hello", "world");
    }
}

可变参数 String... args 其实是一个 String[] args ,从代码中的赋值语句中就可以看出来。 同 样 java 编译器会在编译期间将上述代码变换为:

public class Candy4 {
     
    public static void foo(String[] args) {
     
        String[] array = args; // 直接赋值
        System.out.println(array);
    }
    public static void main(String[] args) {
     
        foo(new String[]{
     "hello", "world"});
    }
}

注意: 如果调用了 foo() 则等价代码为 foo(new String[]{}) ,创建了一个空的数组,而不会 传递 null 进去

3-5 foreach循环

仍是 JDK 5 开始引入的语法糖,数组的循环:

public class Candy5_1 {
     
    public static void main(String[] args) {
     
        int[] array = {
     1, 2, 3, 4, 5}; // 数组赋初值的简化写法也是语法糖哦
        for (int e : array) {
     
            System.out.println(e);
        }
    }
}

会被编译器转换为:

public class Candy5_1 {
     
    public Candy5_1() {
     
    }
    public static void main(String[] args) {
     
        int[] array = new int[]{
     1, 2, 3, 4, 5};
        for(int i = 0; i < array.length; ++i) {
     
            int e = array[i];
            System.out.println(e);
        }
    }
}

如果是集合呢?

public class Candy5_2 {
     
    public static void main(String[] args) {
     
        List<Integer> list = Arrays.asList(1,2,3,4,5);
        for (Integer i : list) {
     
            System.out.println(i);
        }
    }
}

实际被编译器转换为对迭代器的调用:

public class Candy5_2 {
     
    public Candy5_2() {
     
    }
    public static void main(String[] args) {
     
        List<Integer> list = Arrays.asList(1, 2, 3, 4, 5);
        Iterator iter = list.iterator();
        while(iter.hasNext()) {
     
            Integer e = (Integer)iter.next();
            System.out.println(e);
        }
    }
}

注意 :foreach 循环写法,能够配合数组,以及所有实现了 Iterable 接口的集合类一起使用,其 中 Iterable 用来获取集合的迭代器( Iterator

3-6 switch 字符串

从 JDK 7 开始,switch 可以作用于字符串和枚举类,这个功能其实也是语法糖,例如:

public class Candy6_1 {
     
    public static void choose(String str) {
     
        switch (str) {
     
            case "hello": {
     
                System.out.println("h");
                break;
            }
            case "world": {
     
                System.out.println("w");
                break;
            }
        }
    }
}

注意: switch 配合 String 和枚举使用时,变量不能为null,原因分析完语法糖转换后的代码应当自然清楚

会被编译器转换为:

public class Candy6_1 {
     
    public Candy6_1() {
     
    }
    public static void choose(String str) {
     
        byte x = -1;
        switch(str.hashCode()) {
     
            case 99162322: // hello 的 hashCode
                if (str.equals("hello")) {
     
                    x = 0;
                }
                break;
            case 113318802: // world 的 hashCode
                if (str.equals("world")) {
     
                    x = 1;
                }
        }
        switch(x) {
     
            case 0:
                System.out.println("h");
                break;
            case 1:
                System.out.println("w");
        }
    }
}

以看到,执行了两遍 switch,第一遍是根据字符串的 hashCode 和 equals 将字符串的转换为相应 byte 类型,第二遍才是利用 byte 执行进行比较。

:为什么第一遍时必须既比较 hashCode,又利用 equals 比较呢?hashCode 是为了提高效率,减少可能的比较;而 equals 是为了防止 hashCode 冲突。

例如 BMC. 这两个字符串的hashCode值都是 2123 ,如果有如下代码:

public class Candy6_1 {
     
    public static void choose(String str) {
     
        switch (str) {
     
            case "BM": {
     
                System.out.println("h");
                break;
            }
            case "C.": {
     
                System.out.println("w");
                break;
            }
        }
    }
}

会被编译器转换为:

public class Candy6_1 {
     
    public Candy6_1() {
     
    }

    public static void choose(String var0) {
     
        byte var2 = -1;
        switch(var0.hashCode()) {
     
        case 2123:
            if (var0.equals("C.")) {
     
                var2 = 1;
            } else if (var0.equals("BM")) {
     
                var2 = 0;
            }
        default:
            switch(var2) {
     
            case 0:
                System.out.println("h");
                break;
            case 1:
                System.out.println("w");
            }

        }
    }
}

3-7 switch 枚举

public enum Sex {
     
    MALE,FEMALE
}
public class Candy7 {
     
    public static void foo(Sex sex){
     
        switch (sex){
     
            case MALE:
                System.out.println("男");
                break;
            case FEMALE:
                System.out.println("女");
                break;
        }
    }
}

会被编译器转换为:

public class Candy7 {
     
    /**     
	* 定义一个合成类(仅 jvm 使用,对我们不可见)
    * 用来映射枚举的 ordinal 与数组元素的关系
    * 枚举的 ordinal 表示枚举对象的序号,从 0 开始
    * 即 MALE 的 ordinal()=0,FEMALE 的 ordinal()=1
    */
    static class $MAP {
     
        // 数组大小即为枚举元素个数,里面存储case用来对比的数字
        static int[] map = new int[2];
        static {
     
            map[Sex.MALE.ordinal()] = 1;
            map[Sex.FEMALE.ordinal()] = 2;
        }
    }
    public static void foo(Sex sex) {
     
        int x = $MAP.map[sex.ordinal()];
        switch (x) {
     
            case 1:
                System.out.println("男");
                break;
            case 2:
                System.out.println("女");
                break;
        }
    }
}

3-8 枚举类

JDK 7 新增了枚举类,以前面的性别枚举为例:

public enum Sex {
     
    MALE,FEMALE
}

会被编译器转换为:

public final class Sex extends Enum<Sex> {
     
    public static final Sex MALE;
    public static final Sex FEMALE;
    private static final Sex[] $VALUES;
    static {
     
        MALE = new Sex("MALE", 0);
        FEMALE = new Sex("FEMALE", 1);
        $VALUES = new Sex[]{
     MALE, FEMALE};
    }
    private Sex(String name, int ordinal) {
     
        super(name, ordinal);
    }
    public static Sex[] values() {
     
        return $VALUES.clone();
    }
    public static Sex valueOf(String name) {
     
        return Enum.valueOf(Sex.class, name);
    }
}

4.类加载阶段

4-1 加载

  • 将类的字节码载入方法区(1.8后为元空间,在本地内存中)中,内部采用 C++ 的 instanceKlass 描述 java 类,它的重要 field 有:
    • _java_mirrorjava 的类镜像,例如对 String 来说,它的镜像类就是 String.class,作用是把 klass 暴露给 java 使用
    • _super 即父类
    • _fields 即成员变量
    • _methods 即方法
    • _constants 即常量池
    • _class_loader 即类加载器
    • _vtable 虚方法表
    • _itable 接口方法
  • 如果这个类还有父类没有加载,先加载父类
  • 加载和链接可能是交替运行
  • instanceKlass 这样的【元数据】是存储在方法区(1.8 后的元空间内),但 _java_mirror 是存储在
  • instanceKlass和_java_mirror(java镜像类)互相保存了对方的地址
  • 类的对象在对象头中保存了 *.class 的地址。让对象可以通过其找到方法区中的instanceKlass,从而获取类的各种信息

【JVM】类加载与字节码技术_第17张图片

4-2 链接

(1)验证

验证类是否符合 JVM规范,安全性检查

(2)准备

static 变量分配空间,设置默认值

  • static变量在JDK 7以前是存储与instanceKlass末尾。但在JDK 7以后就存储在_java_mirror末尾了
  • static变量在分配空间和赋值是在两个阶段完成的。分配空间准备阶段完成,赋值初始化阶段完成
  • 如果 static 变量是 final 的基本类型,以及字符串常量,那么编译阶段值就确定了,赋值在准备阶段完成
  • 如果 static 变量是 final 的,但属于引用类型,那么赋值也会在初始化阶段完成

(3)解析

将常量池中的符号引用解析为直接引用

4-3 初始化

(1)cinit方法

初始化即调用 (),虚拟机会保证这个类的【构造方法】的线程安全

(2)发生的时机

类的初始化的懒惰的,以下情况会初始化:

  • main 方法所在的类,总会被首先初始化
  • 首次访问这个类的静态变量或静态方法时
  • 子类初始化,如果父类还没初始化,会引发
  • 子类访问父类的静态变量,只会触发父类的初始化
  • Class.forName
  • new 会导致初始化

以下情况不会初始化:

  • 访问类的 static final 静态常量(基本类型和字符串)
  • 类对象.class 不会触发初始化
  • 创建该类对象的数组
  • 类加载器的.loadClass方法
  • Class.forName的参数2为false时

验证类是否被初始化,可以看改类的静态代码块是否被执行

这里一个例子来验证:(实验时请先全部注释,每次只执行其中一个)

public class Load3 {
     
    static {
     
        System.out.println("main init");
    }
    public static void main(String[] args) throws ClassNotFoundException {
     
        // 1. 静态常量(基本类型和字符串)不会触发初始化
        System.out.println(B.b);
        // 2. 类对象.class 不会触发初始化
        System.out.println(B.class);
        // 3. 创建该类的数组不会触发初始化
        System.out.println(new B[0]);
        // 4. 不会初始化类 B,但会加载 B、A
        ClassLoader cl = Thread.currentThread().getContextClassLoader();
        cl.loadClass("cn.itcast.jvm.t3.B");
        // 5. 不会初始化类 B,但会加载 B、A
        ClassLoader c2 = Thread.currentThread().getContextClassLoader();
        Class.forName("cn.itcast.jvm.t3.B", false, c2);
        
        // 1. 首次访问这个类的静态变量或静态方法时
        System.out.println(A.a);
        // 2. 子类初始化,如果父类还没初始化,会引发
        System.out.println(B.c);
        // 3. 子类访问父类静态变量,只触发父类初始化
        System.out.println(B.a);
        // 4. 会初始化类 B,并先初始化类 A
        Class.forName("cn.itcast.jvm.t3.B");
    }
}
class A {
     
    static int a = 0;
    static {
     
        System.out.println("a init");
    }
}
class B extends A {
     
    final static double b = 5.0;
    static boolean c = false;
    static {
     
        System.out.println("b init");
    }
}

5.类加载器

以 JDK 8 为例:

名称 加载的类 说明
Bootstrap ClassLoader(启动类加载器) JAVA_HOME/jre/lib 无法直接访问
Extension ClassLoader(拓展类加载器) JAVA_HOME/jre/lib/ext 上级为Bootstrap,显示为null
Application ClassLoader(应用程序类加载器) classpath 上级为Extension
自定义类加载器 自定义 上级为Application

5-1 启动类加载器

用 Bootstrap 类加载器加载类:

package cn.itcast.jvm.t3.load;
public class F {
     
    static {
     
        System.out.println("bootstrap F init");
    }
}

执行

package cn.itcast.jvm.t3.load;
public class Load5_1 {
     
    public static void main(String[] args) throws ClassNotFoundException {
     
        Class<?> aClass = Class.forName("cn.itcast.jvm.t3.load.F");
        System.out.println(aClass.getClassLoader());
    }
}

输出

E:\git\jvm\out\production\jvm>java -Xbootclasspath/a:.
cn.itcast.jvm.t3.load.Load5
bootstrap F init
null
  • -Xbootclasspath 表示设置 bootclasspath
  • 其中 /a:. 表示将当前目录追加至 bootclasspath 之后
  • 可以用这个办法替换核心类
    • java -Xbootclasspath:
  • 也可以追加
    • java -Xbootclasspath/a:<追加路径>(后追加)
    • java -Xbootclasspath/p:<追加路径>(前追加)

5-2 扩展类加载器

如果classpath和JAVA_HOME/jre/lib/ext 下有同名类,加载时会使用拓展类加载器加载。当应用程序类加载器发现拓展类加载器已将该同名类加载过了,则不会再次加载

5-3 双亲委派模式

  • 当AppClassLoader加载一个class时,它首先不会自己去尝试加载这个类,而是把类加载请求委派给父类加载器ExtClassLoader去完成。
  • 当ExtClassLoader加载一个class时,它首先也不会自己去尝试加载这个类,而是把类加载请求委派给BootStrapClassLoader去完成。
  • 如果BootStrapClassLoader加载失败(例如在$JAVA_HOME/jre/lib里未查找到该class),会使用ExtClassLoader来尝试加载;
  • 若ExtClassLoader也加载失败,则会使用AppClassLoader来加载,如果AppClassLoader也加载失败,则会报出异常ClassNotFoundException。

所谓的双亲委派,就是指调用类加载器的 loadClass 方法时,查找类的规则

loadClass源码:

protected Class<?> loadClass(String name, boolean resolve)
    throws ClassNotFoundException {
     
    synchronized (getClassLoadingLock(name)) {
     
        // 1. 检查该类是否已经加载
        Class<?> c = findLoadedClass(name);
        if (c == null) {
     
            long t0 = System.nanoTime();
            try {
     
                if (parent != null) {
     
                    // 2. 有上级的话,委派上级 loadClass
                    c = parent.loadClass(name, false);
                } else {
     
                    // 3. 如果没有上级了(ExtClassLoader),则委派
                    BootstrapClassLoader
                        c = findBootstrapClassOrNull(name);
                }
            } catch (ClassNotFoundException e) {
     
            }
            if (c == null) {
     
                long t1 = System.nanoTime();
                // 4. 每一层找不到,调用 findClass 方法(每个类加载器自己扩展)来加载
                c = findClass(name);
                // 5. 记录耗时
                sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
                sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
                sun.misc.PerfCounter.getFindClasses().increment();
            }
        }
        if (resolve) {
     
            resolveClass(c);
        }
        return c;
    }
}

5-4 自定义类加载器

(1)使用场景

  • 想加载非 classpath 随意路径中的类文件
  • 通过接口来使用实现,希望解耦时,常用在框架设计
  • 这些类希望予以隔离,不同应用的同名类都可以加载,不冲突,常见于 tomcat 容器

(2)步骤

  1. 继承ClassLoader父类
  2. 要遵从双亲委派机制,重写 findClass 方法
    • 不是重写loadClass方法,否则不会走双亲委派机制
  3. 读取类文件的字节码
  4. 调用父类的 defineClass 方法来加载类
  5. 使用者调用该类加载器的 loadClass 方法

6.运行期优化

6-1 即时编译

(1)分层编译

JVM 将执行状态分成了 5 个层次:

  • 0层:解释执行,用解释器将字节码翻译为机器码
  • 1层:使用 C1 即时编译器编译执行(不带 profiling)
  • 2层:使用 C1 即时编译器编译执行(带基本的profiling)
  • 3层:使用 C1 即时编译器编译执行(带完全的profiling)
  • 4层:使用 C2 即时编译器编译执行

profiling 是指在运行过程中收集一些程序执行状态的数据,例如【方法的调用次数】,【循环的 回边次数】等

即时编译器(JIT)与解释器的区别

  • 解释器
    • 将字节码解释为机器码,下次即使遇到相同的字节码,仍会执行重复的解释
    • 是将字节码解释为针对所有平台都通用的机器码
  • 即时编译器
    • 将一些字节码编译为机器码,并存入 Code Cache,下次遇到相同的代码,直接执行,无需再编译
    • 根据平台类型,生成平台特定的机器码

对于大部分的不常用的代码,我们无需耗费时间将其编译成机器码,而是采取解释执行的方式运行;另一方面,对于仅占据小部分的热点代码,我们则可以将其编译成机器码,以达到理想的运行速度。 执行效率上简单比较一下 Interpreter < C1 < C2,总的目标是发现热点代码(hotspot名称的由 来),并优化这些热点代码

逃逸分析

发现新建的对象是否逃逸。可以使用 -XX:- DoEscapeAnalysis 关闭逃逸分析

(2)方法内联

举个栗子:

private static int square(final int i) {
     
    return i * i;
}
System.out.println(square(9));

如果发现 square 是热点方法,并且长度不太长时,会进行内联,所谓的内联就是把方法内代码拷贝、 粘贴到调用者的位置:

System.out.println(9 * 9);

还能够进行常量折叠(constant folding)的优化

System.out.println(8);

最后喜欢的小伙伴别忘了一键三连哦
【JVM】类加载与字节码技术_第18张图片

你可能感兴趣的:(并发编程&JVM,java,JVM,面试,后端,Class)