JVM-透彻理解字节码以及指令

一、字节码与指令概述

JVM-透彻理解字节码以及指令_第1张图片

JVM-透彻理解字节码以及指令_第2张图片

JVM-透彻理解字节码以及指令_第3张图片

JVM-透彻理解字节码以及指令_第4张图片

JVM-透彻理解字节码以及指令_第5张图片

JVM-透彻理解字节码以及指令_第6张图片

JVM-透彻理解字节码以及指令_第7张图片

package ch13_bytecode;

public class HelloWorld {
    public static void main(String[] args) {
        System.out.println("hello world");
    }
}

生成字节码:

cafe babe 0000 0031 0022 0a00 0600 1409
0015 0016 0800 170a 0018 0019 0700 1a07
001b 0100 063c 696e 6974 3e01 0003 2829
5601 0004 436f 6465 0100 0f4c 696e 654e
756d 6265 7254 6162 6c65 0100 124c 6f63
616c 5661 7269 6162 6c65 5461 626c 6501
0004 7468 6973 0100 1a4c 6368 3133 5f62
7974 6563 6f64 652f 4865 6c6c 6f57 6f72
6c64 3b01 0004 6d61 696e 0100 1628 5b4c
6a61 7661 2f6c 616e 672f 5374 7269 6e67
3b29 5601 0004 6172 6773 0100 135b 4c6a
6176 612f 6c61 6e67 2f53 7472 696e 673b
0100 0a53 6f75 7263 6546 696c 6501 000f
4865 6c6c 6f57 6f72 6c64 2e6a 6176 610c
0007 0008 0700 1c0c 001d 001e 0100 0b68
656c 6c6f 2077 6f72 6c64 0700 1f0c 0020
0021 0100 1863 6831 335f 6279 7465 636f
6465 2f48 656c 6c6f 576f 726c 6401 0010
6a61 7661 2f6c 616e 672f 4f62 6a65 6374
0100 106a 6176 612f 6c61 6e67 2f53 7973
7465 6d01 0003 6f75 7401 0015 4c6a 6176
612f 696f 2f50 7269 6e74 5374 7265 616d
3b01 0013 6a61 7661 2f69 6f2f 5072 696e
7453 7472 6561 6d01 0007 7072 696e 746c
6e01 0015 284c 6a61 7661 2f6c 616e 672f
5374 7269 6e67 3b29 5600 2100 0500 0600
0000 0000 0200 0100 0700 0800 0100 0900
0000 2f00 0100 0100 0000 052a b700 01b1
0000 0002 000a 0000 0006 0001 0000 0003
000b 0000 000c 0001 0000 0005 000c 000d
0000 0009 000e 000f 0001 0009 0000 0037
0002 0001 0000 0009 b200 0212 03b6 0004
b100 0000 0200 0a00 0000 0a00 0200 0000
0500 0800 0600 0b00 0000 0c00 0100 0000
0900 1000 1100 0000 0100 1200 0000 0200
13

解释:

        cafe babe -  魔数

        0000 0031 - 版本号,前面大版本,后面小版本

        0022 - 常量池大小

二、JVM编译基本原理

JVM-透彻理解字节码以及指令_第8张图片

JVM-透彻理解字节码以及指令_第9张图片

JVM-透彻理解字节码以及指令_第10张图片

JVM-透彻理解字节码以及指令_第11张图片

JVM-透彻理解字节码以及指令_第12张图片

JVM-透彻理解字节码以及指令_第13张图片

示例:

package main.java.ch13_bytecode;

import com.sun.tools.javac.parser.Scanner;
import com.sun.tools.javac.parser.ScannerFactory;
import com.sun.tools.javac.util.Context;

//词法分析案例

public class LexicalAnalyzeTest {
    public static void main(String[] args) {
        ScannerFactory factory = ScannerFactory.instance(new Context());
        Scanner scanner = factory.newScanner("int m=i+j;", false);

        scanner.nextToken();
        System.out.println(scanner.token().kind);
        scanner.nextToken();
        System.out.println(scanner.token().name());
        scanner.nextToken();
        System.out.println(scanner.token().kind);
        scanner.nextToken();
        System.out.println(scanner.token().name());
        scanner.nextToken();
        System.out.println(scanner.token().kind);
        scanner.nextToken();
        System.out.println(scanner.token().name());
        System.out.println(scanner.token().kind);
        scanner.nextToken();
    }
}

JVM-透彻理解字节码以及指令_第14张图片

JVM-透彻理解字节码以及指令_第15张图片

大白话:

        符号解析: int x = 5 ->  int 类型的字段 x值为5 以及作用域

JVM-透彻理解字节码以及指令_第16张图片

大白话:

        处理注解以及引入(@autowired)等

JVM-透彻理解字节码以及指令_第17张图片

大白话:

         类层面的语义合法性检查。

JVM-透彻理解字节码以及指令_第18张图片

大白话:

        针对方法内部语法语义合法性检查。

JVM-透彻理解字节码以及指令_第19张图片

大白话:

        第六步,去掉高级用法(比如lambda、switch-case等高级特性),转为最基本用法。

JVM-透彻理解字节码以及指令_第20张图片

三、字节码解析上-魔数、版本和常量池解析原理

package ch13_bytecode;

public class HelloWorld {
    public static void main(String[] args) {
        System.out.println("hello world");
    }
}
cafe babe 0000 0031 0022 0a00 0600 1409
0015 0016 0800 170a 0018 0019 0700 1a07
001b 0100 063c 696e 6974 3e01 0003 2829
5601 0004 436f 6465 0100 0f4c 696e 654e
756d 6265 7254 6162 6c65 0100 124c 6f63
616c 5661 7269 6162 6c65 5461 626c 6501
0004 7468 6973 0100 1a4c 6368 3133 5f62
7974 6563 6f64 652f 4865 6c6c 6f57 6f72
6c64 3b01 0004 6d61 696e 0100 1628 5b4c
6a61 7661 2f6c 616e 672f 5374 7269 6e67
3b29 5601 0004 6172 6773 0100 135b 4c6a
6176 612f 6c61 6e67 2f53 7472 696e 673b
0100 0a53 6f75 7263 6546 696c 6501 000f
4865 6c6c 6f57 6f72 6c64 2e6a 6176 610c
0007 0008 0700 1c0c 001d 001e 0100 0b68
656c 6c6f 2077 6f72 6c64 0700 1f0c 0020
0021 0100 1863 6831 335f 6279 7465 636f
6465 2f48 656c 6c6f 576f 726c 6401 0010
6a61 7661 2f6c 616e 672f 4f62 6a65 6374
0100 106a 6176 612f 6c61 6e67 2f53 7973
7465 6d01 0003 6f75 7401 0015 4c6a 6176
612f 696f 2f50 7269 6e74 5374 7265 616d
3b01 0013 6a61 7661 2f69 6f2f 5072 696e
7453 7472 6561 6d01 0007 7072 696e 746c
6e01 0015 284c 6a61 7661 2f6c 616e 672f
5374 7269 6e67 3b29 5600 2100 0500 0600
0000 0000 0200 0100 0700 0800 0100 0900
0000 2f00 0100 0100 0000 052a b700 01b1
0000 0002 000a 0000 0006 0001 0000 0003
000b 0000 000c 0001 0000 0005 000c 000d
0000 0009 000e 000f 0001 0009 0000 0037
0002 0001 0000 0009 b200 0212 03b6 0004
b100 0000 0200 0a00 0000 0a00 0200 0000
0500 0800 0600 0b00 0000 0c00 0100 0000
0900 1000 1100 0000 0100 1200 0000 0200
13

大白话:        

        cafe babe  - 魔数,即文件开始标志符;        

JVM-透彻理解字节码以及指令_第21张图片

0000 0031 - Java版本号,这里的31是16进制大版本号,转换后十进制49,前面4个字节 是小版本,后面是大版本。

JVM-透彻理解字节码以及指令_第22张图片

JVM-透彻理解字节码以及指令_第23张图片

JVM-透彻理解字节码以及指令_第24张图片

JVM-透彻理解字节码以及指令_第25张图片

大白话:

        u4 magic - 魔数 4个字节

        u2 minor_version - 小版本,2个字节

        u2 major_version - 大版本, 2个字节

        u2 constant_pool_count - 常量池大小,2个字节

        cp_info constant_pool - 常量池,长度为常量池大小-1

JVM-透彻理解字节码以及指令_第26张图片

tag - 类型对应下图

JVM-透彻理解字节码以及指令_第27张图片

JVM-透彻理解字节码以及指令_第28张图片

如上图,tag是1个字节,值为0a, 转为十进制,值为10,对应CONSTANT_Methodref

JVM-透彻理解字节码以及指令_第29张图片

通过代码看到,常量池第一个常量确实是Methodref,这是个初始化方法,一般情况下绝大部分常量池第一个都是这个

JVM-透彻理解字节码以及指令_第30张图片

具体看tag的特征(属性),比如看Float

JVM-透彻理解字节码以及指令_第31张图片

JVM-透彻理解字节码以及指令_第32张图片

将Java代码修改如下,看能否在字节码中找到对应的值

JVM-透彻理解字节码以及指令_第33张图片

JVM-透彻理解字节码以及指令_第34张图片

JVM-透彻理解字节码以及指令_第35张图片

JVM-透彻理解字节码以及指令_第36张图片

JVM-透彻理解字节码以及指令_第37张图片

JVM-透彻理解字节码以及指令_第38张图片

解释:

        CONSTANT_Utf8_Info - 真正的字符串

        CONSTANT_String_info - 索引, 指向CONSTANT_Utf8_Info

JVM-透彻理解字节码以及指令_第39张图片

补充:

        其实上图的class类名,也是一个字符串,跟其他字符串保存方式相同,也是通过索引引用,具体见后面第四组。

JVM-透彻理解字节码以及指令_第40张图片

JVM-透彻理解字节码以及指令_第41张图片

JVM-透彻理解字节码以及指令_第42张图片

JVM-透彻理解字节码以及指令_第43张图片

JVM-透彻理解字节码以及指令_第44张图片

四、字节码解析下-访问标记、字段、方法和属性解析原理

继续接上一节

JVM-透彻理解字节码以及指令_第45张图片

u2 access_flags - public?private?...

JVM-透彻理解字节码以及指令_第46张图片

JVM-透彻理解字节码以及指令_第47张图片

比如:ACC_ENUM

ACC_ENUM - 对应0x4000, 数字4000的每个数字分别对应下图

JVM-透彻理解字节码以及指令_第48张图片

其中在3的这4个位,对应4,4转为二进制是0100,1对应ACC_ENUM。

JVM-透彻理解字节码以及指令_第49张图片

u2 this_class - 当前类

super_class指向CONSTANT_Class_info,指向常量池的索引,它提供了类的全限定名,如org/jamesdbloom/foo/Bar 作者:空气带糖 https://www.bilibili.com/read/cv14055954/ 出处:bilibili

u2 super_class - 父类

super_class同样指向CONSTANT_Class_info

u2 interface_count - 实现接口数量

u2 interfaces[interfaces_count] - 接口具体信息

u2 field_count - 字段或属性数量

JVM-透彻理解字节码以及指令_第50张图片

field_info - 字段或属性具体信息

JVM-透彻理解字节码以及指令_第51张图片

u2 methods_count - 方法数量

method_info  methods[methods_count] - 对应具体方法具体信息

JVM-透彻理解字节码以及指令_第52张图片

指向常量池存的接口的名字,接口信息

u2 attributes_count - 属性数量

attribute_info attributes[attributes_count] - 对应具体属性信息

JVM-透彻理解字节码以及指令_第53张图片

https://www.cnblogs.com/yuluoxingkong/p/15394825.html

五、字节码指令初步以及加载存储指令

JVM-透彻理解字节码以及指令_第54张图片

JVM-透彻理解字节码以及指令_第55张图片

JVM-透彻理解字节码以及指令_第56张图片

JVM-透彻理解字节码以及指令_第57张图片

JVM-透彻理解字节码以及指令_第58张图片

解释:

        之所以对不同的值采用不用的指令,是为了让字节码更加紧凑。

        iconst_n - 只占一个字节

        bipush_n - 占两个字节

        sipush_n - 占三个字节

JVM-透彻理解字节码以及指令_第59张图片

六、控制转移指令

解释:

        tableswitch、lookupswitch区别:

                case的值相对有序的话,虚拟机会采用tableswitch,查找效率会更高一些,如果是无序的case的值差异比较大,虚拟机会老老实实使用lookupswith。

JVM-透彻理解字节码以及指令_第60张图片

三目运算符

  JVM-透彻理解字节码以及指令_第61张图片

JVM-透彻理解字节码以及指令_第62张图片

七、对象创建指令

JVM-透彻理解字节码以及指令_第63张图片 解释:

        Java代码里边的new - 告诉JVM我要创建一个对象了;

        字节码中的new - 创建指令,dup指令(复制栈顶数值并将复制值压入栈顶),后面调用invokespecial指令,调用父方法、实例初始化方法、私有方法。

指令参考:https://www.cnblogs.com/yuluoxingkong/p/15394825.html

八、方法调用与lambda表达式基本原理screenflow

JVM-透彻理解字节码以及指令_第64张图片

大白话:

        调用静态方法 - invokestatic指令 

JVM-透彻理解字节码以及指令_第65张图片

JVM-透彻理解字节码以及指令_第66张图片

        调用私有方法、构造方法、super调用的父类方法 - invokespecial指令

JVM-透彻理解字节码以及指令_第67张图片

JVM-透彻理解字节码以及指令_第68张图片

        调用普通方法 - invokevirtual指令

JVM-透彻理解字节码以及指令_第69张图片

JVM-透彻理解字节码以及指令_第70张图片

        调用接口方法 - invokeinterface指令

JVM-透彻理解字节码以及指令_第71张图片

        调用动态方法(如lamdba、动态语音编译的字节码)- invokedynamic指令

JVM-透彻理解字节码以及指令_第72张图片

大白话:

        调用动态方法(如lamdba、动态语音编译的字节码),会有至少两步,第一步,先将语法糖还原成invokedynamic指令,第二步再根据具体方法类型,调用具体指令。

九、synchronized指令

JVM-透彻理解字节码以及指令_第73张图片

大白话:

        每个线程在执行的时候,先看能不能抢到锁,不能抢到锁等到,抢到锁,执行monitorenter指令,代码执行完后,再执行monitorexit指令退出,其他线程继续抢锁,抢到后继续执行这2个指令,如此往复。

JVM-透彻理解字节码以及指令_第74张图片

这里严格来说,应该通过多线程来演示,这里简单写一下,

使用synchronized关键字,表示方式有两种:

如果synchronized加在方法上,flags会多个ACC_SYNCHRONIZED;

JVM-透彻理解字节码以及指令_第75张图片

如果synchronized加在代码段上,

JVM-透彻理解字节码以及指令_第76张图片

        

你可能感兴趣的:(Java,jvm,java,后端)