Java
能做到 一次编译,到处运行
,主要就是靠 class字节码
文件,也就是 java
文件经过编译之后 .java -> .class
,然后再被 JVM
虚拟机加载。其实,不仅是 java
语言,只要是符合规则的 class
字节码文件,都可以被 JVM
加载,如 Grooy、Kolin
语言:
有了 class
字节码,也就解除了 VM虚拟机
与编程语言
之间的耦合性。不管什么语言,只要是能编译成符合规则的字节码文件
,就可以被 VM虚拟机
识别并加载到内存中。
class字节码
中由无符号数
和表
两种数据结构组成。
u1、u2、u4、u8
分别表示1、2、4、8
个字节的无符号数,无符号数可以用来表示数字、索引引用、数量只或者字符串(UTF-8
编码)。无符号数
或者其他表
作为数据项构成的复合数据类型,class
文件中所有的表都以“_info
”结尾。所以,整个 Class
文件可以认为就是一张表。package org.ninetripods.lib_bytecode.asm.coreApi;
public class Test {
private int num = 0;
public void addNum() {
num++;
System.out.println("num:" + num);
}
public static int staticAdd(int a, int b) {
return a + b;
}
}
经过javac编译之后,会生成Test.class字节码文件,用010 Editor
打开这个文件:
使用 javap -c xxx.class
命令可以 输出分解后的 java字节码
:
public class org.ninetripods.lib_bytecode.asm.coreApi.Test {
public org.ninetripods.lib_bytecode.asm.coreApi.Test();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."":()V
4: aload_0
5: iconst_0
6: putfield #2 // Field num:I
9: return
public void addNum();
Code:
0: aload_0
1: dup
2: getfield #2 // Field num:I
5: iconst_1
6: iadd
7: putfield #2 // Field num:I
10: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream;
13: aload_0
14: getfield #2 // Field num:I
17: invokedynamic #4, 0 // InvokeDynamic #0:makeConcatWithConstants:(I)Ljava/lang/String;
22: invokevirtual #5 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
25: return
public static int staticAdd(int, int);
Code:
0: iload_0
1: iload_1
2: iadd
3: ireturn
}
上述文件中描述了Test.class
加载到内存时的执行顺序,包括各种描述符及操作码,接下面就来看一下。
每个基本类型都对应一个字母,如下:
基本类型 | 描述符 |
---|---|
byte | B |
short | S |
int | I |
long | J |
float | F |
double | D |
char | C |
boolean | Z |
void | V |
L + 全限定名
,示例:
注:全限定名用于描述class
类的名称,实际上就是把平时Java
类名称中的"."
换成了"/"
,如Java
的祖先类java.lang.Object
全限定名是:java/lang/Object
。
[ + 数组内类型的描述符
,示例:
int[] -> [I
String[][] -> [[Ljava/lang/String;
方法描述符用于class字节码文件中保存参数类型列表和返回值的方式。
方法描述符规则:
示例:
void test() -> ()V
void test(int i) -> (I)V
void test(String s, int i) -> (Ljava/lang/StringI)V
int[] test(double[], boolean) -> ([DZ)[I
OpCode
用于VM虚拟机
解释运行Java
程序,每个操作码都可以用来表示一个指令。如0x62
是一个十六进制数,表示两个float
类型的数相加。在ASM
的org.objectweb.asm.OpCodes
类中可以找到: int FADD = 98
,ASM
中是用十进制表示的,除此之外,其他操作码指令都可以在这个类中找到。
new String()
对应 mv.visitTypeInsn(NEW, "java/lang/String")
,返回一个指定类型的对象。obj instanceof String
对应 mv.visitTypeInsn(INSTANCEOF, "java/lang/String")
,返回一个布尔值结果。(String) obji
对应 mv.visitTypeInsn(CHECKCAST, "java/lang/String")
,返回类型检查后的对象。注:上述的mv
指的是MethodVisitor
(ASM Core Api
中的类,后面的文章会详细介绍),主要用于操作遍历、修改方法时使用。
ASM
中的GETFIELD
,如mv.visitFieldInsn(GETFIELD, xxxx)
。ASM
中的PUTFIELD
,如mv.visitFieldInsn(PUTFIELD, xxxx)
。ASM
中的GETSTATIC
,如mv.visitFieldInsn(GETSTATIC, xxxx)
。ASM
中的PUTSTATIC
,如mv.visitFieldInsn(PUTSTATIC, xxxx)
。方法、私有方法、super.method()
。因为这三类方法的调用对象在编译时就可以确定。。调用方式如mv.visitMethodInsn(INVOKESPECIAL, "java/lang/Object", "equals", "(Ljava/lang/Object;)Z", false);
static
静态方法。mv.visitMethodInsn(INVOKEINTERFACE, "java/util/List", "size", "()I", true);
虚拟机栈:
虚拟机栈描述的是Java
方法执行的内存模型:每个方法在执行时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
每一个栈帧中又包含了以下信息:
LIFO
),操作数栈的深度也是在编译阶段确定。当一个方法刚开始执行时,这个方法的操作数栈是空的,在方法执行过程中,会有各种字节码指令被压入和弹出操作数栈。更详细的流程参见:Java内存模型、GC Roots可达性分析、垃圾回收机制
下面的加载、存储相关操作都与操作数栈、本地变量表
有关。
a 表示对象,I表示int, l表示long, f表示float, d表示double, b表示byte, c表示char, s表示short。
加载字节码,如aload_0
,对应ASM
中的mv.visitVarInsn(ALOAD, 0);
a 表示对象,I表示int, l表示long, f表示float, d表示double, b表示byte, c表示char, s表示short。
存储对象,如astore_1
,对应ASM中的mv.visitVarInsn(ISTORE, 1);
mv.visitInsn(ARETURN); //对应某一对象(非基本类型)
mv.visitInsn(RETURN); //无返回,对应void方法
xload
和xstore
的使用量。对应ASM中的DUP,mv.visitInsn(DUP);
,DUP后紧接着的数字代表了复制数量,Xn代表插入到栈顶下第几层。如:1、 DUP
输入: d3 d2 d1
输出:到d3 d2 d1 d1
2、DUP2_X1
输入:d3 d2 d1
输出:d3 d2 d2 d1 d1
POP
。如:mv.visitInsn(POP)
bipush,属于byte范围(-128~127)
sipush,属于short范围(-32768~32767)
对应ASM中:
mv.visitIntInsn(BIPUSH, 100);
mv.visitIntInsn(SIPUSH, 1000);
float
、转换为double
、转换为int
、转换为long
、int
转换为(b/c/s
)的操作码。其中b/c/s的取值范围:byte(-128 ~ 127)、short(-32768 ~ 32767)和char(0 ~ 65535)mv.visitInsn(MONITORENTER); mv.visitInsn(MONITOREXIT);
mv.visitInsn(ATHROW);
methodVisitor.visitTypeInsn(NEW, "java/lang/String");
methodVisitor.visitInsn(DUP);
methodVisitor.visitLdcInsn("Hello"); //将入参Hello放到操作数栈中,下面调用构造方法时传入
methodVisitor.visitMethodInsn(INVOKESPECIAL, "java/lang/String", "", "(Ljava/lang/String;)V", false);
注意,NEW
操作码指令只会创建对象,不会调用构造函数;如果想调用构造函数进行初始化,须用上面INVOKESPECIAL
指令。