Java虚拟机字节码指令简介

目录:

1、字节码与数据类型
2、加载和存储指令
3、运算指令
4、类型转换指令
5、对象创建与访问指令
6、操作数栈管理指令
7、控制转义指令
8、方法调用和返回指令
9、异常处理指令
10、同步指令

Java 虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字(称为操作码)以及跟随其后的零至多个代表此操作所需参数(操作数)而构成。由于 Java 虚拟机采用面向操作数栈而不是寄存器的架构,所以大多数的指令都不包含操作数,只有一个操作码。

1、字节码与数据类型

在 Java 虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息。例如,iload 指令用于从局部变量表中加载 int 型的数据到操作数栈中,而 fload 指令加载的则是 float 类型的数据。这两条指令的操作在虚拟机内部可能会是由同一段代码来实现,但在 Class 文件中它们必须拥有各自独立的操作码。

对于大部分与数据类型相关的字节码指令,它们的操作码助记符中都有特殊的字符表明专门为哪种数据类型服务:i 代表对 int 类型的数据操作,l 代表 long,s 代表 short,b 代表 byte,c 代表 char,f 代表 float,d 代表 double,a 代表 reference。也有一些指令的助记符中没有明确的指明操作类型的字母,如 arraylength 指令,它没有代表数据类型的特殊字符,但操作数永远只能是一个数字类型的对象。还有另外一些指令,如无条件跳转指令 goto 则是与数据类型无关的。

2、加载和存储指令

加载和存储指令用于将数据在栈帧中的局部变量表和操作数栈之间来回传输,这类指令包括如下内容:

  • 将一个局部变量加载到操作栈:iload、iload_、lload、lload_、fload、fload_、dload、dload_、aload、aload_
  • 将一个数值从操作数栈存储到局部变量表中:istore、istore_、lstore、lstore_、fstore、fstore_、dstore、dstore_、astore、astore_
  • 将一个常量加载到操作数栈:bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m1、iconst_、lconst_、fconst_、dconst_
  • 扩充局部变量表的访问索引的指令:wide。

3、运算指令

运算或算术指令用于对两个操作数栈上的值进行某种特定运算,并把结构重新存入到操作栈顶。大体上算术指令可以分为两种:对整形数据进行运算的指令与对浮点型数据进行运算的指令,无论是哪种算术指令,都使用 Java 虚拟机的操作类型,由于没有直接支持 byte、short、char 和 boolean 类型算术指令,对于这些数据的运算,应使用操作 int 类型的指令代替。整数与浮点数的算术指令在溢出和被零除的时候也有各自不同的行为表现,所有的算术指令如下。

  • 加法指令:iadd、ladd、fadd、dadd。
  • 减法指令:isub、lsub、fsub、dsub。
  • 乘法指令:imul、lmul、fmul、dmul。
  • 除法指令:idiv、ldiv、fdiv、ddiv。
  • 求余指令:irem、lrem、frem、drem。
  • 取反指令:ineg、lneg、fneg、dneg。
  • 位移指令:ishl、ishr、iushr、lshl、lshr、lushr。
  • 按位或指令:ior、lor。
  • 按位与指令:iand、land。
  • 按位异或指令:ixor、lxor。
  • 局部变量自增指令:iinc。
  • 比较指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp。

4、类型转换指令

Java 虚拟机直接支持以下数值类型的宽化类型转换(自动转换):

  • int 类型到 long、float 或者 double 类型。
  • long 类型到 float、double 类型。
  • float 类型到 double 类型。

相对的,处理窄化转换时,必须显式的使用转换指令来完成(即强转)。这些转换指令包括:i2b、i2c、i2s、l2i、f2i、f2l、d2i、d2l 和 d2。

5、对象创建与访问指令

虽然类实例和数组都是对象,但 Java 虚拟机对类实例和数组的创建与操作使用了不同的字节码指令。

  • 创建类实例的指令:new。
  • 创建数组的指令:newarray、anewarray、multianewarray。
  • 访问类字段和实例字段的指令:getfield、putfield、getstatic、putstatic。
  • 把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、laload、faload、daload、aaload。
  • 将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、fastore、dastore、aastore。
  • 取数组长度的指令:arraylength。
  • 检查类实例类型的指令:instanceof、checkcast。

6、操作数栈管理指令

如同操作一个普通数据结构中的堆栈那样,Java 虚拟机提供了一些用于直接操作数栈的指令,包括:

  • 将操作数栈的栈顶一个或两个元素出栈:pop、pop2。
  • 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2。
  • 将栈最顶端的两个数值互换:swap。

7、控制转义指令

控制转义指令可以让 Java 虚拟机有条件或无条件的从指定的位置指令而不是控制转义指令的下一条指令继续执行程序。

  • 条件分支:ifeq、iflt、ifle、ifne、ifgt、ifnull、ifnonnull、if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeg 和 if_acmpne。
  • 复合条件分支:tableswitch、lookupswitch。
  • 无条件分支:goto、goto_w、jsr、jsr_w、ret。

8、方法调用和返回指令

这里列出一下 5 条用于方法调用的指令。

  • invokevirtual 指令用于调用对象的实例方法,根据对象的实例类型进行分派。
  • invokeinterfce 指令用于调用接口方法,它会在运行时搜索一个实现类这个接口方法的对象,找出适合的方法进行调用。
  • invokespecial 指令用于调用一些需要特需处理的实例方法,包括实例初始化方法、私有方法和父类方法。
  • invokestatic 指令用于调用类方法。
  • invokedynamic 指令用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法。

方法调用指令与数据类型无关,而方法返回指令是根据返回值的类型区分的,包括 ireturn(当返回值是 boolean、byte、char、short 和 int 类型时使用)、lreturn、freturn、dreturn 和 areturn。另外还有一条 return 指令供声明为 void 的方法、实例初始化方法以及类和接口的类初始化方法使用。

9、异常处理指令

在 Java 程序显式的抛出异常的操作(throw 语句)都由 athrow 指令来实现。而在 Java 虚拟机中,处理异常(catch 语句)不是有字节码指令来实现的,而是采用异常表来完成的。

10、同步指令

Java 虚拟机可以支持方法级的同步(即同步方法)和方法内部一段指令序列的同步(即同步代码块),这两种同步结构都是使用管程(Monitor)来支持的。

  • 方法级的同步是隐式的,即无须通过字节码指令来控制,它实现再方法调用和返回操作之中。虚拟机可以从方法常量池的方法表结构中的 ACC_SYNCHRONIZED 访问标志得知一个方法是否声明为同步方法。当方法调用时,调用指令将会检查方法的 ACC_SYNCHRONIZED 访问标志是否被设置,如果设置了,执行线程就要求先成功持有管程(Monitor),然后才能执行方法,最后当方法完成时释放管城。在方法执行期间,执行线程持有了管程,其他任何线程都无法在获取到同一个管程。如果一个同步方法执行期间抛出了一次,并且在方法内部无法处理此异常,那么这个同步方法所持有的管程将在异常抛出到同步方法之外时自动释放。
  • 同步一段指令集序列通常是由 Java 语言中的 synchronized 语句块来表示的,Java 虚拟机的指令集中有 monitorenter 和 monitorexit 两条指令来支持 synchronized 关键字的语义,正确实现 synchronized 关键字需要 Javac 编译器与 Java 虚拟机两者共同协作支持。

最后,Java 代码字节码指令可以通过 javap 命令查看,通过了解 Java 虚拟机字节码指令的知识可以让我们清楚的知道一个方法是怎样执行的。举个栗子:

public class ByteCodeTest {
    public int add(int a, int b) {
        return a + b;
    }
}

如果我们想要知道 add() 方法执行的字节码,可以先通过 javac ByteCodeTest.java 将 java 类编译成 class 文件,然后通过 javap -verbose ByteCodeTest 命令就可以得到如下结果:

  public com.np.vm.ByteCodeTest();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."":()V
         4: return
      LineNumberTable:
        line 3: 0

  public int add(int, int);
    descriptor: (II)I
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=3, args_size=3
         0: iload_1
         1: iload_2
         2: iadd
         3: ireturn
      LineNumberTable:
        line 5: 0

这样我们就能看到 add() 方法的字节码执行结果,了解了字节码指令,就能很轻松的看懂各种方法执行的字节码指令,如果想要知道每个方法的字节码执行过程可以看下面这篇文章。
「虚拟机的方法调用和字节码执行」

你可能感兴趣的:(Java虚拟机字节码指令简介)