Java字节码揭秘——第四部分

 实践中的Java字节码
Java 字节码有了一定了解之后,我们可以来看看一些常用的和熟悉的 Java 语言的内容是如何与字节码映射的,也可以获得一些 Java 实现的细节内容。
 
Java 5:自动封装(autoboxing)
Java 5 版本的一个新特性是自动封装 (autoboxing) ,基础数据类型因语义环境的需要能转换成为对象类型,例如:
 
public class Autoboxing
{
        public static void main(String[] args)
        {
               int x = 5;
               java.util.ArrayList al = new java.util.ArrayList();
               al.add(x);
        }
}
 
Java 5 之前,这样的写法是错误的,因为 x 并不是对象。在 Java 5 下,编译后的字节码如下:
 
0: iconst_5
1: istore_1
2: new #2; //class java/util/ArrayList
5: dup
6: invokespecial #3; //Method java/util/ArrayList."":()V
9: astore_2
10: aload_2
11: iload_1
12: invokestatic #4; //Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
15: invokevirtual #5; //Method java/util/ArrayList.add:(Ljava/lang/Object;)Z
18: pop
19: return
 
编号为 0 的行将整数常量 5 推送至堆栈,编号为 1 的行将堆栈顶端的 5 存储至第一个本地分片中。接下来,有四个操作符指令, new/dup/invokespecial/astore ,是通常用来新创建对象并存储在本地变量中的做法。接下来,在编号为 10 的行,将 ArrayList 的引用推送至队战,然后再将 x 本地的值推送至堆栈。编号为 12 的行我们看到 Java 调用了静态的 Integer.valueOf 方法,它需要一个单独的堆栈分片,并消费整数值 5 ,然后将包含着 5 Integer 对象推送到位。然后,这个对象就成为了 add 方法的参数,调用 add 方法就消费了 Integer ArrayList 的引用,并将 add 方法的返回值推送回堆栈。
 
内部类(Inner Class)
JDK 1.1 发布时, Sun 引入了内部类,支持创建与外部类有着特殊的私有可见关系的嵌套类。 JVM 并未引入像 C++ 那样的 friend 功能,这就有点让 Java 使用者有个疑惑:在 JVM 本身强迫私有访问性时,而且把内部类看作跟其他类一样, Java 如何对类的访问进行授权?
 
在下面这个例子中,内部类显然可以访问外部类的 data 私有属性:
 
class Outer
{
        private int data = 12;
        public Inner getInner()
        {
               return new Inner();
        }
        public class Inner
        {
               public int getData()
               {
                       return data;
               }
        }
}
 
public class NestedFun
{
        public static void main(String[] args)
        {
               Outer o = new Outer();
               Outer.Inner i = o.getInner();
               System.out.println(i.getData());
               // prints 12; how?
        }
}
 
对于这段代码,编译器如何进行工作呢?我们从 NestedFun.main(String[]) 开始看字节码:
 
public static void main(java.lang.String[]);
        Code:
               Stack=2, Locals=3, Args_size=1
               0: new #2; //class Outer
               3: dup
               4: invokespecial #3; //Method Outer."":()V
               7: astore_1
               8: aload_1
               9: invokevirtual #4; //Method Outer.getInner:()LOuter$Inner;
               12: astore_2
               13: getstatic #5; //Field java/lang/System.out:Ljava/io/PrintStream;
               16: aload_2
               17: invokevirtual #6; //Method Outer$Inner.getData:()I
               20: invokevirtual #7; //Method java/io/PrintStream.println:(I)V
               23: return
 
这段字节码还是比较直接的: Java 使用了常用的 new/dup/invokespecial/astore 组合来创建 Outer 的实例,对 Outer.getInner() getData() 的调用,其中对 getData() 调用的返回值直接传入了 println() 方法 ( 注意,编译器选择先获取 System.out ,然后再是 getData() ,所以才能保证执行堆栈的位置顺序正确 ) 。这一段基本没啥,我们再来看 Outer.Inner.getDate() 方法:
 
public class Outer$Inner extends java.lang.Object
        SourceFile: "NestedFun.java"
        InnerClass:
               public #21= #4 of #18; //Inner=class Outer$Inner of class Outer
        minor version: 0
        major version: 50
        Constant pool: (snipped)
 
{
final Outer this$0;
 
public Outer$Inner(Outer);
        Code:
               Stack=2, Locals=2, Args_size=2
               0: aload_0
               1: aload_1
               2: putfield #1; //Field this$0:LOuter;
               5: aload_0
               6: invokespecial #2; //Method java/lang/Object."":()V
               9: return
 
public int getData();
        Code:
               Stack=1, Locals=1, Args_size=1
               0: aload_0
               1: getfield #1; //Field this$0:LOuter;
               4: invokestatic #3; //Method Outer.access$000:(LOuter;)I
               7: ireturn
}
 
这是去掉了一些输出后的结果,以便阅读。首先,我们看到了在 Java 规范中的“ outer this ”引用被显式加入内部类中作为一个属性,名为“ this$0 ”,并标记为 final 。其次,编译器也生成了内部类的构造函数,用一个外部类的引用为“ outer this ”赋值,所以我们可以假定在外部类的 getInner() 方法中的 new Inner() 会用到本构造函数。第三,在内部类的 getData() 方法上,访问了一个外部类的静态方法叫“ access$000 ”,来获取数据。
 
紧接着,我们可以看看外部类。
 
class Outer extends java.lang.Object{
private int data;
 
Outer();
        Code:
               0: aload_0
               1: invokespecial #2; //Method java/lang/Object."":()V
               4: aload_0
               5: bipush 12
                7: putfield #1; //Field data:I
               10: return
 
public Outer$Inner getInner();
        Code:
               0: new #3; //class Outer$Inner
               3: dup
               4: aload_0
               5: invokespecial #4; //Method Outer$Inner."":(LOuter;)V
               8: areturn
 
static int access$000(Outer);
        Code:
               0: aload_0
               1: getfield #1; //Field data:I
               4: ireturn
}
 
我们可以看见编译器生成了一个静态方法专为访问 data 开了个口子,不过“ access$000 ”是包内私有的,也就是说在同包内的类才能访问该方法。
 
Java字节码工具
Java 字节码功能工具很多,包括:
  • Javassist
  • Jasmin
  • ……
 

也许,最重要的拆解字节码的工具还是javap

The Java Virtual Machine Specification(2nd Edition) JVM规范(第二版)

你可能感兴趣的:(Java技术)