class文件结构

JVM 虚拟机不和包括Java在内的任何语言绑定,它只和class文件这种特殊的二进制文件格式所关联

1. class文件时一组以8位bit(一个字节)为单位的二进制流,各个数据项目严格按照顺序紧凑的排列,中间没有添加任何分隔符。

2. 两种数据类型:无符号数和表

  • 无符号数:以u1、u2、u4、u8来表示几个字节的无符号数,无符号数用来描述数组、索引应用、数量值或者按照UTF-8编码构成字符串值。
  • 表:是由多个无符号数或者其他表作为数据项构成的符合数据类型,所有表都习惯地以"_info"结尾。表用来描述有层次关系的符合结构的数据,整个class文件本质上就是一张表。

3. 内容

  1. 魔数(u4):0xCAFEBABE,用来确定这个文件是否为一个虚拟机接受的class文件
  • 版本号(u4):(次版本,主版本)。java分版本号是从45开始的,高版本的JDK能向下兼容低版本的class文件,但不能运行之后版本的class文件,即使文件格式没有发生变化,虚拟机也必须拒绝执行超过其版本的class文件。
  • 常量池:开头是常量池容量计数值,主要存放两大类常量:字面量和符号引用
  • 字面量:比较接近java语言层面的常量概念,如文本字符串、声明为final的常量值等。
  • 符号引用:包含三类常量:类和接口的全限定名、字段的名称和描述符、方法的名称和描述符
  • 常量池的作用:java在进行编译时(javac),没有其他连接过程,而是虚拟机进行加载时进行动态连接,也就是说class文件不会保存各个方法字段的内存布局信息,因此这些字段、方法的符号引用不经过运行期间进行转换的话,无法获得真正的内存入口地址,也就无法直接被虚拟机使用。当虚拟机运行时,需要从常量池获得对应的符号应用,再在创建时或者运行时解析、翻译到具体的内存地址之中
    后面的字段表,如类索引表、字段表、方法表中都是通过常量池中的索引来访问常量池中保存的常量信息的,他们本身并不保存这些信息。
  • 访问标志(u4):用于识别一些类或者接口的访问信息

包括:这个class是类还是接口;是否定义为public类型;是否定义为abstract类型;如果是类,是否声明了final等**

  • 类索引(u2)、父类索引(u2)与接口索引集合(u2集合)

class文件中由着三项数据来确定这个类的继承关系
类索引:用于确定这个类的全限定名
父类索引:用于确定这个类的父类的全限定名。

  • 字段数量和表集合:用于描述类变量和实例变量(不含局部变量

字段的作用域(public,private等)、实例变量还是类变量(static)、可变性(final)、并发可见性(volatile)、字段数据类型(基本类型、对象、数组)、字段名称索引等

  • 方法数量和表集合:和字段表类似,用来描述方法

包括:访问标志、名称索引、描述符索引、属性表集合
方法里的java代码,经过编译器编译成字节码指令后,存放在方法属性表集合中一个名为Code的属性里面。

  • 属性表集合:在class文件、字段表、方法表都可以携带自己的属性表集合,以用于描述某些场景专有的信息,比如字段的初始值、方法异常表等、内部类等信息。

包含:Code(方法表:编译成的字节码指令(含有方法体的才会有这个字段,抽象方法和接口方法则没有))、ConstantValue(字段表:final关键字定义的常量值)、Deprecated(类、方法表、字段表:被声明为的deprecated的方法和字段)、Exception(方法表:方法抛出的异常)、EnclosingMethod(类文件:局部类或者匿名类才拥有这个属性,用来标识这个类的外围方法)等等

4. 来看看一个例子

class文件结构_第1张图片

test包内有两个类:Person类,类和方法都是default访问权限,域都为private;Student继承自Person类,类和方法都是public访问权限,域都为private,并覆写了speak方法,在方法里调用了父类的speak方法。

步骤1:进入 test包目录下,找到Sutdent.java 文件
步骤2:执行命令 javac -d . Student.java 编译包内的java文件



此时会在当前目录(也可以修改-d 后面的参数指定其他目录)生成一个test文件夹,里面有两个类Student.class和Person.class


步骤3:退出到包含生成class包的上一层目录执行class文件

class文件结构_第2张图片

步骤4:javap -verbose test.Student反编译字节码,并将输出信息重定向到Student.verbose文本文件中

步骤5:查看Student.verbose

  1. 常量池部分


    class文件结构_第3张图片

    class文件结构_第4张图片

常量说明:

  • Methodref:方法全限定符号引用

    Methodref的描述中,见注释部分,(参数1类型;参数2类型;参数n类型;)返回值类型,其中返回值类型为void这用V来表示,Object类型用L来表述,其他基本类型用其关键字的大写首字母来表示(除了boolean类型,它用Z来表示,因为和byte重复了)

  • Fieldref:字段全限定符号引用
  • Class:类全限定符号引用
  • String:字符串类型字面量符号引用(String constant pool中的字面常量)
  • NameAndType:用来描述方法的方法名称以及参数类型返回值类型的全限定符号引用以及字段的类型的全限定符号引用
  • Utf8:类、方法、字段的全限定名称以及字符串常量都编码成UTF8类型,上面的符号引用都需要Utf8字段来描述,还需要注意的是此Utf8最大能表示65535个字符,即64KB英文字符,超出这个限制将无法编译,如定义一个超长的String字面量,将会无法编译。
  1. 方法表部分


    class文件结构_第5张图片

    class文件结构_第6张图片

    class文件结构_第7张图片

    属性说明:

  • descriptor:方法的签名全限定描述符,以及返回值类型
  • flags:方法的访问标志(ACC_PUBLIC、或者ACC_PRIVATE、或者ACC_PROTECTED),以及属于类的方法还是属于实例的方法(ACC_STATIC)
  • code:方法编译的字节码会放在code属性中,只有方法实体的方法表才会有这个属性,像抽象方法、接口中就没有code属性。

重点说一下code属性

  1. stack:最大栈深度,虚拟机根据这个字段来分配栈帧中操作数栈的最大深度。
  2. locals:方法局部变量表的所需的存储空间,如果为普通方法则第一个变量即为this,静态方法没有this。
  3. args_size:方法参数长度,当为普通方法时,参数还会有this,这是在对一个对象上调用方法时自动传入的,然后放在locals的第一个位置上,静态方法没有this。
  4. code:方法源码编译后的字节码。
  5. LineNumberTable:用来描述java源代码行号和字节码行号(偏移量)之间的对应关系,不是必须的,主要作用是在抛出异常时显示源码的行号。
    比如


    class文件结构_第8张图片

你可能感兴趣的:(class文件结构)