java中Class文件的结构

关于Class文件

并不是只有java文件进行编译之后会产生class文件,其他语言同时也可以在java虚拟机上进行运行。

Class类文件的结构:

Class文件是一组以8位字节为基础单位的二进制流文件,结构类似与C语言结构体的伪结构来存储,这种伪结构中只有两种数据类型,无符号数和表。

无符号数:

基本的数据类型,分别用u1,u2,u4,u8来代表1,2,4,8个字节

    作用是描述数字,索引,数量值,或者按照UTF-8编码构成的字符串

表:

    多个无符号数构成的符合数据类型,所有表都有字节的结构,Class文件其实就是一张大的表。

下面我们想详细说说class文件中是如何组成的.(注意,位数从0开始)

1.0-3前四个字节:魔数

    魔数的作用就是来确定这个文件是否是能被虚拟机所接受的Class文件,而为什么不是使用扩展名来判断是否是class文件类型那,是因为安全,因为扩展名是可变的.

2. 4-7个字节

    第四位和第五位,是文件主版本号,第六位和第七位是次版本号.,通过版本号可以确定是那个版本的虚拟机执行的

3. 8-9 常量池容量计数器(从1开始)

    能够确定常量池有多少项数据

4. 常量池

常量池中包含两种常量,字面量和符号引用。

 字面量:文本字符串,被final声明的常量值等。

符号引用常量:

        1.类和接口的全限定名;

        2.字段的名称和描述符;

        3.方法的名称和描述符;

 解释一下:

        class文件是不会保存java文件中代码的布局的,因为编译成为class文件之后都是一堆物理上连续的二进制,所以所有的字段和方法名都需要从常量池中获取对应的符号引用(类名,修饰符名等),在在类创建或者运行时解析的时候到具体的内存地址上。

(拓展)类和接口的全限定名:

        从原始的位置到类的位置,比如( class com.test.Test$NTest)包名.类名$内部类名。

4.1常量池的常量

常量池中的每一项常量都是一张表只不过,关于表结构请看图1.1.比如偏移量为 00000000A位置的就是第一个常量项,也就是A位置,如果这个位置的tag(标识符)为07,那么他就代表是CONSTANT_Class_info类型 ,他的表结构是u1+u2,也就是一共是六位字符,前两位是07的tag,后四位是name_index是会指向常量池中的之后的常量比如0002 指向第二项常量.

如果tag 为01 则为CONSTANT_Utf8_info,就是utf8编码的字符串(可能为第一项类类型常量的全限定名),而CONSTANT_Utf8_info的表结构为u1+u2+u1分别是tag+length+字符串长度,这里要注意:java中方法字段名称的最大长度就等于CONSTANT_Utf8_info中规定的length,也就是64k如果大于64k将不会被编译.

1.1常量池的项目类型

而每一种项目类型的表结构都是不同,这里列举CONSTANT_Utf8_info类型:

1.2CONSTANT_Utf8_info  表结构

tag  标识位,标志那种项目类型的常量

length  长度

bytes length长度的字节数组

CONSTANT_Utf8_info通常是作为类文件中方法,字段的符号引用,所以bytes大多数存储的都是方法,字段的名字。

5.访问标志

    在常量池结束之后紧接着的连个字节代表访问标志,他将会确定这个类为public类型,是否是抽象类,是类还是接口,是否被final修饰

6.类索引,父索引,和接口索引集合:

类索引用来确定一个类的全限定名,父索引确定一个类的父类,这两个都是一组u2类型的数据;

    接口索引集合用来确定一个类的实现的接口,是很多组u2类型的数据

7.字段表集合:

用来描述接口或者类中声明的变量,字段包括类级变量和实例级变量:

    字段表集合可以描述一个类的修饰符,名称等

1.3字段表结构

access_flags:标识符,用来确定字段的修饰符;

name_index :常量池的引用,对应的是字段的简单名称;

descriptor_index:字段的描述符,用来描述字段的数据类型,方法参数列表,返回值。

attributes_info:属性表集合,描述字段其余的信息,比如int a=123; 123就会在属性表中进行描述。

8.方法表集合:

1.4 方法表结构

大致是跟字段表集合差不多的。不多说

attributes_info:存放方法中的代码等信息。

9.属性表集合:

    字段表,方法表都可以携带属性表,用于描述某些场景专有的信息。

1.5 属性表中的属性

1.Code:存放代码,其实也是一对字节码指令(接口,或者抽象类的方法没有此属性。)

2.ConstatntValue:通知虚拟机自动为静态变量赋值。

这里有个问题:

被static修饰和被final 和 static 同时修饰的变量有什么区别?

被static和final修饰的基本变量和String类型的变量是会使用ConstantValue进行初始化操作的,其余的只被static修饰的变量或者是被static和final修饰的引用类型的变量,是会在client中进行初始化赋值的。

其余的属性这里就不一一详解了,有兴趣的可以去网上查查资料,这里就说几个比较特殊的

你可能感兴趣的:(java中Class文件的结构)