Java的class文件结构

在《深入理解java虚拟机》一书第6章讲到了java的类文件,并且详情介绍了java的class文件的内容。但是,真的,我觉着很多人看不懂,看的一脸懵逼啊,其实这一章的内容上绝对是没有问题的,但是组织结构实在是不合理。笔者结合java虚拟机规范给大家整理一下我们的认识。(https://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html)。

首先我们来看class文件的整体结构:
ClassFile {
1 u4 magic;
2 u2 minor_version;
3 u2 major_version;
4 u2 constant_pool_count;
5 cp_info constant_pool[constant_pool_count-1];
6 u2 access_flags;
7 u2 this_class;
8 u2 super_class;
9 u2 interfaces_count;
10 u2 interfaces[interfaces_count];
11 u2 fields_count;
12 field_info fields[fields_count];
13 u2 methods_count;
14 method_info methods[methods_count];
15 u2 attributes_count;
16 attribute_info attributes[attributes_count];
}
u1,u2,u4表示1个字节,2个字节,4个字节。一共16个内容,总结一下

第1行,magic,魔数,这个是都是固定的,在下文的class文件你也会看到,
四个字节,都是:CA FE BA BE

第2,3行,表示的是版本

第4,5行表示常量池

第6行表示这个类的访问表示(public,private等)
第7行,类的名字
第8行,父类的名字
第9,10行,实现的接口,如果没有,那么第10行的内容为空。下文会看到

第11,12行,字段的信息

第13,14行方法的信息

第15,16行属性的信息

我们需要关注的其实主要从4行以后,主要就是常量池、类继承关系和实现接口,类中的字段方法,还有就是其他的属性。

书中给了一段代码,我自己实现如下(除了包名其他都和书中一样)

package vitualmachine;

public class TestClass {
private int m;
public int inc(){
return m+1;
}
}
这些代码编译后的class文件如下:

CA FE BA BE 00 00 00 33 00 16 07 00 02 01 00 17
76 69 74 75 61 6C 6D 61 63 68 69 6E 65 2F 54 65
73 74 43 6C 61 73 73 07 00 04 01 00 10 6A 61 76
61 2F 6C 61 6E 67 2F 4F 62 6A 65 63 74 01 00 01
6D 01 00 01 49 01 00 06 3C 69 6E 69 74 3E 01 00
03 28 29 56 01 00 04 43 6F 64 65 0A 00 03 00 0B
0C 00 07 00 08 01 00 0F 4C 69 6E 65 4E 75 6D 62
65 72 54 61 62 6C 65 01 00 12 4C 6F 63 61 6C 56
61 72 69 61 62 6C 65 54 61 62 6C 65 01 00 04 74
68 69 73 01 00 19 4C 76 69 74 75 61 6C 6D 61 63
68 69 6E 65 2F 54 65 73 74 43 6C 61 73 73 3B 01
00 03 69 6E 63 01 00 03 28 29 49 09 00 01 00 13
0C 00 05 00 06 01 00 0A 53 6F 75 72 63 65 46 69
6C 65 01 00 0E 54 65 73 74 43 6C 61 73 73 2E 6A
61 76 61 00 21 00 01 00 03 00 00 00 01 00 02 00
05 00 06 00 00 00 02 00 01 00 07 00 08 00 01 00
09 00 00 00 2F 00 01 00 01 00 00 00 05 2A B7 00
0A B1 00 00 00 02 00 0C 00 00 00 06 00 01 00 00
00 03 00 0D 00 00 00 0C 00 01 00 00 00 05 00 0E
00 0F 00 00 00 01 00 10 00 11 00 01 00 09 00 00
00 31 00 02 00 01 00 00 00 07 2A B4 00 12 04 60
AC 00 00 00 02 00 0C 00 00 00 06 00 01 00 00 00
06 00 0D 00 00 00 0C 00 01 00 00 00 07 00 0E 00
0F 00 00 00 01 00 14 00 00 00 02 00 15

下面我们拆解这个class文件:
CA FE BA BE 魔数
00 00 00 33版本号
00 16 常量池个数,21个
因为常量池的序号从1开始,0空出来了,所有0X16中有一个是空出来的,所以只有21个了。
使用javap反编译之后看到所有21个常量:前面是序号,后面介绍的属性或者其他信息的index对应的数值就是这个标号,注意进制转换。
Constant pool:

1 = Class #2 // vitualmachine/TestClass

2 = Utf8 vitualmachine/TestClass

3 = Class #4 // java/lang/Object

4 = Utf8 java/lang/Object

5 = Utf8 m

6 = Utf8 I

7 = Utf8

8 = Utf8 ()V

9 = Utf8 Code

10 = Methodref #3.#11 // java/lang/Object."":()V

11 = NameAndType #7:#8 // "":()V

12 = Utf8 LineNumberTable

13 = Utf8 LocalVariableTable

14 = Utf8 this

15 = Utf8 Lvitualmachine/TestClass;

16 = Utf8 inc

17 = Utf8 ()I

18 = Fieldref #1.#19 // vitualmachine/TestClass.m:I

19 = NameAndType #5:#6 // m:I

20 = Utf8 SourceFile

21 = Utf8 TestClass.java

下面开始进入每个具体的常量:

每个常量的信息如下,一个字节表示类别,一个字节数组表示信息,这个字节数组的结构随第一个字节类别变化,不同的类型结构不同。
cp_info {
u1 tag;
u1 info[];
}

Constant Type Value
CONSTANT_Class 7
CONSTANT_Fieldref 9
CONSTANT_Methodref 10
CONSTANT_InterfaceMethodref 11
CONSTANT_String 8
CONSTANT_Integer 3
CONSTANT_Float 4
CONSTANT_Long 5
CONSTANT_Double 6
CONSTANT_NameAndType 12
CONSTANT_Utf8 1
CONSTANT_MethodHandle 15
CONSTANT_MethodType 16
CONSTANT_InvokeDynamic 18

第一个常量 07 00 02
07表示类常量,结构如下:
CONSTANT_Class_info {
u1 tag;
u2 name_index;
}
后面的 00 02 表示索引
第二个常量,01 00 17
76 69 74 75 61 6C 6D 61 63 68 69 6E 65 2F 54 65
73 74 43 6C 61 73 73
01表示是UTF8,长度是17,后面是具体的内容,对应23(0X17)个字字母:
vitualmachine/TestClass
CONSTANT_Utf8_info {
u1 tag;
u2 length;
u1 bytes[length];
}

第三个常量,类信息 07 00 04
第四个常量,UTF-8: 01 00 10
6A 61 76 61 2F 6C 61 6E 67 2F 4F 62 6A 65 63 74
第五个,UTF-8: 01 00 01 6D
第6个: 01 00 01 49
第7个: 01 00 06 3C 69 6E 69 74 3E
第8个:01 00 03 28 29 56
第9个:01 00 04 43 6F 64 65
第10个:0A 00 03 00 0B 0C 00
第11个:07 00 08
第12个:01 00 0F 4C 69 6E 65 4E 75 6D 62 65 72 54 61 62 6C 65
第13个:01 00 12 4C 6F 63 61 6C 56 61 72 69 61 62 6C 65 54 61 62 6C 65
第14个:01 00 04 74 68 69 73
第15个:01 00 19 4C 76 69 74 75 61 6C 6D 61 63 68 69 6E 65 2F 54 65 73 74 43 6C 61 73 73 3B
第16个:01 00 03 69 6E 63
第17个:01 00 03 28 29 49

CONSTANT_Fieldref_info {
u1 tag;
u2 class_index;
u2 name_and_type_index;
}
第18个:09 00 01 00 13
CONSTANT_NameAndType_info {
u1 tag;
u2 name_index;
u2 descriptor_index;
}
第19个:0C 00 05 00 06
第20个:01 00 0A 53 6F 75 72 63 65 46 69 6C 65
第21个:01 00 0E 54 65 73 74 43 6C 61 73 73 2E 6A 61 76 61

常量池结束之后是如下:

u2 access_flags;
u2 this_class;
u2 super_class;
u2 interfaces_count;
u2 interfaces[interfaces_count];

00 21 下面的组合 PUBLIC 和SUPER
Flag Name Value Interpretation
ACC_PUBLIC 0x0001 Declared public; may be accessed from outside its package.
ACC_FINAL 0x0010 Declared final; no subclasses allowed.
ACC_SUPER 0x0020 Treat superclass methods specially when invoked by the invokespecial instruction.
ACC_INTERFACE 0x0200 Is an interface, not a class.
ACC_ABSTRACT 0x0400 Declared abstract; must not be instantiated.
ACC_SYNTHETIC 0x1000 Declared synthetic; not present in the source code.
ACC_ANNOTATION 0x2000 Declared as an annotation type.
ACC_ENUM 0x4000 Declared as an enum type.

00 01 这个类,第1个常量
00 03 父类,第3个常量
00 00 接口数0,所以interfaces[interfaces_count];就不表示,空出来了。

接着是属性

u2 fields_count;
field_info fields[fields_count];
只有一个字段:
field_info {
u2 access_flags;
u2 name_index;
u2 descriptor_index;
u2 attributes_count;
attribute_info attributes[attributes_count];
}

00 01 00 02 00 05 00 06 00 00
属性值是0,所以attribute_info 没有表示。

接下来是方法

u2             methods_count;
method_info    methods[methods_count];

两个方法
00 02

第一个方法

method_info {
u2 access_flags;
u2 name_index;
u2 descriptor_index;
u2 attributes_count;
attribute_info attributes[attributes_count];
}
00 01 00 07 00 08 00 01 一个属性:
属性索引是09,对应Code
00 09
Code_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 max_stack;
u2 max_locals;
u4 code_length;
u1 code[code_length];
u2 exception_table_length;
{ u2 start_pc;
u2 end_pc;
u2 handler_pc;
u2 catch_type;
} exception_table[exception_table_length];
u2 attributes_count;
attribute_info attributes[attributes_count];
}

00 00 00 2F 长度
00 01 最大栈
00 01 最大locals
00 00 00 05 代码长度5个
2A B7 00 0A B1 代码
00 00 异常, 没有
00 02 属性两个
第一个属性 LineNumberTable
LineNumberTable_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 line_number_table_length;
{ u2 start_pc;
u2 line_number;
} line_number_table[line_number_table_length];
}
00 0C 索引
00 00 00 06长度是6
00 01 00 00 00 03

第2个属性:LocalVariableTable
LocalVariableTable_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 local_variable_table_length;
{ u2 start_pc;
u2 length;
u2 name_index;
u2 descriptor_index;
u2 index;
} local_variable_table[local_variable_table_length];
}
00 0D 索引
00 00 00 0C 长度 12
00 01 00 00 00 05 00 0E 00 0F 00 00

第二个方法:

method_info {
u2 access_flags;
u2 name_index;
u2 descriptor_index;
u2 attributes_count;
attribute_info attributes[attributes_count];
}
00 01 表示public
00 10 第16个常量
00 11
00 01 一个属性,和第一个方法一样都是Code
00 09
00 00 00 31 长度49
00 02 00 01 00 00 00 07 2A B4 00 12 04 60 AC 00
00 00 02 00 0C 00 00 00 06 00 01 00 00 00 06 00
0D 00 00 00 0C 00 01 00 00 00 07 00 0E 00 0F 00
00

最后剩下的,其他属性

u2 attributes_count;
attribute_info attributes[attributes_count];

00 01 长度是1
00 14 第14个常量 sourcefile
SourceFile_attribute {
u2 attribute_name_index;
u4 attribute_length;
u2 sourcefile_index;
}
00 00 00 02 长度
00 15 索引对应21个,就是最后一个常量TestClass.java
到处结束。

你可能感兴趣的:(Java的class文件结构)