深入理解JVM6-类文件结构


title: jvm6
date: 2016-10-24 16:36:18
categories: jvm
tags: jvm


类文件结构

1.无关性的基石

深入理解JVM6-类文件结构_第1张图片

2.Class文件结构介绍

class文件是一组以八位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在class文件中,中间没有添加任何分隔符,这使得整个class文件中存储的内容几乎全部都是程序运行的必要数据,没有空隙存在。当需要占用8位字节以上的空间数据时,则会按照高位在前的方式分割成若干个8位字节进行存储。

根据java虚拟机规范的规定,class文件格式采用一种类似c语言结构体的伪结构来存储,这种伪结构中只有两种数据类型:无符号数和表。

无符号数:无符号数属于基本的数据类型,以u1,u2,u4,u8来分别代表1个字节,2个字节,4个字节和8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值,或者按照utf-8编码构成字符串值。

表:表是由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性地以“_info“结尾。表用于描述有层次关系的复合结构的数据,整个class文件本质上就是一张表,它由下列数据项构成:

ClassFile {  
    u4 magic;//魔数(0xCAFEBABE)  
    u2 minor_version;//次版本号  
    u2 major_version;//主版本号  
    u2 constant_pool_count;//常量池容量计数值  
    cp_info constant_pool[constant_pool_count-1];//常量池  
    u2 access_flags;//访问标志  
    u2 this_class;//类索引  
    u2 super_class;//父类索引  
    u2 interfaces_count;//接口计数器  
    u2 interfaces[interfaces_count];//接口索引集合  
    u2 fields_count;//字段计数器  
    field_info fields[fields_count];//字段表  
    u2 methods_count;//方法计数器  
    method_info methods[methods_count];//方法表  
    u2 attributes_count;//属性表计数器  
    attribute_info attributes[attributes_count];//属性表集合  
}  

无论是无符号数还是表,当需要描述的同一类型但是数量不定的多个数据时,经常会使用一个前置的容量计数器加若干个连续的数据项的形式(比如说一个类可能实现了多个接口,这时候需要一个计数器来指定接口的数量),这时候称这一系列连续的某一类型的数据为某一类型的集合。上面的文件格式是固定的,每个数据项的顺序,占用字节数都是被严格限定的,不允许改变。

1.魔数:class文件头四个字节代表魔数,它的作用是用于确定该文件是一个能被虚拟机接受的class文件,其值为0xCAFEBABE.

2.版本:魔数后四个字节代表class文件的版本号,其中前两个字节代表次版本号,后两个字节代表主版本号。高版本的jdk能向下兼容以前版本的class文件,但不能运行以后版本的class文件。

3.常量池:主版本之后的是常量池入口,常量池是class文件结构中与其他项目关联最多的数据类型,也是占用class文件空间最大的数据项目之一,同时还是在class文件中第一个出现的表类型的数据项目。因为常量池中常量数量不固定,所以在常量池入口前需要放置一个计数器,占用两个字节。比如如果该位置的值为0x0016,那就代表常量池中有21项常量(从1开始),第0项空出来是为了满足后面某些指向常量池的索引值的数据在特定情况下需要表达”不引用任何一个常量池项目“的意思,这种情况就可以把索引置为0来表示。class文件结构只有常量池的容量计数器是从1开始的,其他集合类型都是从0开始的。
常量池中主要存放两类数据:字面量和符号引用;
(1)字面量:比如文本字符串,被声明为final的常量值等。
(2)符号引用:包括类和接口的权限定名,字段的名称和描述符,方法的名称和描述符。

4.访问标志(access_flags):常量池之后,紧接着的两个字节代表访问标志,这个标志用于识别一些类或者接口层次的访问信息(比如这个class是否是public是否是final等等)。

5.类索引,父类索引,接口索引:类索引和父类索引都是一个u2类型的数据,而接口索引集合时一组u2类型的数据的集合,class文件中由这三项数据来确定这个类的继承关系。类索引用于确定这个类的全限定名,父类索引用于确定这个类的父类的全限定名(除了kava.lang.Object以外所有类的父类索引均不为0)。接口索引集合用来描述这个类实现了哪些接口。
类索引和父类索引用两个u2类型的索引值表示,它们各自指向一个类型为CONSTANT_Class_info的类描述符常量,通过CONSTANT_Class_info类型的常量中的索引值可以找到定义在CONSTANT_Utf8_info类型的常量中的全限定名字符串。

6.字段表集合:字段表集合用于描述接口或者类中声明的变量。字段包括了类级变量或者实例级变量,但是不包括方法内部声明的变量。

7.方法表集合:内容跟属性表集合基本一致

8.属性表集合:在class文件、字段表、方法表中都可以携带字节的属性表集合,用于描述某些场景专有的信息。属性表中的数据项目不需要有严格的顺序,java虚拟机在运行时会自动的忽略掉不认识的属性,其中系统预定义了9种虚拟机应该识别的属性,

连接:
http://blog.csdn.net/kobejayandy/article/details/39620833

3.字节码指令简介

详情见书中第6章。

你可能感兴趣的:(深入理解JVM6-类文件结构)