前一篇文章已经对Class类文件匆匆一瞥,上一篇没看的,建议先看一下上一篇,这一篇就看一下具体的细节。
我们先随便创建一个类,代码如下。
运行main方法,这个时候会生成一个class文件,我们用文本编辑器打开它。
由于class文件中是二进制流,直接打开会显示一堆乱码,为了方便查看,我们以16进制编码格式打开文件,需要借助一下插件。
笔者用的是Nodepad++,在菜单栏中找到“插件”,依次选择“Plugin Manager”——“Show Plugin Manager”,找到“HEX-Editor”,点击“install”,安装成功后重启。
再次打开文件后,我们点击功能按钮中最后的那个“H”,这时,呈现在我们眼前的就是16进制的CLASS文件了,也就是说肉眼可见的2个字符,如“ca”,实际就是“1100 1010”,还记得上一篇说的吗,8个bit代表一个字节。
虽然说,这个Class文件终于转换成我们能认出来的字符了,但是这密密麻麻的字母数字都是啥啊?密集恐惧症都犯了!
别着急,我们接下来就来一点一点的解析。
一、 0-3字节:字符“ca fe ba be”,固定的标识,代表这是一个java的class文件。
其实这个“魔数”,并不是只有class文件才有。
让我们用Nodepad++分别打开两张不同的图片,内容以16进制展现。
我们惊奇的发现,前三个字节居然都是“89 50 4e 47”,到底是巧合还是人性的泯灭?
哈哈,不开玩笑,其实很多课执行文件都包含“魔数”,将文件的头四个字节用来标识文件属于什么格式,如下图所属(图片来自维基百科)。
如果我想把标识设置成“iloveyou”是不是很炫酷,哦,16进制里面没有“i”啊。
二、 4-7字节:标识后紧接着的四个字节是Class文件的版本号(笔者理解为:你用哪个java版本编译的class文件)。这其中又分为两部分。
4,5字节:小版本号(Minor Version,书中叫次级版本号),“00 00”转换成10进制就是“0”。
6,7字节:大版本号(Major Version,书中叫主版本号),“00 34”转换成10进制就是“52”。
那么,这两块组合到一起就是52.0。
而JAVA版本号从是45开始,JDK1.1之后,每个JDK大版本,JAVA版本号+1,52.0实际上就是JDK8.0了。
另外,一直都说JDK可以向下兼容,但不能向上兼容,也就是说,一旦虚拟机发现当前JDK版本低于class文件的版本,将不予执行。
前面是相对比较简单的,接下来的可以能就一点小复杂了,不过也不用紧张,这个看完就没了。
学习之前,我们在cmd执行命令:javap -v App,看一下App.class的反编译信息,更有助于我们的理解。
三、8,9字节:看一下类型表,类型是U2,说明占两个字节,名称为“constant_pool_count”,字面意思理解就是“常量池个数”,“00
22”说明总数有34项,但是需要注意的是第0项是空出来了(当某一个常量不指向任何引用的时候,则指向第0项),实际常量只有33个(即图中#1到#33)。
常量池中存两大类常量:
字面量:文本字符串,final的常量值;就是图中等于“=Utf8”的,如#7,#8等都是字面量。
符号引用:类和接口的全限定名(等于“Class”,如#5,#6);字段的名称和描述符(Fieldref);方法的名称和描述符(Methodref);
每一个常量都对应着下表中的一个类型。
四、知道了有多少个常量之后,就是具体的常量集合了,下面先看第一个。
a字节:“0a”转换为10进制就是10,查找上面的常量类型对应表,说明这个常量类型是“CONSTANT_Methodref_info”,我们再到下标中查询对应的常量和结构,可以看到tag占一个字节,值是10,其实就是a字节。只有确定了常量类型,才能确定下来接下来的字节含义。
b,c字节:根据“CONSTANT_Methodref_info”的结构,我们看到接着的index为u2,占两个字节,指向声明方法的类描述符的索引项,转化为十进制就是“06”,结合上面的反编译信息,指向的其实就是#6,#6又指向#27,也是java/lang/Object。
d,e字节:也是一个index,转化后指向的是#20,又指向……最后的值为"":()V,就是所说的方法名称描述符了。
看到这里,可能有的朋友开始迷惑了,这表示的是什么东西啊,代码里也没有啊?
看官,还记得大明湖畔的……呃,不,java类实例构造器的init方法吗!
看起来比较复杂,其实一步一步来,是不是很简单,剩下的常量感兴趣的亲自动手试试吧!
喜欢文章或想一起学习的朋友可以关注我,给我点赞,我将会持续更新,有什么疑问或文中有不当之处请给我留言,真诚地希望能与大家一起交流探讨,学习进步。