【类加载机制】从一道面试题开始

0x01.某厂面试题

请阐述Java自带哪些加载器以及对应的职责?

(1)Bootstrap ClassLoader(启动类加载器):负责加载\lib目录,或-Xbootclasspath指定目录下的jar。
特殊说明:JVM认为合理的jar文件名才会被加载,例如:rt.jar、tools.jar,文件名不符合的jar即使放在上述目录下也不会被加载。

(2)Extension ClassLoader(扩展类加载器):负责加载\lib\ext目录,或java.ext.dirs指定目录下的jar。
特殊说明:Java9以后引入了模块化机制,此加载器被此机制取代。

(3)Application ClassLoader(应用程序类加载器):负责加载用户类路径(ClassPath)上的jar包。

此题出处:周志明的《深入理解Java虚拟机》-7.4.类加载器,变形题很多:
例如:请你选出哪些不是Java自带的类加载器;
例如:给出各类类加载器的描述、职责,选错误的;
例如:将上述类加载器的特殊说明作为干扰选项;——这种题可以无情坑杀很多程序猿...

0x02.不要背,要理解

至此,我们似乎没必要大费周章地解读这样一道记忆题。背下来不就可以了吗?笔者认为不是:
发展24年的Java及JVM,历经若干版本的商业斗争(A new future for Java),衍生出若干语(语)言(法)特(陷)性(阱)。
"背下来就行"的前提有二,可惜对于Java这些语(语)言(法)特(陷)性(阱)都不成立:

(1)知识输入是无二义性的、与时俱进的。
(2)知识输入是有限集。

所以,笔者坚定的认为唯Java程序员最有资格喊出"我秃了,我也变强了"。
所以,笔者坚定的认为唯"深刻理解JVM"(即,深刻理解语法特性到JVM层,甚至操作系统层),是Java程序员的最有效的防秃良药。

0x03.从韩国星工厂看类加载机制的全貌

From《深入理解Java虚拟机》-周志明

Java虚拟机将描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终变成被虚拟机可以直接使用的Java类型,这个过程被称作Java虚拟机的类加载机制......与那些在编译时需要进行连接的语言不同,在Java语言里面,类型的加载、连接和初始化过程都是在程序运行期间完成的......用户可以通过Java预置的或自定义类加载器...作为其程序代码的一部分。

从这段经典且严谨的描述,我们可以抽象8个问题,以此宏观地获得类加载机制的全貌:

问题1:加载什么?
问题2:加载得到了什么?
问题3:从哪里加载?
问题4:加载到哪里去?
问题5:何时加载?
问题6:加载流程有几步?
问题7:加载流程如何实现?
问题8:类加载器的约束?

(1)加载什么?

我们在.java文件中编写了一堆代码,被转换成字节码(.class文件),JVM加载就是这个字节码
这个字节码描述的信息[1]包括(但不限于):

有哪些类、哪些接口;
每个类有哪些属性、行为;
类和类的关系;
...

这些信息就是程序员定义的"模板",在程序运行时,当需要基于类A创建实例对象a时,JVM就要先找到类A对应的"模板"。

这些"模板",就像韩国星工场包装女团时的"剧本",每个女星都是基于某个"模板"创建的实例对象,女星的身高、体重、才艺就是"模板"中描述的"属性、行为"。


[1]:本文聚焦类加载机制的全貌,以后再其他文章展开

(2)加载得到了什么?

字节码加载到内存后得到的信息内容还是(1)中提到的字节码中包含的信息,但信息形式变了,抽象、简单地理解为JVM能认识的数据结构[2]

这就像娱乐公司的策划团队在电脑上写好了女团出道的"剧本",女团的经纪人要无差错地仔细阅读"剧本"的电子件,把"剧本"存储在大脑中,以备后续使用。


[2]:本文聚焦类加载机制的全貌,以后再其他文章展开

(3)从哪里加载?

用一张表,说明字节码文件与经纪人的类比关系:

字节码文件在哪里? 剧本在哪里?
在本地磁盘上,JVM在指定目录去查找 在电脑上,经纪人去指定目录去打开看
在网络上,JVM在指定网络路径上去查找 在某个网站上,经纪人去这个网站上看
JVM根据某些规则动态生成 经纪人自行加戏,随机应变

这一点也是JVM给Java程序员的自由,很多著名的产品就是在这个点上做了文章。

(4)加载到哪里去?

这个问题最好回答:内存,具体指的是JVM的运行时数据区,再具体一点是运行时数据区中的方法区[3]

[3]:本文聚焦类加载机制的全貌,以后再其他文章展开

(5)何时加载?

类加载发生在运行时,这也是Java、C#这类语言推崇的动态性。

动态性是一把双刃剑,运行时加载意味着需要"边执行,边连接"。
这就好像女团经纪人不是提前把"剧本"烂熟于胸,而是到了女团演出现场,才掏出"剧本",现场理解、现场执行。
以现实生活的经验,这样的经纪人,看起来不太靠谱。

当然,动态性一定是源于某些特定场景和需求,Java为了靠谱,也引出了虚拟机中另一个大的课题:JIT(即时编译),围绕着"如何提升运行时的编译效率"会有很多有趣的故事。

(6)加载流程有几步?

在(2)中我们提到女团的经纪人要无差错地仔细阅读"剧本"的电子件,关键词是无差错
我们再用一张表,类比一下[4]

加载流程? 经纪人阅读剧本的流程?
STEP1.加载(Load):将字节码文件变成内存的数据结构 STEP1.加载:经纪人打开剧本,读了一遍剧本
STEP2.连接(Link) STEP2.连接
STEP2.1.验证(Verify):验证文件格式、元数据、字节码、符号引用,最终保证JVM的安全可靠 STEP2.1.验证:经纪人若有所思的翻了翻剧本,确认没拿错剧本吧?不会是包装男团的剧本吧?
STEP2.2.准备(Prepare):"static"的内存分配与赋值 STEP2.2.准备:女团不管包装几个人(实例),她们肯定需要一个训练房(static变量),现在就租好
STEP2.3.解析(Resolve):符号引用转为直接引用。例如:类A有个成员变量,类型是类B,类B在哪呢? STEP2.3.解析:剧本中Lisa的那一页说她出道前在一个泰国舞团,泰国舞团的资料在剧本附件2,经纪人如果需要查看泰国舞团资料的时候,就知道去翻附件2
STEP3.初始化(Init):执行构造函数,触发关联类的解析 STEP3.初始化:经纪人前期准备差不过了,可以给Lisa(实例)打个电话:Lisa同学,快来做一下出道前的准备(构造函数)

表格中存在不严谨(通俗)的表达,但相信读者已经关注到了两个核心要点:

(1)加载流程有几步
(2)每一步的作用是什么

[4]:上述加载流程每一步存在一些JVM实现的细节,例如:上述步骤一定是顺序执行的吗?例如:直接引用需要反复解析吗?这些都有必要详细解读,本文暂不展开。

(7)加载流程如何实现?

至此,终于可以和本文开头的面试题呼应上了,前文我们探讨了

加载什么=>加载得到了什么=>从哪里加载=>加载到哪里去=>何时加载=>加载流程有几步

那么这都是JVM的规范、规格,怎么实现?类加载器就是类加载机制的具体实现。
不同类型的加载器相当于公司不同的角色,都去自己专属的文件夹去查找并加载类

Bootstrap加载器相当于经济公司老板
Extension加载器相当于经纪人
Application加载器相当于女团艺人

(8)类加载器的约束?

既然有不同的类加载器,它们之间必然有配合关系,否则两个人干了同一个工作,对外口径还不同,咋办?
JVM定义了这种配合关系,还取了个高大上的名字"双亲委派模型",笔者认为这种模型应该叫"保姆式管理模型"
还是一张表类比一下:

双亲委派模型 保姆式管理模型
STEP1.程序需要加载一个类 STEP1.记者问Lisa:某天晚上和你一起上车的神秘男子是谁?
STEP2.Application加载器一脸懵逼的问Extention加载器,领导,你能加载不? STEP2.Lisa一脸懵逼的问经纪人,欧巴,你帮我回答一下嘛?
STEP3.Extention加载器无助的看着Bootstrap加载器,领导,你能加载不? STEP3.经纪人无助的看看经纪公司老板,老大,还是你回答一下吧
STEP4.Bootstrap加载器无奈的摇摇头:试试看吧,我能加载就加载,不能的话,Extension,还是你自己试试 STEP4.老板摇摇头:试试看吧,我能回答就回答,不能答复,经纪人,你自己试试
STEP5.(假设Bootstrap不能加载)Extension无奈的摇摇头:我自己试试吧,不能加载的话,Application,你自己试试吧。 STEP6.(假设老板不能答复)经纪人苦笑了:我试试吧,不能回答,Lisa,你自己上吧。
STEP7.(假设Extension不能加载):Application自己来吧 STEP7.(假设经纪人不能回答)Lisa娇羞道的回答记者:恩~~伦家也不知道...反正不是蔡徐坤...

双亲委派模型,本质上是说"领导先上,领导不行我再上"。
这种管理风格,自然也有弊端。历史上有4次破坏双亲委派模型[5]的事件。
破坏双亲委派模型的本质,是"管理团队的风格多样化",例如:"扁平化团队"、"先干了再说团队"等等。
[5]:每种"管理风格"也各有利弊,这也是JVM发展历程中可以仔细学习的技术点,笔者在后续文章中再来探讨。

0x03 小结

我们从一道面试题开始,通过8个问题看到了类加载机制的全貌。

加载什么->加载得到了什么->从哪里加载->加载到哪里去->何时加载->加载流程有几步->加载流程如何实现->类加载器的约束

本文篇幅有限,还留下了一些重要、有趣的细节,未来笔者还会继续展开

字节码描述的信息
JVM能认识的数据结构
方法区的结构
加载流程每一步存在一些JVM实现的细节
破坏双亲委派模型

最后,笔者还想谈谈"理解优于记忆"的个人观点:深入理解JVM的原理对于实战的意义就是"先验知识",是"性能调优、内存泄露、OSGI"等疑难杂症、高级框架的"基础",如果能看到这类面试题背后的Why、What、How,您就获得了探寻计算机秘境的不二法门。

你可能感兴趣的:(【类加载机制】从一道面试题开始)