深入理解JVM:类加载机制

虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制

一、类加载的时机

类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)7个阶段。其中验证、准备、解析3个部分统称为连接(Linking),这7个阶段的发生顺序如下图。
深入理解JVM:类加载机制_第1张图片
其中,加载、验证、准备、初始化和卸载这5个阶段的顺序是固定的,类的加载过程必须按照这种顺序按部就班地开始,而解析则不一定:解析在某些情况下可以在初始化阶段之后再开始,这是为了支持Java语言的运行时绑定。

那么什么情况下需要触发类加载过程的第一个阶段:加载?

对于初始化阶段,虚拟机规范则严格规定了有且只有5种情况必须立即对类进行“初始化”:

  1. 遇到newgetstaticputstaticinvokestatic 这4条字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。生成这4条字节码指令常见的Java代码场景是:使用 new关键字实例化对象的时候、读取或设置一个类的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外)的时候,以及调用一个类的静态方法的时候
  2. 使用 java.lang.reflect 包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化。
  3. 当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
  4. 当虚拟机启动时,虚拟机会先初始化执行的主类(包含main()方法的那个类)
  5. 当使用JDK1.7的动态语言支持时,如果一个 java.lang.invoke.MethodHandle 实例最后解析的结果是 REF_getStatic、REF_putStatic、REF_invokeStatic 的方法句柄,并且这个方法句柄所对应的类没有进行过初始化,则需要先触发其初始化。

二、类加载的过程

Java虚拟机中类加载的全过程也就是加载、验证、准备、解析、初始化这5个阶段。

2.1、加载

目的:查找并加载类的二进制数据。

加载是“类加载”(Class Loading)过程的一个阶段,虚拟机需要完成一下3件事:

  1. 通过一个类的全限定名来获取定义此类的二进制字节流
  2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
  3. 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口

加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中,而且在Java堆中也创建一个java.lang.Class类的对象,这样便可以通过该对象访问方法区中的这些数据。

2.2、验证

目的:确保被加载的类的正确性和可靠性

验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。

验证阶段大致会完成4个阶段的检验动作:

  1. 文件格式验证:验证字节流是否符合Class文件格式的规范;例如:是否以0xCAFEBABE开头、主次版本号是否在当前虚拟机的处理范围之内、常量池中的常量是否有不被支持的类型。
  2. 元数据验证:对字节码描述的信息进行语义分析(注意:对比javac编译阶段的语义分析),以保证其描述的信息符合Java语言规范的要求;例如:这个类是否有父类,除了java.lang.Object之外。主要目的是对类的元数据信息进行语义校验,保证不存在不符合Java语言规范的元数据信息。
  3. 字节码验证:通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。这个阶段将对类的方法体进行校验分析,保证类的方法在运行时不会做出危害虚拟机安全的事件。
  4. 符号引用验证:确保解析动作能正确执行,如果无法通过符号引用验证,那么将会抛出一个 java.lang.IncompatibleClassError 异常的子类。

验证阶段是非常重要的,但不是必须的,它对程序运行期没有影响,如果所引用的类经过反复验证,那么可以考虑采用-Xverifynone参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。

2.3、准备

目的: 为类的静态变量分配内存,并将其初始化为默认值(零值)

准备阶段是正式为类变量分配内存并设置类变量初始值(零值)的阶段,这些内存都将在方法区中分配。

例如:

public static int value = 123;

那么变量value在准备阶段的初始值为 0 而不是123,因为这个时候尚未开始执行任何Java方法,而把value赋值为123的 pubstatic 指令是程序被编译后,存放类构造器() 方法中,所以把value赋值为123的动作将在初始化阶段才会执行。

2.4、解析

目的: 把类中的符号引用转换为直接引用

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行。

符号引用就是一组符号来描述目标,可以是任何字面量。

直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。

2.5、初始化

作用:为类的静态变量赋予正确的初始值,JVM负责对类进行初始化,主要对类变量进行初始化。

初始化阶段是执行类构造器() 方法的过程。

在Java中对类变量进行初始值设定有两种方式:

  • ①、声明类变量是指定初始值
  • ②、使用静态代码块为类变量指定初始值

三、类与类加载器

虚拟机设计团队把类加载阶段的 “通过一个类的全限定名来获取描述此类的二进制字节流” 这个动作放大Java虚拟机外部去实现,以便让应用程序自己决定如何去获取所需要的类。实现这个动作的代码模块称为 “类加载器”。

3.1、类与类加载器

对于任意一个类,都需要由加载它的类加载器和这个类的本身一同确立其在Java虚拟机中的唯一性,每一个类加载器,都拥有一个独立的类名空间。即:
比较两个类是否相等,只有在这两个类由同一个类加载器加载的前提下才有意义。否则,即使这两个类来源于同一个Class文件,被同一个虚拟机加载,只要加载它们的类加载器不同,那这连个类就必定不相等。

3.2、双亲委派模型

从Java虚拟机角度来说只存在两种类加载器:

  • 启动类加载器,这个类加载器使用C++语言实现,是虚拟机自身的一部分
  • 所有其它类加载器,由Java语言实现,独立于虚拟机外部,并且全部继承自java.lang.ClassLoader

从Java开发者角度,类加载器可以划分以下3种:

  • 启动类加载器(Bootstrap ClassLoader)
  • 扩展类加载器(Extension ClassLoader)
  • 应用程序类加载器(Application ClassLoader),ClassLoader中getSystemClassLoader()方法的返回值,所以也称为系统类加载器
    深入理解JVM:类加载机制_第2张图片

上图中展示的类加载之间的这种层次关系,称为类加载器的双亲委派模型。

双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应当应有自己的父类加载器。这里类加载器之间的父子关系一般不会以继承的关系来实现,而是都使用组合关系来复用父加载器的代码。

双亲委派的工作过程:

如果一个类加载收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载都是如此,因此所有的类加载请求最终都因该传送到顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个请求时(它的搜索范围中没有找到所需的类),子加载器才会尝试自己去加载。

双亲委派的优势:

  • 避免重复加载:Java类随着它的类加载器一起具备了一种带有优先级的层次关系,通过这种层级关系可以避免类的重复加载,当父类已经加载了该类时,就没有必要子ClassLoader再加载一次。
  • 避免核心类被篡改:通过委托的方式,保障了核心库加载不会被替换。比如:java.lang.Object类,无论哪个类需要加载,最终都委派给模型顶端的启动类加载器进行加载,可以保障Object类在各种类加载器中都是同一个类。否则,没有双亲委派机制的话,用户自己编写了一个java.lang.Object,并放在程序的classPath中,那么系统将会出现Object类,Java类型体系中最基本的行为也无法保障,应用程序也将变得一片混乱。

你可能感兴趣的:(深入理解JVM,类加载机制,双亲委派模型)