一个 Java 文件从编码完成到最终执行,一般主要包括两个过程
编译
运行
编译,即把我们写好的 java 文件,通过 javac 命令编译成字节码,也就是我们常说的.class 文件。
运行,则是把编译声称的.class 文件交给 Java 虚拟机 (JVM) 执行。
而我们所说的类加载过程即是指 JVM 虚拟机把.class 文件中类信息加载进内存,并进行解析生成对应的 class 对象的过程。
举个通俗点的例子来说,JVM 在执行某段代码时,遇到了 class A, 然而此时内存中并没有 class A 的相关信息,于是 JVM 就会到相应的 class 文件中去寻找 class A 的类信息,并加载进内存中,这就是我们所说的类加载过程。
类加载的过程主要分为三个部分:
加载
链接
初始化
而链接又可以细分为三个小部分:
验证
准备
解析
简单来说,加载指的是把 class 字节码文件从各个来源通过类加载器装载入内存中。
这里有两个重点:
字节码来源。一般的加载来源包括从本地路径下编译生成的.class 文件,从 jar 包中的.class 文件,从远程网络,以及动态代理实时编译
类加载器。一般包括启动类加载器,扩展类加载器,应用类加载器,以及用户的自定义类加载器。
BootstrapClassLoader
ExtensionClassLoader
ApplicationClassLoader
CustomerClassLoader
注:为什么会有自定义类加载器?
一方面是由于 java 代码很容易被反编译,如果需要对自己的代码加密的话,可以对编译后的代码进行加密,然后再通过实现自己的自定义类加载器进行解密,最后再加载。
另一方面也有可能从非标准的来源加载代码,比如从网络来源,那就需要自己实现一个类加载器,从指定源进行加载。
主要是为了保证加载进来的字节流符合虚拟机规范,不会造成安全错误。
包括对于文件格式的验证,比如常量中是否有不被支持的常量?文件中是否有不规范的或者附加的其他信息?
对于元数据的验证,比如该类是否继承了被 final 修饰的类?类中的字段,方法是否与父类冲突?是否出现了不合理的重载?
对于字节码的验证,保证程序语义的合理性,比如要保证类型转换的合理性。
对于符号引用的验证,比如校验符号引用中通过全限定名是否能够找到对应的类?校验符号引用中的访问性(private,public 等)是否可被当前类访问?
主要是为类变量(注意,不是实例变量)分配内存,并且赋予初值。
特别需要注意,初值,不是代码中具体写的初始化的值,而是 Java 虚拟机根据不同变量类型的默认初始值。
比如 8 种基本类型的初值,默认为 0;引用类型的初值则为 null;常量的初值即为代码中设置的值,final static tmp = 456, 那么该阶段 tmp 的初值就是 456
将常量池内的符号引用替换为直接引用的过程。
两个重点:
符号引用。即一个字符串,但是这个字符串给出了一些能够唯一性识别一个方法,一个变量,一个类的相关信息。
直接引用。可以理解为一个内存地址,或者一个偏移量。比如类方法,类变量的直接引用是指向方法区的指针;而实例方法,实例变量的直接引用则是从实例的头指针开始算起到这个实例变量位置的偏移量
举个例子来说,现在调用方法 hello (),这个方法的地址是 1234567,那么 hello 就是符号引用,1234567 就是直接引用。
在解析阶段,虚拟机会把所有的类名,方法名,字段名这些符号引用替换为具体的内存地址或偏移量,也就是直接引用。
调用的是<clinit>()方法
这个阶段主要是对类变量初始化,是执行类构造器的过程。
换句话说,对 static 修饰的变量或语句以及构造器进行初始化。
如果初始化一个类的时候,其父类尚未初始化,则优先初始化其父类。
如果同时包含多个静态变量和静态代码块,则按照自上而下的顺序依次执行。
类加载过程只是一个类生命周期的一部分,在其前,有编译的过程,只有对源代码编译之后,才能获得能够被虚拟机加载的字节码文件;在其后还有具体的类使用过程,当使用完成之后,还会在方法区垃圾回收的过程中进行卸载。
父类的静态代码块
子类的静态代码块
父类的非静态代码块
父类的构造方法
子类的非静态代码块
子类的构造方法