首先注意几个核心:加载类, 初始化, 创建对象
Java虚拟机如何把编译好的.class文件加载到虚拟机里面?加载之后如何初始化类?静态类变量和实例类变量的初始化过程是否相同,分别是如何初始化的呢?这篇文章就
是解决上面3个问题的。
若有不正之处,请多多谅解并欢迎各位能够给予批评指正,提前谢谢各位了。
1. Java虚拟机加载.class过程
虚拟机把Class文件加载到内存,然后进行校验,解析和初始化,最终形成java类型,这就是虚拟机的类加载机制。加载,验证,准备,初始化这5个阶段的顺序是确定的,
类的加载过程,必须按照这种顺序开始。这些阶段通常是相互交叉和混合进行的。解析阶段在某些情况下,可以在初始化阶段之后再开始---为了支持java语言的运行时绑定。
Java虚拟机规范中,没有强制约束什么时候要开始加载,但是,却严格规定了几种情况必须进行初始化(加载,验证,准备则需要在初始化之前开始):
1)遇到 new、getstatic、putstatic、或者invokestatic 这4条字节码指令,如果没有类没有进行过初始化,则触发初始化
2)使用java.lang.reflect包的方法,对垒进行反射调用的时候,如果没有初始化,则先触发初始化
3)初始化一个类时候,如果发现父类没有初始化,则先触发父类的初始化
2. 加载,验证,解析
加载就是通过指定的类全限定名,获取此类的二进制字节流,然后将此二进制字节流转化为方法区的数据结构,在内存中生成一个代表这个类的Class对象。验证是为了确
保Class文件中的字节流符合虚拟机的要求,并且不会危害虚拟机的安全。加载和验证阶段比较容易理解,这里就不再过多的解释。解析阶段比较特殊,解析阶段是虚拟机
将常量池中的符号引用转换为直接引用的过程。如果想明白解析的过程,得先了解一点class文件的一些信息。class文件采用一种类似C语言的结构体的伪结构来存储我们编
码的java类的各种信息。其中,class文件中常量池(constant_pool)是一个类似表格的仓库,里面存储了我们编写的java类的类和接口的全限定名,字段的名称和描述符,
方法的名称和描述符。在java虚拟机将class文件加载到虚拟机内存之后,class类文件中的常量池信息以及其他的数据会被保存到java虚拟机内存的方法区。我们知道class文件
的常量池存放的是java类的全名,接口的全名和字段名称描述符,方法的名称和描述符等信息,这些数据加载到jvm内存的方法区之后,被称做是符号引用。而把这些类的
全限定名,方法描述符等转化为jvm可以直接获取的jvm内存地址,指针等的过程,就是解析。虚拟机实现可以对第一次的解析结果进行缓存,避免解析动作的重复执行。
在解析类的全限定名的时候,假设当前所处的类为D,如果要把一个从未解析过的符号引用N解析为一个类或者接口C的直接引用,具体的执行办法就是虚拟机会把代表N的
全限定名传递给D的类加载器去加载这个类C。这块可能不太好理解,但是我们可以直接理解为调用D类的ClassLoader来加载N,然后就完成了N--->C的解析,就可以了。
3. 准备阶段
之所以把在解析阶段前面的准备阶段,拿到解析阶段之后讲,是因为,准备阶段已经涉及到了类数据的初始化赋值。和我们本文讲的初始化有关系,所以,就拿到这里来讲
述。在java虚拟机加载class文件并且验证完毕之后,就会正式给类变量分配内存并设置类变量的初始值。这些变量所使用的内存都将在方法区分配。注意这里说的是类变量,
也就是static修饰符修饰的变量,在此时已经开始做内存分配,同时也设置了初始值。比如在 Public static int value = 123 这句话中,在执行准备阶段的时候,会给value
分配内存并设置初始值0, 而不是我们想象中的123. 那么什么时候 才会将我们写的123 赋值给 value呢?就是我们下面要讲的初始化阶段。
4. 初始化阶段
类初始化阶段是类加载过程的最后阶段。在这个阶段,java虚拟机才真正开始执行类定义中的java程序代码。Java虚拟机是怎么完成初始化的呢?这要从编译开始讲起。在编
译的时候,编译器会自动收集类中的所有静态变量(类变量)和静态语句块(static{}块)中的语句合并产生的,编译器收集的顺序是根据语句在java代码中的顺序决定的。
收集完成之后,会编译成java类的 static{} 方法,java虚拟机则会保证一个类的static{} 方法在多线程或者单线程环境中正确的执行,并且只执行一次。在执行的过程中,便完
成了类变量的初始化。值得说明的是,如果我们的java类中,没有显式声明static{}块,如果类中有静态变量,编译器会默认给我们生成一个static{}方法。 我们可以通过
javap -c 的命令,来看一下java字节码中编译器为我们生成或者合并的static{} 方法:
public class StaticValInitTest { public static int value = 123; }
上面我们讲述的是单类的情况,如果出现继承呢?如果有继承的话,父类中的类变量该如何初始化?这点由虚拟机来解决:虚拟机会保证在子类的static{}方法执行之
前,父类的static{}方法已经执行完毕。由于父类的static{}方法先执行,也就意味着父类的静态变量要优先于子类的静态变量赋值操作。
上面讲的都是静态变量,实例变量怎么解决呢?实例变量的初始化,其实是和静态变量的过程是类似的,但是时间和地点都不同哦。我们以下面的Dog类为例来讲一讲。
public class Dog { public String type = "tai di"; public int age = 3; }
1)当用new Dog() 创建对象的时候,首先在堆上为Dog对象分配足够的空间。
2)这块存储空间会被清零,这就是自动将Dog对象中的所有基本类型的数据都设置成了默认值,而引用类型则被设置成了null(类似静态类的准备阶段的过程)
3)Java收集我们的实例变量赋值语句,合并后在构造函数中执行赋值语句。没有构造函数的,系统会默认给我们生成构造函数。
至此,java类初始化的理论基础已经完成了,其中的大部分的理论和思想都出自《深入理解java虚拟机》这本书。有了以上的理论基础,
再复杂的类初始化的情况,我们都可以应对了,下面就拿一个例子做一个具体的分析吧
public class Insect { private int i = 9; protected int j; protected static int x1 = printInit("static Insect.x1 initialized"); Insect() { System.out.println("基类构造函数阶段: i = " + i + ", j = " + j); j = 39; } static int printInit(String s) { System.out.println(s); return 47; } } public class Beetle extends Insect { protected int k = printInit("Beetle.k initialized"); protected static int x2 = printInit("static Beetle.x2 initialized"); public static void main(String[] args) { Beetle b = new Beetle(); } }
上面例子来自《java编程思想》,以上代码的执行结果是什么呢?如果对上面我们讲的理论理解的话,很容易就知道结果是:
static Insect.x1 initialized
static Beetle.x2 initialized
基类构造函数阶段: i = 9, j = 0
Beetle.k initialized
具体的执行结果过程是:
在执行Beetle 类的 main方法的时候,因为该main方法是static方法,我们在上面已经知道,在执行类的static方法的时候,如果该类没有初始化,则要进行初始化,
因此,我们在执行main方法的时候,会执行加载--验证--准备--解析---初始化这个过程。在进行最后的初始化的时候,又有一个约束:虚拟机会保证在子类的static{}
方法执行之前,父类的static{}方法已经执行完毕。所以,在执行完解析之后,会先执行父类的初始化,在执行父类初始化的时候,
输出: static Insect.x1 initialized
然后接着初始化子类,输出:static Beetle.x2 initialized
以上两行输出,是静态变量的初始化,是在第一次调用静态方法,即,在执行new、getstatic、putstatic、或者invokestatic 这4条字节码指令时候触发的。所以,
你如果把上例中的static main 方法中的 Beetle b = new Beetle();
注释掉,上面两行仍然会输出出来。然后就是执行Beetle b = new Beetle();这句代码了。我们知道,在实例化子类对象的时候,会自动调用父类的构造函数。
所以,接着就输出:基类构造函数阶段: i = 9, j = 0
紧接着是执行自己的构造函数,在堆上创建类实例对象,实例对象空间清零,然后执行赋值语句k = printInit("Beetle.k initialized");
输出: Beetle.k initialized
至此,整个类加载并初始化完毕,是不是理解起来就很简单了,趁胜追击,我们还是再来看一个例子吧:
public class Base { Base() { preProcess(); } void preProcess() { } } public class Derived extends Base { public String whenAmISet = "set when declared"; @Override void preProcess() { whenAmISet = "set in preProcess"; } public static void main(String[] args) { Derived d = new Derived(); System.out.println(d.whenAmISet); } }
这个例子来源与@左耳朵耗子的博客,我就是看了他博客中的这个例子,才想起来写篇文章里理顺下java类初始化的过程,才有了这篇博客。废话不多说,这个例子里面,有
一个地方比较绕:父类在执行构造函数的时候,调用了子类(导出类)重载过的方法,在子类的重载方法中,给实例变量做了一次赋值,正是这次赋值,干扰了我们对类初始
化的理解。
我们不管类里面是怎么做的,还按照我们上个例子中那样进行分析:
1. 执行Derived 类 static main 方法的时候,执行类变量初始化,但是此例中父类和子类都没有类变量,所以此步骤什么都不做,进行实例变量初始化
2. 执行new Derived()的时候,先调用了父类的构造函数,因为子类的重载,调用了子类的preProcess方法,为实例变量whenAmISet 赋值为"set in preProcess"
3. 然后执行子类Derived 的构造函数,在构造函数中,有编译器为我们收集生成的实例变量赋值语句,最终,又将实例变量whenAmISet 赋值为"set when declared"
4. 所以最终的输出是: set when declared
如果对这个还不太理解的话,可以再Derived 类里面添加注释,改成下面的样子,输出看看,是不是对这个执行过程更清晰了呢?
public class Derived extends Base { // 准备阶段赋值 whenAmISet=null public String whenAmISet = "set when declared"; public Derived() { System.out.println("do son constructor"); } @Override void preProcess() { System.out.println("do son process"); System.out.println("whenAmISet:" + whenAmISet); whenAmISet = "set in preProcess"; System.out.println("whenAmISet:" + whenAmISet); System.out.println("set in preProcess end"); } public static void main(String[] args) { Derived d = new Derived(); System.out.println(d.whenAmISet); } }
参考资料:
《深入理解java虚拟机》
《Java编程思想》
http://coolshell.cn/articles/1106.html
看博客的时候没觉得什么,写博客的时候才知道还要组织语言,还要排版神马的,所以还希望转载的时候能给个
http://www.cnblogs.com/jimxz/p/3974939.html