JVM从入门到精通

认识Java虚拟机

Java是目前用户最多,使用范围最广泛的软件开发技术之一.Java 的技术体系主要是由支撑 java 程序运行的虚拟机,提供各开发领域接口支持的 java API, java 编程语言以及许多第三方 Java 框架构成.相比之下,有关 Java 虚拟机的资料却显得异常匮乏.这种状况在很大程度上是由 Java 开发技术本身的一个重要优点导致的:在虚拟机层面隐藏了底层技术的复杂性以及机器与操作系统的差异性.

所以在一般情况下,一个程序员只要了解了必要的 java api, java 语法,以及学习适当的第三方开发框架,就已经基本能满足日常开发的需要了.虚拟机会在用户不知不觉中完成对硬件平台的兼容以及对内存等资源的管理工作.因此.了解虚拟机的运作并不是一般开发人员必须掌握的知识.稍后再说为什么还要学习虚拟机.我们先回顾一下,虚拟机是如何屏蔽了操作系统的差异性而达到跨平台的呢?

Java跨平台原理

JVM 是 Java Virtual Machine(Java 虚拟机)的缩写,JVM 是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的.

JVM 将自身定位于字节码和底层平台之间.运行程序的物理机器的情况千差万别,而 Java 虚拟机则在千差万别的物理机上建立了统一的运行平台.实现了在任意一台虚拟机上编译的程序都能在任何一台虚拟机上正常运行.Java 语言使用 Java 虚拟机屏蔽了与具体平台相关的信息,使得 Java 语言编译程序只需生成在 Java 虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行.这就是 Java 的能够“一次编译,到处运行”的原因.

可能有同学已经发现了,虚拟机上运行的是具有某种规则的文件—> 字节码文件.言下之意,虚拟机其实不关心这一份字节码是从何而来的,只要你给一份格式规范的字节码文件,虚拟机就能运行.我想给大家说的是:因为这一特性,其他很多语言,他们也可以编译成字节码文件,从而运行到虚拟机上.比如 scala,groovy,jruby,jyphon…这也最大的体现出了 JVM 的包容性.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aWwWh09b-1583835618748)(assets\1577439973649.png)]

JVM的类型

在我们第一次接触到虚拟机的时候,我们都会安装环境,并且校验环境是否装成功,我们可以在 cmd 窗口键入 javac 或者 java -version,如果可以获取到对应的信息,说明我们 java 的环境就没问题了.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RSUYsWqS-1583835618749)(assets\1577440246391.png)]

在上图中,我给大家标记了几块区域,这是我们之前没有接触过的(看到了没有出现”不是内部或外部命令”,就直接关闭了 cmd 窗口),我们可以大致的了解一下上面四部分的含义:

①:表示 JDK 的版本.

②:表示虚拟机的类型为 HotSpot.

③:表示编译器采用 server 模式.

④:编译和解释模式采用混合模式.

Sun 公司制定了虚拟机规范,并没有限定只能是某唯一的虚拟机.从 1996 年初 Sun 公司发布的 JDK1.0 中所包含的 Sun Classic VM(世界上第一款商用 Java 虚拟机) 到今天,曾经涌现,湮灭过许多或经典或优秀或有特色的虚拟机实现,比如 Sun HotSpot VM, BEA JRockit, IBM J9 VM,等等,它们从编译到运行阶段,都有各自的优缺点.这本文中,我们使用 HotSpot 虚拟机来讲解.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2m3chk0t-1583835618749)(assets\1577440458809.png)]

JVM 的职责

虚拟机很重要,字节码必须要依赖于虚拟机才能运行.那虚拟机的具体职责是什么呢?使用 java 命令,可以启动 JVM,并且加载指定的字节码文件.所以说,JVM 的职责主要包含两个部分:

  1. 加载指定的字节码文件.
  2. 将字节码文件加载到内存去运行.

而今天我们也主要从这两个方面,来给大家剖析,JVM 如何加载字节码文件以及内存管理的原理.

为什么要优化 JVM

最后,我们回到最开始的一个问题,既然虚拟机隐藏了底层技术的复杂性,让程序员更加关注于业务逻辑,那为什么我们还需要学习JVM,还需要优化 JVM 呢?

任何事情都有两面性.随着 java 技术的不断发展,它被应用在越来越多的领域之中.其中一些领域,如电力,金融,通信等,对程序的性能,稳定性和可拓展性方面都有极高的要求.程序很可能在 10 个人同时使用时完全正常,但是在 10000 个人同时使用时就会缓慢,死锁,甚至崩溃.毫无疑问,要满足 10000 个人同时使用需要更高性能的物理硬件,但是在绝大多数情况下,提升硬件效能无法等比例的提升程序的运作性能和并发能力,甚至可能对程序运作状况完全没有任何改善.这里面有 java 虚拟机的原因:为了达到给所有硬件提供一致的虚拟平台的目的,牺牲了一些与硬件相关的性能特性.更重要的是人为原因:如果开发人员不了解虚拟机一些技术特性的运作原理,就无法写出最适合虚拟机运行和自优化的代码.

其实,目前商用的高性能 java 虚拟机都提供了相当多的优化特性和调节手段,用于满足应用程序在实际生产环境中对性能和稳定性的要求.如果只是为了入门学习,让程序在自己的机器上正常运行,那么这些特性可以说可有可无的. 如果用于生产开发,尤其是企业级生产开发,就迫切需要开发人员中至少有一部分人对虚拟机的特性以及调节方法具有很清晰的认识.所以在 java 开发体系中,对架构师,系统调优师,高级程序员等角色的需求一直都非常大,学习虚拟机中各种自动运作特性的原理也成为了 java 程序员成长道路上必然会接触到的一课.

类加载机制

类加载引入

有一道经典的面试题:

class Singleton {
    private static Singleton singleton = new Singleton();
    public static int count1;
    public static int count2=0;

    //private static Singleton singleton = new Singleton();


    private Singleton(){
        count1++;
        count2++;
    }

    public static Singleton newInstance(){
        return singleton;
    }
}

public class Test{
    public static void main(String[] args) {
        Singleton.newInstance();
        System.out.println(Singleton.count1);
        System.out.println(Singleton.count2);
    }
}

什么是类加载

虚拟机把描述类的数据从 Class 文件加载到内存,并对数据进行校验,转换解析和初始化,最终形成可以被虚拟机直接使用的 java 类型,这就是虚拟机的类加载机制.

与那些在编译时需要进行连接工作的语言不同,在 java 语言中,类型的加载,连接和初始化过程都是在程序运行期间完成的,这种策略虽然会令类加载时稍微增加一些性能开销,但是会为 java 应用程序提供高度的灵活性,java 里,天生可以动态扩展的语言特性就是依赖运行时期动态加载和动态连接的这个特点实现的.

类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(loading),验证(verification),准备(preparation),解析(resolution),初始化(initialization),使用(using),卸载(unloading)七个阶段.其中,验证,准备,解析三个部分统称为连接(linking).

注意:加载,验证,准备,初始化和卸载这五个阶段的顺序是确定的,但是解析阶段则不一定.它在某些情况下可以在初始化阶段之后再开始.主要是为了支持 java 语言的运行时绑定

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Z0Nqd4aN-1583835618750)(assets\1577440939822.png)]

初始化时机

什么情况下开始类加载过程的第一个阶段:加载?java 虚拟机规范中并没有进行强制约束.这点可以交给虚拟机的具体实现来自有把握.但是对于初始化阶段,虚拟机规范则严格规定了有且只有五种情况必须立即对类进行"初始化"(加载,验证,准备自然需要在初始化之前开始).

1.遇到 new 指令(使用关键字 new 来实例化对象),getstatic,putstatic(读取或设置一个类的静态字段的时候,除了 final 修饰,在编译时期就已经把结果放在常量池的静态字段)或 invokestatic(调用类的静态方法)这 4 条字节码指令时,如果类没有进行初始化,则需要先触发其初始化.

2.使用 java.lang.reflect 包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化.

3.当初始化一个类的时候,如果发现其父类还没有进行初始化,则需要先触发其父类的初始化(接口初始化例外,不要求所有父接口全部都初始化,只有在真正调用到父接口的时候才会初始化).

4.当启动虚拟机时,用户需要指定一个需要执行的主类,虚拟机先初始化这个主类.

5.当使用 java7 的动态语言支持时,如果一个 MethodHandle 实例在解析时,该方法对应的类没有进行初始化,则需要先触发其初始化.

这五种场景中的行为称之为对一个类进行主动引用.除此之外,所有引用类型的方式都不会触发初始化,叫做被动引用.

被动引用,如:

1.通过子类引用父类的静态字段,不会导致子类初始化(此时的静态资源不是属于子类而是属于父类的,底层还是使用的是 SuperClass.value 去访问的,所以只初始化 SuperClass,而不初始化 SubClass).

public class SuperClass {

    static {
        System.out.println("SuperClass init");
    }

    public static int value = 123;
}

public class SubClass extends SuperClass{
    static {
        System.out.println("SubClass init");
    }
}

public class TestNotInit {

    public static void main(String[] args) {
        System.out.println(SubClass.value);
    }
}

2.通过数组定义来引用类,不会触发此类的初始化.

public class TestNotInit {

    public static void main(String[] args) {
        //System.out.println(SubClass.value);

        SuperClass[] sc = new SuperClass[10];
    }
}

3.常量在编译阶段会存入调用类的常量池中,本质上并没有直接引用到定义常量的类,因此不会触发定义常量的类的初始化.

public class SuperClass {

    static {
        System.out.println("SuperClass init");
    }

    public static int value = 123;

    public static final String DATA="Hello World";
}

public class TestNotInit {

    public static void main(String[] args) {
        //System.out.println(SubClass.value);

        //有加载,但是没初始化
        /*SuperClass[] sc = new SuperClass[10];
        System.out.println(sc);*/

        System.out.println(SuperClass.DATA);
    }
}

类加载过程

加载

在加载阶段,虚拟机需要完成以下 3 件事情:

1.通过一个类的全限定名来获取定义此类的二进制字节流.

2.将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构.

3.在内存中生成一个代表这个类的 java.lang.Class 对象,作为方法区这个类的各种数据的访问入口.

注:

虚拟机规范的这三点要求其实并不算具体,因此虚拟机实现与具体应用的灵活度都是相当大的.比如从哪里获取,如何获取二进制字节码流,都没有严格限定.虚拟机设计团队搭建了一个相当开放的舞台.许多举足轻重的 java 技术都建立在这一基础之上.

1.从 ZIP 包中读取.(ZIP, JAR, EAR, WAR)

2.从网络中获取

3.运行时计算生成(动态代理技术)

4.由其他文件生成(JSP 应用)

加载和连接的部分内容是交叉进行的.加载尚未完成,连接阶段可能已经开始,比如部分字节码文件格式的验证.

连接-验证

验证是连接阶段的第一步,这一阶段的目的是为了确保 Class 文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全.

如果使用纯粹的 java 代码,做到诸如将一个对象转型为它并未实现的类型,编译器将拒绝编译(编译报错).但是在前文中提到,Class文件并不一定要求是 Java源码编译而来的.虚拟机如果不检查输入的字节码流,对其完全信任的话,很可能会因为载入了有害的字节码流而导致系统崩溃.(代码混淆)

验证阶段是非常重要的,这个阶段是否严谨,直接决定了 java 虚拟机是否能够承受恶意代码的攻击,从执行性能的角度上讲,验证阶段的工作量在虚拟机的类加载子系统中又占了相当大的一部分.

根据 2011 年发布的****的要求,验证阶段大致需要下面四个阶段来验证.

1.文件格式验证.

验证字节流是否符合 Class 文件格式的规范,并且能被当前版本的虚拟机处理.

比如,是否以魔数 0xCAFEBABE开头(字节码头四个字节,用来表示一个可以接受的字节码文件).

主要目的是保证输入的字节流能正确的解析并存储于方法区之内,格式上符合描述一个 java 类型信息的要求.

2.元数据验证.

对字节码描述的信息进行语义分析,以保证其描述的信息符合 Java 语言规范的要求.

比如,是否有父类,是否继承了不允许被继承的类等等.

主要目的是对类的元数据信息进行语义校验,保证不存在不符合 java 语言规范的元数据信息.

3.字节码验证.

在元数据验证之后,这个阶段将对类的方法体进行校验分析,保证被校验的类的方法在运行时不会做出危害虚拟机安全的事件.目的是通过数据流和控制流分析,确定程序语义是合法的,符合逻辑的.

4.符号引用验证.

该校验是发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在解析阶段中发生.

比如校验符号引用中的全限定名是否能找到对应的类,是否具备访问权限等等.

目的是确保解析动作能正常执行.

对于虚拟机的类加载机制来说,验证阶段是一个非常重要的,但不是一定必要(对程序运行期没有影响)的阶段.如果所运行的全部代码都已经被反复使用和验证过,那么在实施阶段可以考虑使用 -Xverify:none 参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间.

连接-准备

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段.这些变量所使用的内存都将在方法区中进行分配.

这时候进行内存分配的仅包括类变量(被 static 修饰的变量),而不包括实例变量,实例变量将会在对象实例化时随着对象一起分配在 Java 堆中;并且这里所说的初始值“通常情况”是数据类型的零值,例如:public static int value = 123;value 在准备阶段过后的6

初始值为 0 而不是 123,而给 value 赋值的指令将在初始化阶段才会被执行.

“特殊情况”:类字段的字段属性表中存在常量属性.那么在准备阶段就会被初始化为指定的值.例如: public static final int value = 123; 在准备阶段虚拟机就会将 value 赋值为 123.

连接-解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程.

符号引用(Symbolic References):以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能够无歧义的定位到目标即可.符号引用与虚拟机的内存布局无关,引用的目标并不一定加载到内存中。在 Java 中,一个 java 类将会编译成一个 class 文件。在编译时,java 类并不知道所引用的类的实际地址,因此只能使用符号引用来代替.

直接引用是和虚拟机的布局相关的,同一个符号引用在不同的虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那引用的目标必定已经被加载入内存中了。

虚拟机规范之中并未规定解析阶段发生的具体时间,只要求了在执行 anewarray(创建数组),checkcast(检查类型),getfield(获取字段),getstatic(获取类变量),instanceof(检查类型),invokedynamic(动态解析方法),invokeinterface(调用接口方法),invokespecial(调用特殊方法,比如构造方法,初始化方法),invokestatic(调用 static 方法),invokevirtual(调用实例方法),ldc/ldc_w(将 int,float,String 常量推至栈顶),multianewarray(创建数组),new(创建对象),putfield(设置字段),putstatic(设置类变量)这 16 个用于操作符号引用的字节码指令之前,先对它们所使用的符号引用进行解析.

初始化

初始化阶段,才真正开始执行类中定义的 java 程序代码.

初始化阶段是执行类构造器()方法的过程.

1.类构造器()方法是有编译器自动收集类中的所有类变量的赋值动作和 static 语句块中的语句合并产生的.编译器收集的顺序是由语句在源文件中出现的顺序所决定的.静态语句块中只能访问到定义在静态语句块之前的变量,定义在其之后的变量,在静态语句块中可以赋值,但是不能访问.

public class CInit {
    static {
        i = 1;//给变量赋值可以编译通过
        System.out.println(i);//编译报错,非法指向当前引用
    }

    static int i = 1;//变量声明
}

2.类构造器()方法与类的构造器()方法不同,虚拟机会保证在子类的()方法之前执行,因此,在虚拟机中第一个被执行的()方法的类肯定是 Object.

3.由于父类的()方法先执行,也就意味着父类中定义的静态语句块要优于子类的变量赋值.

4.类构造器()方法对于类或者接口来说并不是必需的,如果一个类中没有静态语句块,编译器就不会为这个类生成()方法.

5.接口中也可以定义 static 变量,生成的()方法不需要先执行父接口中的()方法,同理,接口的实现类在初始化的时候也一样不会执行接口中的()方法.

6.虚拟机会保证一个类的()方法在多线程环境中被正确的加锁,同步,如果多线程同时去初始化一个类,只会有一个线程去初始化,其他线程都阻塞.

面试题分析

首先,调用了类中的静态方法 getSingleTon,会触发类的初始化.

对于情况一:

连接阶段,为静态变量赋初始值.count1=0, count2=0, singltTon=null.

初始化阶段,从上到下依次执行赋值操作和静态代码块.

count1=0, count2=0,创建对象之后,对两个数值进行递增.结果 count1=1,count2=1.

对于情况二:

连接阶段,为静态变量赋初始值.singltTon=null.count1=0, count2=0,.

初始化阶段,从上到下依次执行赋值操作和静态代码块.

先创建对象,对两个数值进行递增.结果 count1=1,count2=1.

再是赋值,count1 没有赋值,count2 重新赋值.count1=1, count2=0.

类加载器

虚拟机设计团队把类加载阶段中的"通过一个类的全限定名来获取描述此类的二进制字节流"这个动作放到了 java 虚拟机外部去实现(意思就是说,如何把字节码文件变成流的过程,不仅仅属于虚拟机中的功能).以便让应用程序自己决定如何去获取所需要的类.这个动作的代码模块成为"类加载器".

类加载器可以说是 java 语言的一项创新.也是 java 语言流行的重要原因之一.它在类层次划分,OSGi,热部署,代码加密等领域大放异彩.成为 java 体系中一块重要的基石.

类加载器虽然只用于一个类的加载动作,但是它在 java 程序中起到的作用却远远不限于类加载阶段.对于任意一个类,都需要由加载它的类加载器和这个类本身一同确立其在 java 虚拟机中的唯一性,每一个类加载器,都拥有一个独立的类名称空间.

类加载器分类

从 java 虚拟机的角度来讲,只存在两种不同的类加载器.一种是启动类加载器(Bootstrap Classloader),这个类加载器使用 c/c++ 语言实现,是虚拟机自身的一部分.另一种就是所有其他的类加载器,这些类加载器都由 java 语言实现,独立于虚拟机外部,并且都继承于

java.lang.ClassLoader.

从 java 开发人员的角度来看,类加载器还可以划分得更细致一些.

启动类加载器(Bootstrap ClassLoader):负责将存在于\lib 目录中,或者配置参数-Xbootclasspath 参数指定的路径中,并且能够被虚拟机识别(名字不符合的,就算放在了 lib 中也不会被夹在)的类库加载到虚拟机内存中.该类加载器无法被 java 程序直接引用.

扩 展 类 加 载 器 (Extension ClassLoader): 这 个 加 载 器 由 sun.miscLauncher$ExtClassLoader 实 现 , 负 责 加 载 \lib\ext 目录中,或者被 java.ext.dirs 系统变量所指定的路径中的所有类库.开发者可以直接使用扩展类加载器.

应用程序类加载器(Application ClassLoader):这个加载器由 sun.misc.Launcher$AppClassLoader 实现.也称之为系统类加载器.它负责加载用户类路径(classpath)上所指定的类库,开发者可以直接使用.一般情况下,这个就是程序中默认的类加载器.

我们程序都是由这三种类加载器互相配合进行加载的,如果有必要,还可以加入自定义的类加载器.

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iuH74vMd-1583835618751)(assets\1577692320698.png)]

运行时数据区

垃圾回收器和内存分配策略

虚拟机性能监控和检测

你可能感兴趣的:(JVM从入门到精通)