【狂神说Java】JVM快速入门篇

JVM 常问面试题

  • 请你谈谈你对JVM的理解? java—>class---->
  • Java8虚拟机和之前的变化更新?
  • 什么是OOM 内存溢出
  • 什么是栈溢出StackOverFlowError? 怎么分析
  • JVM 的常用调优参数?
  • 内存快照如何抓取,怎么分析Dump文件?知道吗
  • 谈谈JVM中,类加载器你的认识?

JVM概念

JVM是Java Virtual Machine(Java虚拟机)的缩写。

虚拟机是一种抽象化的计算机,通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机有自己完善的硬体架构,如处理器、堆栈、寄存器等,还具有相应的指令系统。Java虚拟机屏蔽了与具体操作系统平台相关的信息,使得Java程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。
简单来说JVM是用来解析和运行Java程序的。
Java语言的一个非常重要的特点就是与平台的无关性。而使用Java虚拟机是实现这一特点的关键。一般的高级语言如果要在不同的平台上运行,至少需要编译成不同的目标代码。而引入Java语言虚拟机后,Java语言在不同平台上运行时不需要重新编译。Java语言使用Java虚拟机屏蔽了与具体平台相关的信息,使得Java语言编译程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。Java虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令执行。这就是Java的能够“一次编译,到处运行”的原因。

1. JVM的位置

【狂神说Java】JVM快速入门篇_第1张图片

三种JVM:

  • Sun公司:HotSpot 用的最多(HostSpot Java HotSpot™ 64-Bit Server VM (build 25.101-b13, mixed mode))
  • BEA:JRockit
  • IBM:J9VM

我们学习都是:HotSpot

2. JVM体系结构

【狂神说Java】JVM快速入门篇_第2张图片

jvm调优:99%都是在方法区和堆,大部分时间调堆。 JNI(java native interface)本地方法接口

【狂神说Java】JVM快速入门篇_第3张图片

3. 类加载器

作用:加载Class文件~ 如果new Student();(具体实例在堆里,引用变量名放栈里)

【狂神说Java】JVM快速入门篇_第4张图片

【狂神说Java】JVM快速入门篇_第5张图片

【狂神说Java】JVM快速入门篇_第6张图片

【狂神说Java】JVM快速入门篇_第7张图片

  1. 虚拟机自带的加载器
  2. 启动类(根)加载器
  3. 扩展类加载器
  4. 应用程序加载器

【狂神说Java】JVM快速入门篇_第8张图片

4.双亲委派机制

第一步:类加载器收到类加载的请求
  第二步:将这个请求向上委托给父类加载器去完成 ,一直向上委托,直到启动类加载器(Boot)
  第三步:启动类加载器检查是否能够加载当前和这个类 ,能加载就结束,使用当前的加载器,否则,抛出异常,通知子加载器进行加载。
  第四步:重复 第三步 步骤。

null : java调用不到 ~C 、C++
    Java = C++ : 去掉繁琐的东西,指针,内存管理。
    Java = C+±-

参考:https://www.jianshu.com/p/1e4011617650

==概念:==当某个类加载器需要加载某个.class文件时,它首先把这个任务委托给他的上级类加载器,递归这个操作,如果上级的类加载器没有加载,自己才会去加载这个类。

==例子:==当一个Hello.class这样的文件要被加载时。不考虑我们自定义类加载器,首先会在AppClassLoader中检查是否加载过,如果有那就无需再加载了。如果没有,那么会拿到父加载器,然后调用父加载器的loadClass方法。父类中同理也会先检查自己是否已经加载过,如果没有再往上。注意这个类似递归的过程,直到到达Bootstrap classLoader之前,都是在检查是否加载过,并不会选择自己去加载。直到BootstrapClassLoader,已经没有父加载器了,这时候开始考虑自己是否能加载了,如果自己无法加载,会下沉到子加载器去加载,一直到最底层,如果没有任何加载器能加载,就会抛出ClassNotFoundException。

【狂神说Java】JVM快速入门篇_第9张图片

作用:

1、防止重复加载同一个.class。通过委托去向上面问一问,加载过了,就不用再加载一遍。保证数据安全。
2、保证核心.class不能被篡改。通过委托方式,不会去篡改核心.class,即使篡改也不会去加载,即使加载也不会是同一个.class对象了。不同的加载器加载同一个.class也不是同一个Class对象。这样保证了Class执行安全。

比如:如果有人想替换系统级别的类:String.java。篡改它的实现,在这种机制下这些系统的类已经被Bootstrap classLoader加载过了(为什么?因为当一个类需要加载的时候,最先去尝试加载的就是BootstrapClassLoader),所以其他类加载器并没有机会再去加载,从一定程度上防止了危险代码的植入。

总结:

【狂神说Java】JVM快速入门篇_第10张图片

5. 沙箱安全机制

【狂神说Java】JVM快速入门篇_第11张图片

【狂神说Java】JVM快速入门篇_第12张图片

【狂神说Java】JVM快速入门篇_第13张图片

【狂神说Java】JVM快速入门篇_第14张图片

组成沙箱的基本组件:

  • 字节码校验器(bytecode verifier):确保Java类文件.Class遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。

  • 类装载器

    (class loader):其中类装载器在3个方面对Java沙箱起作用

    • 它防止恶意代码去干涉善意的代码;
    • 它守护了被信任的类库边界;
    • 它将代码归入保护域,确定了代码可以进行哪些操作。

虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。

类装载器采用的机制是双亲委派模式

  1. 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
  2. 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
  • 存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。

  • 安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。

  • 安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:

​ 1. 安全提供者

​ 2.消息摘要

​ 3.数字签名 keytools https(需要证书)

​ 4.加密

​ 5. 鉴别

6. Native(重点)

Native是核心,能把面试官唬住的东西。

【狂神说Java】JVM快速入门篇_第15张图片

凡是带了native 关键字的,说明java的作用范围达不到了,得回去调用底层C语言的库!

凡是带了native 关键字的方法会进入本地方法栈,其它的是java栈

JNI:Java Native Interface(本地方法接口)

调用本地方法接口(JNI)作用:

扩展java的使用,融合不同的编程语言为java所用
java诞生的初衷是融合C/C++程序,C、C++横行,想要立足,必须要有调用C、C++的程序~
它在内存区城中专门开辟了块标记区城: Native Method Stack

Native Method Stack(本地方法栈)

登 记native 方法,在执行引擎(Execution Engine)执行的时候。通过JNI 加载**本地方法库(Native Libraies)**中的方法。

在企业级应用中少见,与硬件有关应用:java程序驱动打印机,系统管理生产设备等,掌握即可

7. PC寄存器

程序计数器: Program Counter Register

每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码 ( 用来存储指向下一条指令的地址, 也即将要执行的指令代码 ), 在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计。

8. 方法区

Method Area方法区:

方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;

静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
如:static,final,,Class(类模板), 常量池

面试题:一张白纸,画出对象实例化过程的内存图。(主要是考你对JVM的理解)
【狂神说Java】JVM快速入门篇_第16张图片

类模板,常量池,引用的话进入左边,去引入真实的对象

9. 栈

  1. 栈:数据结构
    程序=数据结构+算法:持续学习~
    程序=框架+业务逻辑:吃饭~

  2. 栈:先进后出、后进先出:桶
    队列:先进先出 ( FIFO ):管
    喝多了吐就是栈,吃多了拉就是队列
    为什么main() 先执行,最后结束? (因为一开始mian()先压入栈

  3. 栈:栈内存,主管程序的运行,生命周期和线程同步;
    线程结束,栈内存也就是释放,对于栈来说,不存在垃圾回收问题
    一旦线程结束,栈就Over!

  4. 栈存放:8大基本类型+对象引用+实例的方法
    栈运行原理:栈帧(局部变量表+操作数栈)每调用一个方法都有一个栈帧
    栈满了 main()无法结束,会抛出错误:栈溢出 StackOverflowError

【狂神说Java】JVM快速入门篇_第17张图片

栈帧图:

【狂神说Java】JVM快速入门篇_第18张图片

栈 + 堆 + 方法区:交互关系

【狂神说Java】JVM快速入门篇_第19张图片

10. 堆

Heap:一个JVM只有一个堆内存,堆的大小是可以调节的。

类加载器读取了类文件后,一般会把什么东西放到堆中?

类,方法,常量,变量~,保存所有引用类型的真实对象

堆内存细分3个区域:

  • 新生区(伊甸园区) Young/new
  • 养老区 old
  • 永久区 Perm

【狂神说Java】JVM快速入门篇_第20张图片

**GC垃圾回收,主要是在伊甸园区和养老区~
假设内存满了,报错OOM,堆内存不够!**OutOfMemoryError:Java heap space
在JDK8以后,永久存储区改了个名字(元空间)

【狂神说Java】JVM快速入门篇_第21张图片

新生区、老年区、永久区

新生区(伊甸园+幸存者区*2)

  • 类诞生和成长甚至死亡的地方;
  • 伊甸园,所有对象都是在伊甸园区new出来的!
  • 幸存者区(0, 1),轻GC定期清理伊甸园,活下来的放入幸 存者区,幸存者区满了之后重GC清理 伊甸园+幸存者区,活下来的放入养老区。都满了就报OOM。

真理:经过研究,99%的对象都是临时对象!直接被清理了

老年区: 新生区剩下来的,轻GC杀不死了。

永久区:

这个区域常驻内存,用来存放JDK自身携带的Class对象,Interface元数据,存储的是java运行时的一些环境或类信息,该区域不存在垃圾回收GC关闭虚拟机就会释放这个内存。

  • jdk1.6之前:永久代,常量池在方法区
  • jdk1.7:永久代,但是慢慢退化了(去永久代)常量池在堆中
  • jdk1.8之后:无永久代,常量池在元空间

一个启动类,加载了大量的第三方jar包。Tomcat部署了太多的应用,大量动态生成的反射类。不断的被加载。直
到内存满,就会出现OOM。

【狂神说Java】JVM快速入门篇_第22张图片

方法区又称非堆(non-heap),本质还是堆,只是为了区分概念。

元空间逻辑上存在,物理上并不存在。

【狂神说Java】JVM快速入门篇_第23张图片
【狂神说Java】JVM快速入门篇_第24张图片

【狂神说Java】JVM快速入门篇_第25张图片

扩展:

【狂神说Java】JVM快速入门篇_第26张图片

一句话:常量池一直在方法区,其中的字符串池 JDK1.7之后保存到了堆中。

堆内存调优

public static void main(String[] args) {
    //返回虚拟机试图使用的最大内存
    long max = Runtime.getRuntime().maxMemory(); //字节 1024*1024
    //返回jvm初始化的总内存
    long total = Runtime.getRuntime().totalMemory();

    System.out.println("max="+max+"字节\t"+(max/(double)1024/1024+"MB"));
    System.out.println("total="+total+"字节\t"+(total/(double)1024/1024+"MB"));
    /* 运行后:
    max=1866465280字节   1780.0MB
    total=126877696字节  121.0MB
     */
    //默认情况下,分配的总内存占电脑内存1/4 初始化1/64
}

//面试题:报OOM怎么办?
/*
1.尝试扩大堆内存,如果还报错,说明有死循环代码 或垃圾代码
2.分析内存,看一下哪个地方有问题(专业工具)
*/

扩大内存方法:

Edit Configration>add VM option>输入:-Xms1024m -Xmx1024m -XX:+PrintGCDetails

再次运行:

【狂神说Java】JVM快速入门篇_第27张图片

新生区+养老区:305664K+699392K=1005056K = 981.5M

说明元空间物理并不存在。

例子2:死循环 OOM

//-Xms8m -Xmx8m -XX:+PrintGCDetails
public static void main(String[] args) {
    String str = "kuangshensayjava";

    while (true){
        str += str + new Random().nextInt(888888888)+ new Random().nextInt(21_0000_0000);
    }
}

【狂神说Java】JVM快速入门篇_第28张图片

Jprofiler

在一个项目中,突然出现了OOM故障,该如何排除,研究为什么出错~

  • 能够看到代码第几行出错:内存快照分析工具,MAT,Jprofiler
  • Debug,一行行分析代码!

MAT,Jprofiler作用:

  • 分析Dump内存文件,快速定位内存泄漏;
  • 获得堆中的数据
  • 获得大的对象(大厂面试)
//-Xms 设置初始化内存分配大小 默认1/64
//-Xmx 设置最大分配内存,默认1/4
//-XX:+PrintGCDetails 打印GC垃圾回收信息
//-XX:+HeapDumpOnOutOfMemoryError oom DUMP

//-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError
public class Demo03 {

    byte[] array = new byte[1*1024*1024]; //1m

    public static void main(String[] args) {
        ArrayList<Demo03> list = new ArrayList<>();
        int count = 0;

        try {
            while (true){
                list.add(new Demo03()); //不停地把创建对象放进列表
                count = count + 1;
            }
        } catch (Exception e) {
            System.out.println("count: "+count);
            e.printStackTrace();
        }

    }
}

【狂神说Java】JVM快速入门篇_第29张图片

【狂神说Java】JVM快速入门篇_第30张图片

11. GC:垃圾回收

【狂神说Java】JVM快速入门篇_第31张图片

JVM在进行GC时,并不是对这三个区域统一回收。大部分时候回收的是新生代

  • 新生代
  • 幸存区
  • 老年区

GC两种:轻GC,重GC (Full GC,全局GC)

关于GC面试题:

  • JVM的内存模型和分区~详细到每个分区放什么?
  • 堆里面的分区有哪些?Eden, from, to, 老年区,说说它们的特点!
  • GC算法有哪些?怎么用的?标记清除法,标记整理,复制算法,分代收集法。引用计数法。
  • 轻GC与重GC分别在什么时候发生?

引用计数法:一般JVM不用,大型项目对象太多了

【狂神说Java】JVM快速入门篇_第32张图片

复制算法

  • -XX:MaxTenuringThreshold=15 设置进入老年代的存活次数条件

【狂神说Java】JVM快速入门篇_第33张图片

【狂神说Java】JVM快速入门篇_第34张图片

  • 好处:没有内存的碎片,内存效率高
  • 坏处:浪费了内存空间(一个幸存区永远是空的);假设对象100%存活,复制成本很高。

复制算法最佳使用场景:对象存活度较低 的时候,新生区~。

标记清除算法

标记清除

【狂神说Java】JVM快速入门篇_第35张图片

  • 优点:不需要额外空间,优化了复制算法。
  • 缺点:两次扫描,严重浪费时间,会产生内存碎片。

标记压缩(标记整理):再优化

  • 三部曲:标记–清除–压缩

【狂神说Java】JVM快速入门篇_第36张图片

标记清除压缩:再优化

  • 每标记清除几次就压缩一次,或者内存碎片积累到一定程度就压缩。

总结

内存效率:复制算法>标记清除算法>标记压缩算法(时间复杂度)

内存整齐度:复制算法=标记压缩算法>标记清除算法

内存利用率:标记压缩算法=标记清除算法>复制算法

难道没有最优算法吗?

答案:无,没有最好的算法,只有合适的算法(GC也被称为分代收集算法)。

  • 年轻代:存活率低,用复制算法
  • 老年代:存活率高,区域大,用标记-清除-压缩

参考和研究:《深入理解Java虚拟机》

12. JMM

  1. 什么是JMM? :百度

    java内存模型 Java Memory Model

  2. 它干嘛的? 学习途径:官方,其他人的博客,教学视频

    https://www.sohu.com/a/420276955_612370

    作用:缓存一致性协议,用于定义数据读写的规则。

    JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的私有变量存储在主内存中, 每个线程都有一个私有的本地变量。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZonNpj42-1638243090963)(C:\Users\zt\AppData\Roaming\Typora\typora-user-images\image-20211125222216485.png)]

    解决共享对象可见性这个问题:volilate

  3. 如何学会它?

  • lock(锁定),作用于主内存中的变量,把变量标识为线程独占的状态。
  • read(读取),作用于主内存的变量,把变量的值从主内存传输到线程的工作内存中,以便下一步的load操作使用。
  • load(加载),作用于工作内存的变量,把read操作主存的变量放入到工作内存的变量副本中。
  • use(使用),作用于工作内存的变量,把工作内存中的变量传输到执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作。
  • assign(赋值),作用于工作内存的变量,它把一个从执行引擎中接受到的值赋值给工作内存的变量副本中,每当虚拟机遇到一个给变量赋值的字节码指令时将会执行这个操作。
  • store(存储),作用于工作内存的变量,它把一个从工作内存中一个变量的值传送到主内存中,以便后续的write使用。
  • write(写入):作用于主内存中的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。
  • unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。

我再补充一下JMM对8种内存交互操作制定的规则吧:

  • 不允许read、load、store、write操作之一单独出现,也就是read操作后必须load,store操作后必须write。

  • 不允许线程丢弃他最近的assign操作,即工作内存中的变量数据改变了之后,必须告知主存。

  • 不允许线程将没有assign的数据从工作内存同步到主内存。

  • 一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是对变量实施use、store操作之前,必须经过load和assign操作。

  • 一个变量同一时间只能有一个线程对其进行lock操作。多次lock之后,必须执行相同次数unlock才可以解锁。

  • 如果对一个变量进行lock操作,会清空所有工作内存中此变量的值。在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值。

  • 如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量。

  • 一个线程对一个变量进行unlock操作之前,必须先把此变量同步回主内存。
    再补充一下JMM对8种内存交互操作制定的规则吧:

  • 不允许read、load、store、write操作之一单独出现,也就是read操作后必须load,store操作后必须write。

  • 不允许线程丢弃他最近的assign操作,即工作内存中的变量数据改变了之后,必须告知主存。

  • 不允许线程将没有assign的数据从工作内存同步到主内存。

  • 一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是对变量实施use、store操作之前,必须经过load和assign操作。

  • 一个变量同一时间只能有一个线程对其进行lock操作。多次lock之后,必须执行相同次数unlock才可以解锁。

  • 如果对一个变量进行lock操作,会清空所有工作内存中此变量的值。在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值。

  • 如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量。

  • 一个线程对一个变量进行unlock操作之前,必须先把此变量同步回主内存。

你可能感兴趣的:(狂神说java系列,linux,java,ssh)