JVM 初学笔记

学习视频链接:https://www.bilibili.com/video/BV1iJ411d7jS?p=1

文章目录

  • 1. JVM 的位置
  • 2. JVM 的体系结构
  • 3. 类加载器
  • 4. 双亲委派机制
  • 5. 沙箱安全机制(了解)
  • 6. Native(重点)
  • 7. PC 寄存器(了解)
  • 8. 方法区(掌握)
  • 9. 栈
  • 10. 三种 JVM
  • 11. 堆
  • 12. 新生区和老年区
  • 13. 永久区
  • 14. 堆内存调优
  • 15.GC
  • 16. JMM

JVM 探究

  • 请你谈谈对 JVM 的理解? java8 虚拟机和之前的变化更新?
  • 什么是 OOM ,什么是栈溢出 StackOverFlowError ?怎么分析?
  • JVM 的常用调优参数有哪些?
  • 内存快照如何抓取,怎么分析 Dump 文件?
  • 谈谈 JVM 中类加载器?

1. JVM 的位置

什么时JVM?

定义:JVM 是 Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。

作用:Java 虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令执行。

本质:Java 虚拟机本质上就是一个程序,当它在命令行上启动的时候,就开始执行保存在某字节码文件中的指令。Java语言的可移植性正是建立在Java虚拟机的基础上。任何平台只要装有针对于该平台的Java虚拟机,字节码文件(.class)就可以在该平台上运行。这就是“一次编译,多次运行”。

位置:Java 程序在 JRE、JVM 上运行,操作系统下面是硬件体系。

JVM 初学笔记_第1张图片

2. JVM 的体系结构

Java虚拟机主要分为五大模块:类装载器子系统、运行时数据区、执行引擎、本地方法接口和垃圾收集模块

JVM 初学笔记_第2张图片

类加载器:将.class 文件加载到 JVM 内存区域。
运行时数据区域

  • 堆:存放具体对象
  • 方法区:类信息,包括修饰符,接口或者类,类的全限定名,父类的全限定名;字段信息:修饰符,字段类型,字段名;方法信息:修饰符,方法返回值,方法名等;常量池:整形常量池,字符串常量池,浮点型常量池等;类静态字段;类的 ClassLoader 引用(c.getClass().getClassLoader);编译时能够被确定数值的常量被复制到常量池中。
  • 栈:存放基本数据类型数据、局部变量和对象引用,一个方法使用完出栈,每个方法有唯一标志栈帧。
  • 程序计数器:多线程环境下,可标志当前程序执行的位置,便于下次继续执行。
  • 本地方法栈:加载本地方法

执行引擎:编译器 、解释器、垃圾回收器
本地方法接口:
本地方法库:

3. 类加载器

类加载器的作用:将.class 文件加载到 JVM 内存区域。

加载过程: .java 文件通过 Java 编译器编译为 .class 文件 ——>类加载器 ClassLoader ——> JVM 运行时数据区,(RuntimeException 发生在这里)。生成一个 java.lang.Class 对象存放在堆中,只有第一次使用到才加载。

基本上所有的类加载器都是 java.lang.ClassLoader 类的一个实例。
JVM 初学笔记_第3张图片
创建一个对象时,变量名在栈内,值在堆内;
JVM 初学笔记_第4张图片

类是一个模板,是抽象的,反射。car 的实例来自一个模板,实例化。

Car car1 = new Car();
Car car1 = new Car();
Car car1 = new Car();

JVM 中有 3 个默认的类加载器:

  • 引导(Bootstrap)类加载器。由原生代码(如C语言)编写,不继承自 java.lang.ClassLoader。负责加载核心 Java 库,存储在/jre/lib目录中。
  • 扩展(Extensions)类加载器。用来在/jre/lib/ext,或java.ext.dirs中指明的目录中加载 Java的扩展库。Java 虚拟机的实现会提供一个扩展库目录。该类加载器在此目录里面查找并加载 Java 类。该类由sun.misc.Launcher$ExtClassLoader实现。
  • Apps 类加载器(也称系统类加载器)。根据 Java 应用程序的类路径(java.class.path 或 CLASSPATH 环境变量)来加载 Java 类。一般来说,Java 应用的类都是由它来完成加载的。可以通过 ClassLoader.getSystemClassLoader() 来获取它。该类由sun.misc.Launcher$AppClassLoader实现。
package com.sjmp;

/**
 * @author: sjmp1573
 * @date: 2020/11/10 21:51
 * @description:
 */

public class Car {
    public static void main(String[] args) {
//       类是模板,对象是具体的
        Car car1 = new Car();
        Car car2 = new Car();
        Car car3 = new Car();

        System.out.println(car1.hashCode());
        System.out.println(car2.hashCode());
        System.out.println(car3.hashCode());

        Class<? extends Car> aClass1 = car1.getClass();
        Class<? extends Car> aClass2 = car2.getClass();
        Class<? extends Car> aClass3 = car3.getClass();

        System.out.println(aClass1.hashCode());
        System.out.println(aClass2.hashCode());
        System.out.println(aClass3.hashCode());

        ClassLoader classLoader = aClass1.getClassLoader();
        System.out.println(classLoader); // AppClassLoader
        System.out.println(classLoader.getParent()); // ExtClassLoader  \jre\lib\ext
        System.out.println(classLoader.getParent().getParent()); // null 1.不存在 2.Java 程序获取不到
    }
}

4. 双亲委派机制

package com.sjmp;

/**
 * @author: sjmp1573
 * @date: 2020/11/10 22:09
 * @description:
 */

public class Student {
    public static void main(String[] args) {
        Student student = new Student();
//        打印输出,可以看到从 AppClassLoader 加载器出来。
        System.out.println(student.getClass().getClassLoader());
        System.out.println(student.toString());
    }
    public String toString(){
        return "com.sjmp.Student 的 toString()";
    }
}

package java.lang;

/**
 * @author: sjmp1573
 * @date: 2020/11/10 22:05
 * @description:
 */

// 双亲委派机制:安全,防止程序员修改程序,制造 bug,比如修改 lang 下的 toString(),会乱套。
//    1. APP --> EXC -- BOOT (最终执行)
//    BOOT 类加载器会先加载这里面的类
//    EXC 如果 BOOT 中没有该类,则在这里查找
//    APP

public class String {
    public static void main(String[] args) {
        String s = new String();
//        双亲委派机制
        System.out.println(s.getClass().getClassLoader());
        s.toString();
    }
    public String toString(){
        return "自定义的 toString (java.lang.String)";
    }

    /*
    * 1.类加载器收到类的请求
    * 2.将这个请求向上委托给父类加载器去完成
    * 3.启动加载器检查是否能够加载当前这个类
    * 4.重复步骤 3
    *  Class Not Found
    *
    *  java 是用 C 写的
    *  null:java 调用不到 C、C++
    *  java 最初是为了去掉 C++ 繁琐的东西,例如指针,所以 Java 叫 C--。
    *
    *
    * */
}

5. 沙箱安全机制(了解)

参考链接:https://blog.csdn.net/qq_30336433/article/details/83268945

背景介绍:
在本地编写一个 Java 程序,默认情况下是可以访问该机器的任意资源,比如读取、删除一些文件或者网络操作等。
当程序部署到正式的服务器时,系统管理员为服务器的安全承担责任,那么他不敢确定你的程序是否会访问不应访问的资源,为了消除安全隐患,他有两种方式:

  • 让你的程序在一个限定权限的账号下运行
  • 利用 Java 沙箱机制来限定你的程序的访问权限。

什么是沙箱?

Java 安全模型的核心就是 Java 沙箱(Sandbox)。
沙箱是一个限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机 (JVM) 特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,系统资源包括
CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。

所有的 Java 程序运行都可以指定沙箱,可以定制安全策略。

Java 安全模型:

在 Java 中将执行程序分为本地代码何远程代码两种,本地代码视为可信任的,而远程代码则被看作是不受信任的。对于授信的本地代码,可以访问一切本地资源。而对非授信的远程代码在早期的 Java 实现种,安全依赖于沙箱(Sandbox)机制。如下图所示 JKD1.0 安全模型。

JVM 初学笔记_第5张图片
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java1.1版本中[,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示JDK1.1安全模型

JVM 初学笔记_第6张图片

在Java1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示 JDK1.2 安全模型

JVM 初学笔记_第7张图片
当前最新的安全机制实现,则引入了域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示最新的安全模型(jdk 1.6)

JVM 初学笔记_第8张图片
组成沙箱的基本组件:

字节码校验。

在这里插入图片描述

  • 字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。
  • 类装载器(class loader):其中类装载器在 3 个方面对Java沙箱起作用
    • 它防止恶意代码去干涉善意的代码;
    • 它守护了被信任的类库边界;
    • 它将代码归入保护域,确定了代码可以进行哪些操作。

虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由 Java 虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。

类装载器采用的机制是双亲委派模式

  1. 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
  2. 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
  • 存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
  • 安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
  • 安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
    • 安全提供者
    • 消息摘要
    • 数字签名
    • 加密
    • 鉴别

6. Native(重点)

编写一个多线程类启动

package com.sjmp;

/**
 * @author: sjmp1573
 * @date: 2020/11/11 20:07
 * @description:
 */

public class Demo {
    public static void main(String[] args) {
        new Thread(()->{

        },"my thread name").start();
    }

//    native :凡是带了
    public native void hello();
}

点进去看 start 方法的源码

    public synchronized void start() {
        /**
         * This method is not invoked for the main method thread or "system"
         * group threads created/set up by the VM. Any new functionality added
         * to this method in the future may have to also be added to the VM.
         *
         * A zero status value corresponds to state "NEW".
         */
        if (threadStatus != 0)
            throw new IllegalThreadStateException();

        /* Notify the group that this thread is about to be started
         * so that it can be added to the group's list of threads
         * and the group's unstarted count can be decremented. */
        group.add(this);

        boolean started = false;
        try {
            start0();
            started = true;
        } finally {
            try {
                if (!started) {
                    group.threadStartFailed(this);
                }
            } catch (Throwable ignore) {
                /* do nothing. If start0 threw a Throwable then
                  it will be passed up the call stack */
            }
        }
    }
    
    private native void start0();

Native Method Stack
它的具体做法是 Native Method Stack 中登记 native 方法,在(Execution Engine)执行引擎执行的时候加载 Native Libraries。【本地库】

JVM 初学笔记_第9张图片
凡是带了 native 关键字,说明 Java 的作用范围达不到,需要调用底层 C 语言的库!

JNI:Java Native Interface(Java 本地方法接口)
凡是带了 native 关键字的方法就会进入本地方法栈,其他的就是 Java 栈;

Native Interface 本地接口

本地接口的作用是融合不同的编程语言为 Java 所用,它的初衷是融合 C/C++ 程序,Java 在诞生的时候是 C/C++ 横行的时候,想要立足,必须有调用 C、C++ 的程序,于是就在内存中专门开辟了一块区域处理标记问 native 的代码,它的具体做法是在 Native Method Stack 中登记 native 方法,在(Execution Engine)执行引擎执行的时候加载 Native Libraries。
目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理生产设备,在企业级应用中已经比较少见。因为现在的异构领域间通信很发达,比如可以使用Socket通信,也可以使用Web Service等等,不多做介绍!

Execution Engine:

如果想让一个Java程序运行起来、执行引擎的任务就是将字节码指令解释/编译为对应平台上的本地机器指令才可以。简单来说,JVM 中的执行引擎充当了将高级语言翻译为机器语言的译者

7. PC 寄存器(了解)

程序计数器:Program Counter Register

每一个线程都是有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的字节码(用来存储指向一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计。

8. 方法区(掌握)

更详细的学习可参考这篇博客:https://blog.csdn.net/youngyouth/article/details/79933612

方法区(Method Area )是被所有线程共享的,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区域:
JVM 初学笔记_第10张图片

运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关。

new 一个对象的过程?
JVM 初学笔记_第11张图片参考链接:https://www.runoob.com/w3cnote/java-init-object-process.html

9. 栈

栈:一种数据结构
程序 = 数据结构 + 算法 (持续学习)
程序 = 框架 + 业务逻辑 (吃饭)
栈:先进后出,后进先出
队列:先进先出(FIFO)
喝多了吐就是栈,吃多了拉就是队列

为什么main()先执行,最后结束?
最先进栈,最后出栈,栈中无方法。其生命周期和线程同步,线程结束,栈内存也就是释放,对于栈来说,不存在垃圾回收问题!

栈:8大基本类型 + 对象引用 + 实例的方法

栈运行原理:栈帧
栈溢出:StackOverflowError

栈+堆+方法区:交互关系

JVM 初学笔记_第12张图片程序正在执行的方法,一定在栈的顶部。

10. 三种 JVM

  • Java HotSpot™ 64-Bit Server VM (build 25.211-b12, mixed mode)
  • BEA JRockit
  • IBM J9 VM
    我们学习都是:HotSpot

11. 堆

Heap,一个 JVM 只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放在堆中,类,方法,常量,变量,保存我们所有引用类型的真实对象;
堆内存中可细分三个区域:

  • 新生区(伊甸园区) Young/New
  • 养老区 old
  • 永久区 Perm

12. 新生区和老年区

JVM 初学笔记_第13张图片GC 垃圾回收,主要是在伊甸园区和养老区~
假设内存满了,OOM,堆内存不够!java.lang.OutOfMemoryError:Java heap space在JDK8 以后,永久存储区改了个名字(元空间);

JVM 初学笔记_第14张图片
伊甸园回收到幸存者叫做轻 GC

老年代对象回收叫做重 GC ,即 FULLGC

JVM 初学笔记_第15张图片
99 %的对象都是临时对象!

13. 永久区

这个区域常驻内存的。用来存放 JDK 自身携带的 Class 对象。Interface 元数据,存储的是 Java 运行时的一些环境或类信息,这个区域不存在垃圾回收!关闭 JVM 虛拟就会释放这个区域的内存。
一个启动类,加载了大量的第三方 jar 包。Tomcat 部署了太多的应用,大量动态生成的反射类不断被加载。直到内存满,就会出现 OOM;

  • jdk1.6之前:永久代,常量池是在方法区;
  • jdk1.7永久代,但是慢慢的退化了,去永久代,常量池在堆中
  • jdk1.8之后:无永久代,常量池在元空间

JVM 初学笔记_第16张图片

14. 堆内存调优

JVM 初学笔记_第17张图片
JVM 初学笔记_第18张图片
JVM 初学笔记_第19张图片
JVM 初学笔记_第20张图片

JVM 初学笔记_第21张图片
JVM 初学笔记_第22张图片
JVM 初学笔记_第23张图片
JProfiler 的使用

简介:
JProfiler’s intuitive UI helps you resolve performance bottlenecks,
pin down memory leaks and understand threading issues.
JProfiler 值观的 UI 界面帮助你解决性能瓶颈,锁定内存泄漏和了解线程问题。

JProfiler 成为在 JVM 上对应用程序进行性能分析的最佳选择。

在 IDEA 中集成JProfile:

在设置 Plugins 中搜索 JProfile 并安安装。

JVM 初学笔记_第24张图片
官网下载
JVM 初学笔记_第25张图片编写程序使出现 OOM 错误

package com.sjmp;

import java.util.ArrayList;

/**
 * @author: sjmp1573
 * @date: 2020/11/13 22:49
 * @description:
 */

// -Xms 设置初始化内存分配大小  , 内存的 1/64
//    -Xmx 设置最大分配内存,默认 1/4
//    -XX;+PrintGCDetails   // 打印 GC 垃圾回收信息
//    -XX:+HeapDumpOnOutOfMemoryError //oom DUMP
//    -Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError
public class Demo03 {
    byte[] array = new byte[1*1024*1024];

    public static void main(String[] args) {
        ArrayList<Demo03> list = new ArrayList<>();
        int count = 0;

        try {
            while (true){
                list.add(new Demo03());
                count = count+1;
            }
        }catch (Exception e){
            System.out.println("count:"+count);
            e.printStackTrace();
        }
    }
}

设置 JVM 最大内存和初始内存:

-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError

并输出 Dump 文件

JVM 初学笔记_第26张图片
JVM 初学笔记_第27张图片

15.GC

JVM 初学笔记_第28张图片

常用算法
JVM 在进行 GC 时,并不是对这三个区域统一回收。大部分时候,回收都是新生代~
- 新生代
- 幸存区(from ,to)
- 老年区
GC 两种类:轻 GC (普通的GC),重GC (全局GC)

GC 的题目:

  • JVM 的内存模型和分区~ 详细到每个区放什么?
  • 堆里面 的分区有哪些?EDen,from,to,老年区,说说他们的特点!
  • GC 的算法有哪些?标记清除法,标记压缩,复制算法,引用计数器,怎么用的?
  • 轻 GC 和重 GC 分别在什么时候发生?

可参考此篇文章:https://baijiahao.baidu.com/s?id=1664726694138661864&wfr=spider&for=pc

引用计数法:

假设有一个对象A,任何对象对A进行引用,那么对象A的引用计数器+1,当引用失效时,对象A的引用计数器-1,当对象A的引用计数器为0时,就说明对象A没用被引用,那么就可以进行回收。
JVM 初学笔记_第29张图片
复制算法

复制算法的核心就是,将原有的内存空间一分为二,每次只使用其中一块,在垃圾回收时将正在使用的对象复制到另外一个内存空间中,然后将该内存空间清空,交换两个内存角色完成垃圾回收。

JVM 初学笔记_第30张图片
JVM 初学笔记_第31张图片
JVM 初学笔记_第32张图片
复制算法最佳使用场景:对象存活度较低的时候;新生区~

标记清除法

标记清除算法,是将垃圾回收分为两个阶段,分别是标记和清楚

标记:从跟节点开始标记引用的对象清除:未被标记引用的对象就是垃圾对象,可以被清理
JVM 初学笔记_第33张图片

  • 优点:不需要额外的空间!
  • 缺点:两次扫描,严重浪费时间,会产生时间碎片。

标记压缩算法

标记压缩算法是在标记清除法的基础上进行了优化,标记阶段是一样的,在清理阶段不是直接清理标记对象,而是将存活对象压缩到内存的一端,然后清理边界以外的垃圾,从而解决碎片化问题。
JVM 初学笔记_第34张图片
JVM 初学笔记_第35张图片只有最合适的算法–> GC:分代收集算法

年轻代:

  • 区域大:存活率
  • 标记清除(内存碎片不是太多)+ 标记压缩混合实现

16. JMM

什么时 JMM?
JMM: (Java Memory Model 的缩写)
用来干嘛的?
作用:缓存一致协议,用于定义数据读写的规则(遵守,找到这个规则)。
JMM 定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory)
JVM 初学笔记_第36张图片
解决共享对象可见性这个问题:volilate 关键字

3.如何学习?
JVM 初学笔记_第37张图片JVM 初学笔记_第38张图片

你可能感兴趣的:(Java基础,学习笔记,jvm,java)