【JavaEE】JVM 剖析

JVM

  • 1. JVM 的内存划分
  • 2. JVM 类加载机制
    • 2.1 类加载的大致流程
    • 2.2 双亲委派模型
    • 2.3 类加载的时机
  • 3. 垃圾回收机制
    • 3.1 为什么会存在垃圾回收机制?
    • 3.2 垃圾回收, 到底实在做什么?
    • 3.3 垃圾回收的两步骤
      • 第一步: 判断对象是否是"垃圾"
      • 第二步: 如何回收垃圾

1. JVM 的内存划分

  • JVM 其实就是一个Java的进程
  • 一个进程运行过程中, 就要从操作系统这里申请到一些内存资源, JVM当然也是如此, 搞一大块内存, 供Java代码执行时使用
  • JVM把这一块内存, 又划分出几个区域来, 作为不同的用途

【JavaEE】JVM 剖析_第1张图片

例题

【JavaEE】JVM 剖析_第2张图片

2. JVM 类加载机制

  • 类加载机制就是将类从磁盘加载到内存当中
  • Java 程序, 最开始写的是一个 .java 文件, 编译成 .class 文件 (字节码)
  • 运行 java 程序, JVM就会读取 .class 文件, 把文件的内容, 放到内存中, 并且构造成 class 对象 (类对象)

2.1 类加载的大致流程

  1. 加载 找到 .class 文件, 打开并读取文件内容, 并且尝试解析格式
  2. 验证, 检验一下当前 .class 文件是否符合格式要求
  3. 准备 给对象分配内存
    • 最终目标, 是构造出完整的类对象, 分配内存 + 初始化
    • 分配出来的空间, 内容都是 0 此时此刻, 类对象上static也是0
  4. 解析
    • 主要是初始化类对象中涉及到的一些字符串常量
    • 其实字符串常量已经在 .class 文件中有了, 直接读到内存中就行了
    • 将常量池内的符号引用替换为直接引用的过程,也就是初始化常量的过程。
      • 符号引用: 此时.class 文件中, 不知道字符串真实的内存地址在哪里的, 只能知道一个相对偏移量, 知道字符串的内容在 .class 文件的哪个地方, 等到把字符串内容加载到内存中之后, 就可以把 真实的地址, 替换 到刚才的符号引用这里了
  5. 初始化 堆类对象进行更具体的初始化操作, 初始化静态成员, 执行静态代码块, 加载父类 …

2.2 双亲委派模型

什么是双亲委派模型

  • 类加载的时候, 需要先找到 .class 文件
  • 双亲委派模型就是用来描述找 .class 文件的过程的

JVM 中的三个类加载器

【JavaEE】JVM 剖析_第3张图片

  • 此处的"父子" 不是父类, 子类的继承关系, 而是一种组合关系
  • "子类"对象中存储了"父类"的引用

双亲委派模型描述找 .class 文件具体过程

【JavaEE】JVM 剖析_第4张图片

  1. 从 Application ClassLoader 开始
    • 不会立即就搜索第三方库的目录, 而是先把加载任务委派给父亲, 让父亲先尝试加载
  2. 到了 Extendsion ClassLoader
    • 也不会立即就搜索扩展库的目录, 也是把加载任务委派给父亲, 让父亲先尝试加载
  3. 到了 Bootstrap ClassLoader
    • 也不想立即搜索标准库, 而是也想把任务委派给父亲, 但是 Bootstrap ClassLoader 没有父亲, 就只能自己动手来搜索了
    • 如果找到了诶这个类, 就会进行后续的加载(也就是和 Extension 和 Application 都没关系了)
    • 如果没有找到这个类, 任务就会仍然交回给 孩子 完成
  4. 任务回到了 Extend ClassLoader
    • 就要搜索扩展库的目录, 看有没有匹配的 .Class 文件
    • 如果找到了诶这个类, 就会进行后续的加载(也就是和 Extension 没关系了)
    • 如果没有找到这个类, 任务就会仍然交回给 在 孩子 完成
  5. 任务回到了 Application ClassLoader
    • 就要搜索第三方库的目录 (往往就是你项目目录, 以及和JVM 的一些配置项有关 -classpath 有关)
    • 如果找到类, 就进行后续加载;
    • 如果没找到, 就会抛出一个异常

双亲委派的目的

  • 明确了优先级
  • 标准库的类最先加载, 扩展库其次, 第三方库最低
  • 避免了程序的代码对标准库产生的负面影响

2.3 类加载的时机

  1. 创建类的实例
  2. 使用了类的静态方法/静态属性
  3. 子类的加载就会触发父类

类加载的之后, 就不需要再次加载了;

所以类加载是以懒汉模式进行加载的~

类卸载 (把类对象干掉)

  • 特殊情况

  • 一般来说类加载了之后, 就不必考虑卸载, 一直保持到程序运行结束

  • 有特定的场景, 可能需要用到 卸载 操作

    • 有的服务器, 需要打 “热补丁”
    • 代码有bug, 正常操作应该是修改代码, 重新编译, 用新版本的程序替代就版本 – 重启服务器
    • 有些情况, 服务器不方便重启, 就可以 “打补丁”, 通过一些特殊手段, 把需要提黄的类给卸载掉, 直接用加载好的 类 替换 (新版代码), 这样不重启也能更新代码

3. 垃圾回收机制

3.1 为什么会存在垃圾回收机制?

内存泄漏

  • 垃圾就是进程向操作系统申请内存, 使用完后没有释放, 导致内存泄漏
  • 内存泄漏是一件很危险的事情, 短时间看起来程序运行正常, 而内存泄漏一段时间后, 服务器就会出现明明正在使用的内存挺少的, 但是就是无法再次申请内存了!
  • 内存泄漏就像一个不定时的定时炸弹一样, 十分的危险

各个语言的解决方法

  • C语言: 完全靠程序员手动释放(不靠谱)
  • C++: 引入了只能指针问题
  • java / Python / Ruby / PHP / Go: 引入了垃圾回收 (GC)
    • 最大程度释放了程序员
    • 但是需要消耗额外的系统资源, 消耗一定的时间, 可能会带有 STW 问题
  • Rust 另辟蹊径, 强编译期检查
    • 号称是能够做到更高效, 更强大的释放内存的效果, 内存安全
    • 但是语法复杂, 与C++的语法有过犹而不及, 上手困难

3.2 垃圾回收, 到底实在做什么?

对于java来说, 回收其实是 “对象” 而不是 “字节”, GC 并非判定几个字节是不是垃圾, 进一步的进行回收的

JVM 中有好几个内存区域, GC 回收的是哪里的对象?

  • 栈空间不需要 GC 回收, 栈里面包含很多 “栈帧”, 每个栈帧对应一个方法, 该方法执行结束, 此时这个栈帧就销毁了; 栈帧上的局部变量是啥的自然销毁;
  • 程序计数器同理, 线程销毁, 自然跟着销毁
  • 方法区, 类对象, 很少会涉及到对象的卸载
  • 所以, 堆是GC的主要战场!!

3.3 垃圾回收的两步骤

第一步: 判断对象是否是"垃圾"

"垃圾"的定义

  • 如果一个对象, 在后续代码中, 不会被继续使用到了, 就可以视为是垃圾了
  • 也就是说, 一个对象, 如果没有任何引用指向他, 就可以认为是垃圾了
  • 所以, 判断一个对象是否是垃圾的关键, 就是看这个对象是否有引用指向它

判读是否是垃圾的思路一: 引用计数

  • 原理

    • 给对象里面安排一个计数器, 每次有引用指向它, 就把计数器 +1, 每次引用被销毁, 计数器 -1, 当计数器 为0 的时候, 意味着该对象就是垃圾了
  • 缺点

    1. 空间利用率比较低, 浪费更多个内存空间
      • 如果引用计数分配了 2 哥字节, 对象本体才 4 个字节的话, 引用计数就浪费了 50 % 的空间, 如果代码中都是这种小对象, 并且数量众多, 此时浪费就非常明显了
    2. 存在循环引用的问题, 导致对象不能正确识别为垃圾
  • 注意: 该思路不是JVM采用的方案

判读是否是垃圾的思路二: 可达性分析 – JVM 采用的方案

  • 原理
    • JVM 首先会从现有代码中的能直接访问到的引用出发, 尝试遍历所有能够访问的对象, 只要对象能访问到, 就会标记成 “可达”, 完成整个遍历之后, 可达之外的对象, 也就是不可达, 也就相当于是垃圾了
    • 直接访问到的引用:
      1. 栈上的局部变量
      2. 常量池里的引用
      3. 方法区中的静态成员
  • 缺点
    • 存在遍历扫描, 所以需要消耗一定的时间, 但是不会引入额外的空间
  • 代码执行过程中, 一个对象是否是垃圾, 这件事, 往往是 “动态变化” 的;
  • 上述可达性分析的扫描,是持续的, 周期性的

第二步: 如何回收垃圾

方法一: 标记清除(直接释放)

【JavaEE】JVM 剖析_第5张图片

  • 直接释放对象, 就可能引起 “内存碎片化”
  • 申请内存的时候, 都是申请的 “连续” 内存空间
  • 释放内存, 就可能会破坏原有的连续性 – 导致 “有内存, 但是申请不了”
  • 这种问题, 还是挺严重的, 内存碎片化随着程序的运行越来越多, 越来越碎片化, 内存就更难申请了

方法二: 复制算法

  • 通过冗余的内存空间, 把有效对象复制到另一部分空间, 避免内存碎片化
  • 把一个对象, 分成两份, 用一份, 丢一份
  • 把左侧区域中, 有效的对象, 复制到右侧
  • 接下来就可以使用右侧区域了, 用了一段时间, 也会有很多对象, 也是同理, 把有效对象复制会左边, 把右侧区域统一释放
  • 但是复杂的内容多, 开销很大, 而且内存利用率也不高

方法三: 标记整理

  • 顺序表删除元素, 搬运
  • 这样的方法, 避免了刚才复制算法内存利用率低的问题
  • 但是, 搬运元素的成本, 也是比较高的

JVM 采用的方法 – 集百家之长 : 分代回收

  • 结合上述方案, 做了一个综合性质的方案
  • 在不同的场景下, 使用不同的回收方式, 扬长避短

分代回收

  • 一个基本的"经验规律"(通过实验观察, 总结出来的规律) : 一个东西存在的越久, 继续存在的可能性就很高

  • Java 中, 对象也就分成两大类

    1. 生命周期特别特别短的
    2. 生命周期特别特别长的
    • 当然也有不长不短的(出现概率更低)
  • Java中对象的年龄是依据 GC 扫描次数来增长的, 挺过一次扫描就增长一次

  • 按照对象的年龄来指定不同的回收策略

【JavaEE】JVM 剖析_第6张图片

  • 新生的对象

    • 伊甸区
      • 虽然空间看起来不小, 实际上这里的对象, 绝大部分无法活过一轮 GC – 第一轮 GC 扫描到达的时候, 这个对象就已经是垃圾了
      • 第一轮 GC 经过之后, 剩下的还没挂的对象, 就会通过复制算法, 复制到 幸存区
    • 幸存区
      • 这里是大小相同的两部分空间, 每次只有其中一块
      • 继续使用复制算法
      • 如果一个对象在幸存区中, 经过了好多轮, 仍然坚挺没有挂, 则就说明这个对象应该是 "生命周期特别长"的了, 这个时候, 对象来到了老年代了
  • 老年代对象

    • 采用标记整理的方法来释放内存
  • 新生代, 扫描频次是比较高的; 每一轮 GC 留下的有效对象都不多, 复杂算法的开销不大

  • 老年代, 扫描频次就降低了; 不太会有对象真销毁, 此时标记整理的开销也不大

你可能感兴趣的:(#,Java,java-ee,jvm,python)