《码出高效-Java开发手册》走进JVM有感

走进JVM

字节码

Java 所有的指令有200个左右,一个字节可以存储256种不同的指令信息,一个这样的字节称为字节码(中间码)。在代码的执行过程中,JVM将字节码解释执行,屏蔽对底层操作系统的依赖,JVM 也可以将字节码编译执行,如果是热点代码,会通过JIT 动态地编译为机器码,提高执行效率

字节码主要指令如下:

  • 加载或存储指令

    在某个栈帧中,通过指令操作数据在虚拟机栈的局部变量表与操作栈之间来回传输,常用指令如下:

    • 将局部变量加载到操作栈中。
    • 从操作栈顶存储到局部变量表
    • 将常量加载到操作栈顶,这是极为高频使用的指令
  • 运算指令: 对两个操作栈帧上的值进行运算,并把结果写入操作栈顶IADD、IMUL

  • 类型转换指令 显示转换两种不同的数值类型

  • 对象创建于访问指令

    • 创建对象指令 NEW NEWARRAY
    • 访问属性指令 GETFIELD、PUTFIELD 等
    • 检查实例类型指令
  • 操作栈管理指令

    • 出栈指令
    • 赋值栈顶元素并压入栈
  • 方法调用与返回指令

  • 详细见 P125《码出高效: JAVA开发手册》

Java源文件 ----> 词法解析-- token流 -> 语法解析 -----> 语义分析 -----> 生成字节码 ----> 字节码

详细见P126

类加载过程

任何程序都需要加载到内存中才能与CPU进行交流。字节码 .class 文件同样需要家长到内存中,才可以实例化类。ClassLoader 就是提前加载 .class 文件到内存中

过程: 加载、链接、初始化

  • 加载: 读取类文件产生的二进制流,并转为特定的数据结构,初步校验cafe babe 魔法值,常量池、文件长度、是否有父类等,然后创建对应类的实例
  • 链接包括验证、准备、解析三个过程。验证是更详细的校验,比如final 是否合规,类型是否正确、静态变量是否合理等;准备结果是为静态变量分配内存,并设定默认值,解析类和方法确保类与类之间的相互引用正确性,完成内存结构布局
  • 初始化结果,执行类构造器方法,如果赋值运算是通过其他类的静态方法来完成的,那么会马上解析另一个类,在虚拟机栈中执行完毕后通过返回值进行赋值

内存布局

《码出高效-Java开发手册》走进JVM有感_第1张图片

  • Heap (堆区)

    是OOM 故障的主要发源地,它存储着几乎所有的实例对象,堆由垃圾收集器自动回收,堆区各子线程共享使用。通常它的占用的空间是所有内存区域最大的,但是如果无节制的创建实例那么也将会消耗完内存导致OOM。可以在运行时动态的设置它的大小,-Xms256M - Xmx1024M 表示设定初始值和最大值。服务器在运行过程中,退空间不断地扩容和回缩,势必形成不必要的系统压力,所以在线上生产环境中,JVM 的Xms和Xmx 设置为一样大小,避免在GC 后调整堆大小时带来的额外压力。

    (下图:这里的放得下指的是当创建一个大对象时候,内存区域是否能够容纳得下)

《码出高效-Java开发手册》走进JVM有感_第2张图片

  • Metaspace(元空间)

    元空间的前身是Perm区(被称为永久代),在JDK7 及之前的版本中才有Perm,现在的版本使用了Metaspace。因为Perm 在某些场景下,如果动态加载类过多,容易产生Perm 区的OOM(为了解决需要设定参数 -XX:MaxPermSize = 1280m),如果部署到新机器上,往往会因为JVM 参数没有修改导致故障再现,不熟悉此应用的人很难排查。所以,元空间就诞生了。元空间在本地内存中分配。

  • JVM Stack (虚拟机栈)

    栈的特性是先进后出的数据结构,JVM 是基于栈结构的院系环境。JVM 中的虚拟机栈是描述Java方法执行的内存区域,它是线程私有的。栈中的元素用于支持虚拟机进行方法调用,每个方法从开始调用到执行完成的过程。就是栈帧从入栈到出栈的过程。活动线程中只有位于栈顶的帧才是有效的,称为当前栈帧。正在执行的方法称为当前方法。

    虚拟机栈通过压栈和出栈的方式,对每个方法对应的活动栈帧进行运算处理,方法正常执行结束,肯定会跳转到另一个栈帧上。在执行过程中,如果出现异常,会进行异常回溯,返回地址通过异常处理表确定。

    • 局部变量表: 存放方法参数和局部变量的区域
    • 操作栈 : 一个初始状态为空的桶式结构栈。在方法执行过程中,会有各种指令往栈中写入和提取信息。
    • 动态连接:每一个栈帧包含一个常量池中对当前方法的引用,目的是支持方法调用过程的动态连接
    • 方法返回地址: 方法执行有两种退出情况: 1. 正常退出。2.异常退出。 无论何种退出情况都将返回到方法当前被调用的位置。方法退出的过程相当于弹出当前栈帧。
  • 本地方法栈

    Native Method Stack 在JVM内存布局中,也是线程对象私有的。被称为Native 方法服务,线程开始调用本地方法时,会进入一个不再受JVM约束的世界。本地方法可以通过JNI来访问虚拟机运行时的数据区,甚至可以调用寄存器,具有和JVM相同的能力和权限。

  • 程序计数寄存器

    每一个线程在创建后,都会产生自己的程序计数器和栈帧,程序计数器用来存放执行指令的偏移量和行号指示器,程序的执行或者恢复都要依赖程序计数器。程序计数器在哥线程之间互不影响,此区域不会发生内存溢出异常。

    从线程共享的角度来看,堆空间和元空间都所有线程共享的,而虚拟机栈和本地方法栈,程序计数器是线程内部私有的。

《码出高效-Java开发手册》走进JVM有感_第3张图片

对象实例化

实例化对象过程

  • 确认类元信息是否存在。当JVM接受到new指令时,首先在metaspace 内检查需要创建的类元信息是否存在。若不存在,那么在双亲委派模式下,使用当前类加载器以ClassLoader +包名+类名为key 进行查找对应的.class 文件,如果没有找到文件,则抛出ClassNotFoundException 异常,如果找到,则进行类加载并生成对应的Class 类对象。
  • 分配对象内存。首先计算对象占用空间大小,如果实例成员变量是引用变量,仅分配引用变量空间即可,即4个字节大小,接着在堆中划分一块内存给新对象。在分配内存空间时,需要进行同步操作,比如采用CAS失败重试,区域加锁等方式保证分配操作的原子性。
  • 设定默认值。成员变量值都需要设定默认值,即各种不同形式的零值。
  • 设置对象头。设置新对象的哈希码,GC信息,锁信息,对象所属的类元信息等。这个过程的具体设置方式取决JVM实现。
  • 执行init 方法。初始化成员变量,执行实例化代码块,调用类的构造方法,并把堆内对象的首地址赋值给引用变量。

垃圾回收

Java 会对内存进行自动分配与回收管理,使上层业务更加安全,方便地使用内存实现程序逻辑。GC 主要目的是清除不再使用的对象,自动释放内存。

  • 标记-清除

  • 复制

  • 标记-整理

  • 区分新老年代(分代收集)

你可能感兴趣的:(《码出高效》有感)