JVM初步理解

Jvm体系结构

jvm主要由四部分构成:
1.类加载器
2.执行引擎

  • jvm的执行引擎是jvm的核心部分,它的作用就是解析jvm字节码指令,得到执行结果。
  • jvm解析字节码的过程可以实现多样化:直接解释、转成本地代码再执行、采用寄存器芯片模式执行
  • sun的hotspot是基于栈的执行引擎,google的dalvik是基于寄存器的执行引擎
  1. 内存区
  • 方法区、java堆、java栈、pc寄存器、本地方法区
  1. 本地方法调用
  • 调用c或c++库实现

java栈:每启动一个线程,jvm就为该线程创建一个java栈,同时为该线程分配一个pc寄存器,同时pc寄存器指向该线程的第一行可执行的代码(字节码)
java堆、方法区:存放相关常量

内存管理

java中使用内存的组件:
  1. java堆:用于存储java对象,堆的大小是在jvm启动时向操作系统一次性申请的内存(大小固定,不能扩展,也不能回收)。可以通过“-Xmx(最大内存),-Xms(最小内存)”。空间释放由GC控制,对象的创建由java程序控制
  2. 线程:java程序没启动一个线程,jvm会为其创建一个堆栈(一般为256kb-756kb之间,大小根据jvm的实现方式而定)
  3. 类和类加载器:Sun JDK中被存储在堆中,该区域被称为“永久代(PermGen区)”

永久代被回收的条件:

  • 在java堆中,没有对表示该“类加载器”的java.lang.ClassLoader对象的引用
  • java堆没有对表示“类加载器”加载的类的任何java.lang.Class对象的引用
  • 在java堆中,该“类加载器”加载的任何类的所有对象都不再存活(被引用)
    jvm中创建的3个默认的类加载器Bootstrap ClassLoader、ExtClassLoader、AppClassLoader都不满足以上条件,因此任何系统类(如java.lang.String)或通过应用程序“类加载器”加载的任何应用程序类都不能在运行时释放。
  1. NIO(引入通道和缓冲区来执行I/O),使用java.nio.ByteBuffer.allocateDirect()方法分配内存(本机内存)
  2. JNI使得本机代码(如C语言)可以调用Java方法,即native memory

JVM内存结构(JVM运行时数据划分):

  1. PC寄存器数据
  • 用于保存当前正常执行的程序的内存地址,因为java程序是多线程执行的。在多线程交叉执行时,记录并保存中断线程当前执行到哪条的内存地址,以便在恢复时中断的指令正常执行。
  1. Java栈
  • java栈总是与线程所关联,每当创建一个线程,JVM就会为该线程创建一个对应的Java栈,每个线程的java栈相互隔离;
  • java栈中包含多个栈帧(frames),栈帧与方法相关,每个方法创建一个栈帧,栈帧包含方法内定义的变量、操作栈和方法返回值等信息;
  • 栈帧在方法执行完成后弹出栈帧元素作为返回值,并清除栈帧;
  • java栈的栈顶的栈帧就是当前正在执行的活动栈(即当前正在执行的方法),PC寄存器指向的是活动栈的地址
  • 堆是java对象存储的地方,是JVM管理java对象的核心存储区域;
  • java堆被java线程共享(同步问题的核心关注点)
  1. 方法区
  • JVM用于存储类结构的地方;
  • class文件被加载到JVM时,会被存储到不同的数据结构。其中常量池、域、方法数据、方法体、构造函数、以及类中的专有方法、实例初始化、接口初始化都存储在这个区域
  • 方法区属于java堆中的永久区,被线程共享,并且大小可以根据参数来设置
  • GC回收器管理java堆的内存释放,方法区虽然比较稳定,但是任然被GC所管理,需要很长时间才能到达Old区
  1. 本地方法区(本地方法栈)
  • JVM运行Native方法准备的空间,与java栈类似。又称为C栈(因为很多Native方法是有C语言实现的)
  • JVM运用JIT技术将java方法重新编译为Native Code代码,本地方法栈用来跟踪方法的执行状态
  1. 运行时常量池
  • 数据结构定义:Runtime constant pool代表运行时每个class文件中的常量表,包含:编译期的数字常量、方法或者域的引用(在运行时解析)
  • 运行时常量池是方法区的一部分,所有它的存储受方法区的规范约束

JVM内存分配:

  1. 静态内存分配
    在编译时就能确认需要的内存大小
  2. 栈内存分配
    可以成为动态内存分配,只有在运行时才能确定内存的大小
    基于堆栈的方法实现
  3. 堆内存分配
    只有在运行时,并且运行到相应代码是才能确定内存的大小
    最灵活的内存分配,但是对系统和内存管理是一种挑战

Hotspot基于分代的垃圾回收算法

把对象按照寿命分组,分为年轻代和老年代,新创建的对象被分为年轻代,如果对象经历过几次垃圾回收后仍然存活,那么就把该对象划分到老年代。

分区划分:

  1. young区
    Eden区:存放新创建的对象的区域
    Survivor区(两个):当Eden区满后,促发minor GC操作将Eden区存活的对象复制到其中一个Survivor区,另外一个Survivor区存活的对象也复制到该Survivor区中。保证一个Survivor区始终为空
  2. old区
    存放young区中在Survivor区满,并促发minor GC后仍然存活的对象。
    如果old区满了之后,促发full GC回收整个堆的内存
  3. perm区
    主要存放累的class对象,如果一个类被频繁的加载,也可能导致perm区满。
    perm区垃圾回收也是由Full GC触发

垃圾回收算法

  1. Serial Collector
  • client模式下默认的GC算法
  • 指定参数:-XX:+UseSerialGC
  • 回收策略:minor GC触发之前检查每次minor GC晋升到Old区的对象平均大小是否超过了old区剩余的空间,如果超过,则促发full GC
  • 单线程回收
  • 适合有限的情况下,回收慢
  1. parallel Collector
  • 效率高,但是在Heap过大时,应用程序暂停时间较长
  • 根据minor GC和full GC不同,分为:
  1. ParNewGC
  • 指定参数:-XX:UseParNewGC
  • 回收策略与Serial Collector类似
  • 并行回收
  1. ParallelGC
  • Service模式默认GC方式
  • 指定参数:-XX:UseParallelGC
  • 并行回收:线程个数与CPU和核数有关,可以使用参数“-XX:ParallelGCThreads”来指定
  • 回收策略:向Eden区申请内存空间时,如果Eden区空间不够,那么判断申请的空间是否大于Eden空间的一半。如果大于,则申请的空间直接在Old区分配;如果小于,则直接促发minor GC,在促发minor GC之前,检查每次晋升到Old区的平均大小是否大于old区的剩余空间,如果大于,则促发full GC。在此次GC之后仍然会按照该规则再检查一次。
  • 清空整个Heap堆中的垃圾对象,清除perm区中已经被卸载的类信息,并进行压缩。
  1. ParallelOldGC
  • 指定参数:-XX:UseParallelOldGC
  • 并行回收:线程个数与CPU和核数有关,可以使用参数“-XX:ParallelGCThreads”来指定
  • 清除Heap堆中的部分垃圾对象,并进行部分的空间压缩
  1. CMS Collector
  • Old区回收暂停时间短,但是产生内存碎片、整个GC耗时较长、比较耗CPU
  • 指定参数:-XX:UseConcMarkSweepGC
  • 并行回收:默认线程数为4,可以通过ParallelCMSThreads来指定
  • 回收策略:既不是minor GC也不是full GC。促发规则是检查Old区或者perm区的使用率,达到一定比例是促发CMS GC。促发是回收Old区的内存空间,默认是92%

你可能感兴趣的:(JVM初步理解)