Java Virtual Machine - java 程序的运行环境(java 二进制字节码的运行环境)
是java程序实现跨平台的⼀个重要的⼯具
栈、本地方法栈、程序计数器不会发生gc。
jvm调优主要在堆,方法区有一小部分。
HotSpot (我们一般使用的)
JRockit BEA
J9 vm IBM
三者关系: JDK > JRE > JVM
⼀个类被加载进JVM中要经历哪⼏个过程
加载: 通过io流的⽅式把字节码⽂件读⼊到jvm中(⽅法区)
校验:通过校验字节码⽂件的头8位的16进制是否是cafebabe
准备:为类中的静态部分开辟空间并赋初始化值
解析:将符号引⽤转换成直接引⽤。——静态链接
初始化:为类中的静态部分赋指定值并执⾏静态代码块。
类被加载后,类中的类型信息、⽅法信息、属性信息、运⾏时常量池、类加载器的引⽤等信息会被加载到元空间中。
加载.class文件
新建的对象放入堆里面,引用(地址)放到栈,其中引用指向堆里面对应的对象。
1)虚拟机自带的加载器
2)启动类(根)加载器 Bootstrap ClassLoader
3)扩展类加载器 Extension ClassLoader
4)应用程序(系统类)加载器 Application ClassLoader
检查顺序从下至上,加载顺序从上到下。
如果一个类加载器需要加载类,那么首先它会把这个类请求委派给父类加载器去完成,每一层都是如此。一直递归到顶层,当父加载器无法完成这个请求时,子类才会尝试去加载,直到找不到为⽌,则报类找不到的异常。
可以避免重复加载,父类已经加载了,子类就不需要再次加载
更加安全,防⽌核⼼类库中的类被随意篡改,很好的解决了各个类加载器的基础类的统一问题,如果不使用该种方式,那么用户可以随意定义类加载器来加载核心api,会带来相关隐患
当⼀个类被当前的ClassLoader加载时,该类中的其他类也会被当前该ClassLoader加载。除⾮指明其他由其他类加载器加载。
Program Counter Register 程序计数器(寄存器)
每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向像一条指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略不计
是记住下一条jvm指令的执行地址
是线程私有的
不会存在内存溢出
它的具体做法是Native Method Stack中登记native方法,在( Execution Engine )执行引擎执行的时候加载Native Libraies。[本地库]
native :凡是带了native关键字的,说明java的作用范围达不到了,回去调用底层c语言的库
会进入本地方法栈 去调用本地方法接口将native方法引入执行
调用本地方法本地接口 JNI (Java Native Interface)
JNI作用:开拓Java的使用,融合不同的编程语言为Java所用
Java诞生的时候C、C++横行,想要立足,必须要有调用C、C++的程序
private native void start0();
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间; 静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
线程栈:执⾏⼀个⽅法就会在线程栈中创建⼀个栈帧。
栈帧包含如下四个内容:
局部变量表:存放⽅法中的局部变量
操作数栈:⽤来存放⽅法中要操作的数据
动态链接:存放⽅法名和⽅法内容的映射关系,通过⽅法名找到⽅法内容
⽅法出⼝:记录⽅法执⾏完后调⽤次⽅法的位置。
栈:先进后出,栈内存主管程序的运行,生命周期和线程同步,线程结束,栈内存也就是释放,对于栈来说,不存在垃圾回收问题,一旦线程结束,栈就结束.
栈内存中运行:8大基本类型+对象引用+实例的方法.
栈运行原理:栈桢
栈满了:StackOverflowError
队列:先进先出(FIFO:First Input First Output)
一个JVM只有一个堆内存,堆内存的大小是可以调节的.类加载器读取类文件后,一般会把类,方法,常量,变量,保存我们所有引用类型的真实对象.
堆内存细分为三个区域:
新生区(伊甸园区):Young/New
养老区old
永久区Perm
目的:控制对象的诞生,成长和死亡
分为:
伊甸园区:所有对象都在伊甸园区new出来
幸存0去和幸存1区:轻GC之后存下来的
永久存在的对象放在老年区,真理:经过研究,99%的对象都是临时对象!
步骤:
当伊甸园区满了之后进行轻GC幸存下来的放到幸存0区或幸存1区
当伊甸园区,幸存0区和幸存1区都满了进行重GC,幸存下来的放到养老区
当伊甸园区,幸存0区和幸存1区和养老区都满了,会出现OOM
OOM:
引用计数法(Java没有采用)
标记-清除法 (jvm老年代回收)
标记-压缩法 (jvm老年代回收)
复制算法 (jvm新生代回收)
原理:实际上是通过在对象头中分配一个空间来保存该对象被引用的次数。如果该对象被其它对象引用,则它的引用计数+1,如果删除对该对象的引用,那么它的引用计数就-1,当该对象的引用计数为0时,那么该对象就会被回收。
GC的时候会将计数器为0的对象C给销毁.
引用计数法无法解决循环引用的问题
循环依赖问题:
A a = new A()
B b = new B()
a.x=b
b.x=a
a=null
b=null
很难判断 然后 怎么去标记为0 去回收
根搜索算法。它的处理方式就是,设立若干种根对象,当任何一个根对象到某一个对象均不可达时,则认为这个对象是可以被回收的。
ObjectD和ObjectE是互相关联的,但是由于GC roots到这两个对象不可达,所以最终D和E还是会被当做GC的对象,上图若是采用引用计数法,则A-E五个对象都不会被回收。
说到GC roots(GC根),在JAVA语言中,可以当做GC roots的对象有以下几种:
1、虚拟机栈中的引用的对象。
2、方法区中的类静态属性引用的对象。
3、方法区中的常量引用的对象。
4、本地方法栈中JNI的引用的对象。
第一和第四种都是指的方法的本地变量表,第二种表达的意思比较清晰,第三种主要指的是声明为final的常量值。
GC 复制算法是利用 From 空间进行分配的。当 From 空间被完全占满时,GC 会将存活
对象全部复制到 To 空间,并且年龄加一。当复制完成后,该算法会把 From 空间和 To 空间互换,GC 也就结束了。From 空间和 To 空间大小必须一致。这是为了保证能把 From 空间中的所有活动对象
都收纳到 To 空间里
不适用于存活对象较多的场合,如老年代(复制算法适合做新生代的GC)
幸存区from和幸存区to中谁空谁是to,我们会将to中的数据复制到from中保持to中数据为空;
from和to区实际上为逻辑上的概念,保证to区一直空;
默认对象经过15次GC后还没有被销毁就会进入养老区
将Eden区进行GC存活对象放入空的to区,将from区存活的放到空的to区
此时from区为空变成了to区,to区有数据变为from区
经过15次GCfrom区还存活的对象会被移动到养老区
好处:没有内存碎片
坏处:浪费内存空间,多了一半to空间永远是空的。
复制算法最佳使用场景:对象存活度较低的时候 -> 新生区 (如果存活度较高,则from区空间全部被占满导致会将全部内容复制到to区)
标记-清除算法将垃圾回收分为两个阶段:标记阶段和清除阶段。一种可行的实现是,在标记阶段,首先通过根节点,标记所有从根节点开始的可达对象。因此,未被标记的对象就是未被引用的垃圾对象;然后,在清除阶段,清除所有未被标记的对象。
它的做法是当堆中的有效内存空间(available memory)被耗尽的时候,就会停止整个程序(也被成为stop the world),然后进行两项工作,第一项则是标记,第二项则是清除。
需要两次扫描,第一次扫描标记存活对象,第二次扫描清除没有被标记的对象
优点:不需要额外的空间
缺点:两次扫描严重浪费时间,并且还会产生内存碎片,(内存碎片会导致明明有空间,但是无法存储大对象)
标记整理算法适合用于存活对象较多的场合,如老年代。它在标记-清除算法的基础上做了一些优化。和标记-清除算法一样,标记-压缩算法也首先需要从根节点开始,对所有可达对象做一次标记;但之后,它并不简单的清理未标记的对象,而是将所有的存活对象压缩到内存的一端;之后,清理边界外所有的空间。
堆空间被分成了新⽣代(1/3)和⽼年代(2/3),新⽣代中被分成了eden(8/10)、
survivor1(1/10)、survivor2(1/10)
对象的创建在eden,如果放不下则触发minor gc
对象经过⼀次minorgc 后存活的对象会被放⼊到survivor区,并且年龄+1
survivor区执⾏的复制算法,当对象年龄到达15.进⼊到⽼年代。
如果⽼年代放满。就会触发Full GC
当前商业虚拟机的GC都是采用的“分代收集算法”,这并不是什么新的思想,只是根据对象的存活周期的不同将内存划分为几块儿。一般是把Java堆分为新生代和老年代:短命对象归为新生代,长命对象归为老年代。
少量对象存活,适合复制算法:在新生代中,每次GC时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成GC。
大量对象存活,适合用标记-清理/标记-整理:在老年代中,因为对象存活率高、没有额外空间对他进行分配担保,就必须使用“标记-清理”/“标记-整理”算法进行GC。
注:老年代的对象中,有一小部分是因为在新生代回收时,老年代做担保,进来的对象;绝大部分对象是因为很多次GC都没有被回收掉而进入老年代。
Object类中有⼀个finalize⽅法,也就是说任何⼀个对象都有finalize⽅法。这个⽅法是对象被回收之前的最后⼀根救命稻草。
在jdk1.7之前,对象的创建都是在堆空间中创建,但是会有个问题,⽅法中的未被外部访问的对象
public void test1() {
User user = new User();
user.setId(1);
user.setName("xiaoming");
}
public User test2() {
User user = new User();
user.setId(1);
user.setName("xiaoming");
return user;
}
这种对象没有被外部访问,且在堆空间上频繁创建,当⽅法结束,需要被gc,浪费了性能。所以在1.7之后,就会进⾏⼀次逃逸分析(默认开启),于是这样的对象就直接在栈上创建,随着⽅法的出栈⽽被销毁,不需要进⾏gc。
在栈上分配内存的时候:会把聚合量替换成标量,来减少栈空间的开销,也为了防⽌栈上没有⾜够连续的空间直接存放对象。
标量就是不可分割的量,java中基本数据类型是标量。相对的一个数据可以继续分解,它就是聚合量(aggregate)。
如果把一个对象拆散,将其成员变量恢复到基本类型来访问就叫做标量替换。
如果逃逸分析证明一个对象不会被外部访问,并且这个对象可以被拆散的话,那么程序真正执行的时候将可能不创建这个对象,而改为直接在>栈上创建若干个成员变量