JVM学习笔记(1)

JVM虚拟机

JVM内存区域

JVM包含两个子系统和两个组件,两个子系统为ClassLoader(类装载器)、Execution engine(执行引擎);两个组件为Runtime data area(运行时数据区)、Native Interface(接口)。

  • ClassLoader(类装载器):根据给定的全限定类名(如:java.lang.Object)来装载Class文件到Runtime data area(运行时数据区)中的method area(方法区)。
  • Execution engine(执行引擎):执行Classes中的指令。
  • Native Interface(本地接口):与native libraries交互,是其他JVM的内存。
    JVM学习笔记(1)_第1张图片

作用:首先通过编译器把Java代码转换成字节码,类加载器再把字节码加载到内存中,将其放在运行时数据区的方法区内,而字节码文件只是JVM的一套指令集规范,并不能直接交给底层操作系统去执行,因此需要特定的命令解析器执行引擎,将字节码翻译成底层系统指令,再交由CPU去执行,而这个过程中需要调用其他语言的本地库接口来实现整个程序的功能。
Java程序的运行机制:首先利用IDE集成开发工具编写Java源代码,源代码文件的后缀为.java,再利用编译器javac命令将源代码编译成字节码文件,字节码文件的后缀为.class;运行字节码的工作是由解释器Java命令来完成的。类加载器又将这些.class文件加载到JVM中。
JVM学习笔记(1)_第2张图片

Java虚拟机在执行Java程序的过程中会把它所管理的内存区域划分为若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而一直存在,有些区域则是依赖用户线程的启动和结束而建立和销毁。根据《Java虚拟机规范》的规定,Java虚拟机所管理的内存分为以下几个运行时数据区域:

  • 程序计数器:它是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。字节码解释器工作时就是通过改变这个计数器的值来选取下一个需要执行的字节码指令,它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
  • java虚拟机栈:它描述的是Java方法执行的线程内存模型:每个方法被执行的时候,Java虚拟机都会同步创建一个栈帧用于存储局部变量表、操作数栈、动态连接、方法出口等信息。
  • 本地方法栈:本地方法栈与虚拟机栈所发挥的作用非常相似,其区别只是虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则是为虚拟机使用到的本地(Native)方法服务。
  • Java堆:Java堆是虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,Java世界里几乎所有对象实例都在这里分配内存。
  • 方法区:它用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。
    JVM学习笔记(1)_第3张图片

内存溢出(OutOfMemoryError)异常:除了程序计数器外,虚拟机内存的其他几个运行时区域都有发生OutOfMemoryError(称OOM)异常的可能。分为:Java堆溢出、虚拟机栈和本地方法栈溢出、方法区和运行时常量池溢出、本机直接内存溢出。

垃圾收集器

简述Java垃圾回收机制
在Java中,程序员不需要显示的去释放一个对象的内存的,而是由虚拟机自行执行。在JVM中,有一个垃圾回收线程,它是低优先级的,在正常情况下是不会执行的,只有在虚拟机空闲或者当前堆内存不足
时才会触发执行,扫描那些没有被任何引用的对象,并将它们添加到要回收的集合中,进行回收。

GC是什么?为什么要GC
GC是垃圾收集(Garbage Collection),内存处理是编程人员容易出现问题的地方,忘记或错误的内存回收会导致程序或系统的不稳定甚至崩溃,Java提供的GC功能可以自动监测对象是否超过作用域从而达到自动回收内存的目的,Java语言没有提供释放已分配内存的显示操作方法。

垃圾回收的优点和原理
Java语言最显著的特点就是引入了垃圾回收机制,它使Java程序员在编写程序时不再考虑内存管理的问题。由于有了这个垃圾回收机制,Java中的对象不再有“作用域”的概念,只有引用的对象才有作用域。垃圾回收机制有效的防止了内存泄漏,可以有效的使用可使用的内存。垃圾回收器通常作为一个单独的低级别的线程运行,在不可预知的情况下对内存堆中已经死亡的或很长时间没有用过的对象进行清楚和回收。程序员不能实时的对某个对象或所有对象调用垃圾回收器进行垃圾回收。

对于GC来说,当程序员创建对象时,GC就开始监控这个对象的地址、大小以及使用情况。
通常,GC采用有向图的方式记录和管理堆的所有对象。通过这种方式确定哪些对象是“可达的”,哪些是“不可达的”。当GC确定一些对象不可达时,GC有责任回收这些内存空间。
程序员可以手动执行System.gc(),通知GC运行,但是Java语言规范并不保证GC一定会执行。

判断对象是否可以被回收
垃圾收集器在做垃圾回收的时候,首先需要判断的就是哪些内存是需要被回收的,就是哪些对象是“死”的,那些已经“死”掉的对象就需要被回收。
一般有两种方法来判断:

  • 引用计数算法:在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的。
  • 可达性分析算法:通过一系列称为”GC Roots“的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为”引用链“,如果某个对象到GC Roots 间没有任何引用链相连,或者 用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的。

无论是通过引用计数算法判断对象的引用数量,还是通过可达性分析算法判断对象是否引用链可达,判断对象是否存活都和”引用“离不开关系。Java对引用的概念进行了扩充,分为了四种。
Java中有哪四种引用类型

  • 强引用:发生GC的时候不会被回收
  • 软引用:有用但不是必须的对象,在发生内存溢出之前会被回收。
  • 弱引用:有用但不是必须的对象,在下一次GC时会被收回。
  • 虚引用:无法通过虚引用获得对象,用PhantomReference实现虚引用,虚引用的用途是在GC时返回一个通知。
    垃圾收集算法
  • 标记-清除算法:算法分为”标记“和”清除“两个阶段;首先标记出所有需要回收的对象,在标记完成后,统一回收掉所有被标记的对象,也可以反过来,标记存活的对象,统一回收所有未被标记的对象。标记过程就是对象是否属于垃圾的判定过程。
    它的主要缺点有两个:1、执行效率不稳定 2、内存空间的碎片化问题
    优点:实现简单,不需要对象进行移动
    JVM学习笔记(1)_第4张图片
  • 标记-复制算法:简称为复制算法。为了解决标记-清除算法面对大量可回收对象时执行效率低的问题。它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
    优点:按顺序分配内存即可,实现简单、运行高效,不用考虑内存碎片。
    缺点:可用内存缩小为原来的一半,对象存活率高时会大量的内存间复制的开销,空间浪费太多。
    JVM学习笔记(1)_第5张图片
  • 标记-整理算法:在新生代中可以使用复制算法,但是在老年代就不能选择复制算法了,因为老年代的对象存活率会较高,这样会有较多的复制操作,导致效率变低。标记清除算法可以应用在老年代中,但是它效率不高,在内存回收后容易产生大量内存碎片。因此针对这个情况,出现了标记整理算法,其标记过程仍然与标记清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向内存空间一端移动,然后直接清理掉边界以外的内存。
    优点:解决了标记-清理算法存在的内存碎片问题。
    缺点:仍需要进行局部对象的移动,一定程度上降低了效率。
    JVM学习笔记(1)_第6张图片

经典垃圾收集器
如果说垃圾收集算法是内存回收的方法论,那垃圾收集器就是内存回收的实践者。各款经典收集器之间的关系如图:
JVM学习笔记(1)_第7张图片

  • Serial收集器(复制算法):新生代单线程收集器,标记和清理都是单线程,优点是简单高效;
  • ParNew收集器(复制算法):新生代并行收集器,实际上是Serial收集器的多线程版本,在多核CPU环境下有着比Serial更好的表现。
  • Parallel Scavenge收集器(复制算法):新生代并行收集器,追求高吞吐量,高效利用CPU。吞吐量=运行用户代码时间/(运行用户代码时间+运行垃圾收集时间),高吞吐量可以高效率的利用CPU时间,尽快完成程序的运算任务,适合后台应用等交互相应要求不高的场景。
  • Serial Old收集器(标记-整理算法):老年代单线程收集器,Serial收集器的老年代版本。
  • Parallel Old收集器(标记-整理算法):老年代并行收集器,吞吐量优先,Parallel Scavenge收集器的老年代版本。
  • CMS(Concurrent Mark Sweep)收集器(标记-清除算法):老年代并行收集器,以获取最短回收停顿时间为目标的收集器,具有高并发、低停顿的特点,追求最短GC回收停顿时间。
  • G1(Garbage First)收集器(标记-整理算法):Java堆并行收集器,G1收集器是JDK1.7提供的一个新收集器,G1收集器基于“标记-整理”算法实现,也就是说不会产生内存碎片。此外,G1收集器不同于之前的收集器的一个重要特点是:G1回收范围是整个Java堆,而前六种收集器回收的范围仅限于新生代或老年代。
    详细介绍CMS垃圾回收器
    CMS(Concurrent Mark Sweep)是一种以获取最短回收停顿时间为目标的收集器。对于要求服务器响应速度的应用上,希望系统停顿时间尽可能短,以给用户带来良好交互体验。CMS收集器就非常符合这类应用。
    CMS是基于标记-清除算法实现的,它的运作过程相对于前面几种收集器来说要更复杂一些,整个过程分为四个步骤,包括:1、初始标记 2、并发标记 3、重新标记 4、并发清除。
    CMS收集器有以下三个明显的缺点:首先,CMS收集器对处理器资源非常敏感。然后,由于CMS收集器无法处理“浮动垃圾”,有可能出现“Concurrent Mode Failure”失败进而导致另一次完全“Stop The World”的Full GC的产生。最后,CMS是基于“标记-清除”算法实现的收集器,意味着在收集结束时可能会有大量空间碎片产生,空间碎片过多时,将会给大对象分配带来很大麻烦,往往会出现老年代还有很多剩余空间,但就是无法找到足够大的连续空间来分配当前对象,而不得不提前触发一次Full GC的情况。
    新生代垃圾回收器和老年代垃圾回收器都有哪些?有什么区别?
  • 新生代回收器:Serial、ParNew、Parallel Scavenge
  • 老年代回收器:Serial Old、Parallel Old、CMS
  • 整堆回收器:G1
    新生代垃圾回收器一般采用的是复制算法,复制算法的优点是效率高,缺点是内存利用率低;老年代回收器一般采用的是标记-整理的算法进行垃圾回收。

内存分配策略与回收策

Java技术体系的自动内存管理,最根本的目标是自动化地解决两个问题:自动给对象分配内存以及自动回收分配给对象的内存。
对象的内存分配,从概念上讲应该都是在堆上分配。在经典分代的设计下,新生对象通常会分配在新生代中,少数情况下(例如对象大小超过一定阈值)也可能会直接分配在老年代。总的来说分配规则不是百分百固定的,其细节取决于哪一种垃圾收集器组合以及虚拟机相关参数有关。
对象优先在Eden分配
大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC。

  • Minor GC是指发生在新生代的GC,因为Java对象大多都是朝生夕死,所有Minor GC非常频繁,一般回收速度也非常快;
  • Major GC/Full GC是指发生在老年代的GC,出现了Major GC通常会伴随至少一次Minor GC。Major GC的速度通常会比Minor GC慢十倍以上。

大对象直接进入老年代
大对象就是指需要大量连续内存空间的Java对象,最典型的大对象便是那种很长的字符串,或者元素数量很庞大的数组。频繁出现大对象是致命的,会导致在内存还有不少空间的情况下提前触发GC以获取足够的连续空间来安置新对象。
新生代是使用标记-清除算法来处理垃圾回收的,如果大对象直接在新生代分配就导致Eden区和两个Survivor区之间发生大量的内存复制。因此HotSpot虚拟机提供了-XX:PretenureSizeThreshold参数,指定大于该设置值的对象直接在老年代分配。

长期存活对象将进入老年代
HopSpot虚拟机中多数收集器都采用了分代收集来管理堆内存,那么内存回收时就必须判断哪些对象应该放在新生代,哪些对象应该放在老年代。因此虚拟机给每个对象定义了一个对象年龄的计数器,如果对象在Eden区出生,并且能够被Survivor容纳,将被移动到Survivor空间中,这时设置对象年龄为1,对象在Survivor区中每熬过一次Minor GC年龄就加1,当年龄达到一定程度(默认15)就会被晋升到老年代。

虚拟机类加载机制

Java类加载机制
虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验,解析和初始化,最终形成可以被虚拟机直接使用的Java类型。
描述一下JVM加载Class文件的原理机制
Java中的所有类,都需要由类加载器装载到JVM中才能运行。类加载器本身也是一个类,而它的工作就是把class文件从硬盘读取到内存中。在写程序的时候,我们几乎不需要关心类的加载,因为这些都是隐式装载的,除非我们有特殊的用法,像是反射,就需要显式的加载所需要的类。
类装载方式,有两种:
1、隐式装载,程序运行过程中当碰到通过new等方式生成对象时,隐式调用类加载器加载对应的类到jvm中。
2、显式装载,通过class.forname()等方法,显式加载需要的类。
Java类的加载是动态的,它并不会一次性将所有类全部加载后再运行,而是保证程序运行的基础类完全加载到jvm中,至于其他类,则在需要的时候才加载。这当然就是为了节省内存开销。
什么是类加载器,类加载器有哪些
实现通过类的权限定名获取该类的二进制字节流的代码块叫做类加载器。
主要有以下四种类加载器:
1、启动类加载器(Bootstrap ClassLoader)用来加载Java核心类库,无法被Java程序直接引用。
2、扩展类加载器(extensions class loader):它是用来加载Java的扩展库。Java虚拟机的实现会提供一个扩展库目录。该类加载器在此目录里面查找并加载Java类。
3、系统类加载器(system class loader):它根据Java应用的类路径(CLASSPATH)来加载Java类。一般来说,Java应用的类都是由它来完成加载的。可以通过ClassLoader.getSystemClassLoader()来获取它。
4、用户自定义类加载器,通过继承java.lang.ClassLoader类的方式实现。
类加载的执行过程
类装载分为以下5个步骤:

  • 加载:根据查找路径找到相应的class文件然后导入;
  • 验证:检查加载的class文件的正确性;
  • 准备:给类中的静态变量分配内存空间;
  • 解析:虚拟机将常量池中的符号引用替换成直接引用的过程。符号引用就理解为一个标示,而在直接引用直接指向内存中的地址。
  • 初始化:对静态变量和静态代码块执行初始化工作。

什么是双亲委派模型
在介绍双亲委派模型之前先说下类加载器。对于任意一个类,都需要由加载它的类加载器和这个类本身一同确立在JVM中的唯一性,每一个类加载器,都有一个独立的类名称空间。类加载器就是根据指定全限定名称将Class文件加载到JVM内存,然后再转化为Class对象。
JVM学习笔记(1)_第8张图片

类加载器分类:

  • 启动类加载器(Bootstrap ClassLoader),是虚拟机自身的一部分,用来加载Java_HOME/lib/目录中的,或者被-Xbootclasspath参数所指定的路径中并且被虚拟机识别的类库。
  • 扩展类加载器(extensions class loader):负责加载\lib\ext目录或Java.ext.dirs系统变量指定的路径中的所有类库。
  • 应用程序类加载器(Application ClassLoader):负责加载用户类路径上的指定类库,我们可以直接使用这个类加载器。一般情况,如果我们没有自定义类加载器默认就是用这个加载器。

双亲委派模型:如果一个类加载器收到了类加载的请求,它首先不会自己去加载这个类,而是把这个请求委派给父类加载器去完成,每一层的类加载器都如此,这样所有的加载请求都会被传送到顶层的启动类加载器中,只有当父加载无法完成加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试去加载类。
当一个类收到了类加载请求时,不会自己先去加载这个类,而是将其委派给父类,由父类去加载,如果此时父类不能加载,反馈给子类,由子类去完成类的加载。

你可能感兴趣的:(java,jvm)