取百家之长，仅用作个人的学习之用，侵删。

jvm内存 jmm内存模型类的加载 GC

jvm总览

java内存模型

JMM（java内存模型）

匿名对象只使用一次，使用完将进行GC

instance = new Singleton();

这条语句实际上包含了三个操作：1.分配对象的内存空间；2.初始化对象；3.设置instance指向刚分配的内存地址。但由于存在重排序的问题，可能有以下的执行顺序：

重排序不会影响单线程环境的执行结果，但是会破坏多线程的执行语义。

原子性是指一个操作是不可中断的，要么全部执行成功要么全部执行失败，有着“同生共死”的感觉。及时在多个线程一起执行的时候，一个操作一旦开始，就不会被其他线程所干扰。

可见性是指当一个线程修改了共享变量的值，其他线程能够立即得知这个修改。volatile变量可以做到这一点。

有序性是指如果在本线程内观察，所有的操作都是有序的；如果在一个线程观察另一个线程，所有的操作都是无序的。volatile强制主内存读写同步，包含禁止指令重排序的语义，其具有有序性。

注意：共享数据的访问权限必须定义为private

编译

源代码文件*.java -> 词法分析器 -> tokens流 -> 语法分析器 -> 语法树/抽象语法树 -> 语义分析器 -> 注解抽象语法树 -> 字节码生成器 ->JVM字节码文件*.class

类（方法区：class被加载到的内存区域）

类的加载

加载：通过完全限定名---字节码文件---class对象

验证：确保不会危害虚拟机安全

准备：为static修饰的变量分配内存，初始值0，null。具体值在初始化阶段设置。而final修饰的变量在编译时分配内存。

解析：常量池中的符号引用替换为直接引用----直接指向目标的指针或相对偏移量。

初始化：静态块的执行和静态变量的赋值。触发条件：1、实例化 2、访问静态方法、变量 3、Class.forName() 4、子类被初始化（如果父类没有被初始化，先初始化父类）

类的初始化

java的类的加载器

把类委托给父类加载器去执行，如果父类加载器可以加载，就继续向上委托，如果不能加载则自己加载，这样可以避免核心API被恶意篡改。

类加载引出的执行顺序问题

静态代码块、构造代码块、构造方法之间的执行顺序

ps:没有 static 关键字修饰的（如：实例变量[非静态变量]、非静态代码块）初始化实际上是会被提取到类的构造器中被执行的，但是会比类构造器中的代码块优先执行到，其也是按顺序从上到下依次被执行。也就是{这是构造代码块}会比public B(){这是构造方法}先执行。

jvm内存分析

方法区（Method Area）

方法区存放了要加载的类的信息（如类名、修饰符等）、静态变量、构造函数、final定义的常量、类中的字段和方法等信息。方法区是全局共享的，在一定条件下也会被GC。当方法区超过它允许的大小时，就会抛出OutOfMemory：PermGen Space异常。

在Hotspot虚拟机中，这块区域对应持久代（Permanent Generation），一般来说，方法区上执行GC的情况很少，因此方法区被称为持久代的原因之一，但这并不代表方法区上完全没有GC，其上的GC主要针对常量池的回收和已加载类的卸载。在方法区上进行GC，条件相当苛刻而且困难。

运行时常量池（Runtime Constant Pool）是方法区的一部分，用于存储编译器生成的常量和引用。一般来说，常量的分配在编译时就能确定，但也不全是，也可以存储在运行时期产生的常量。比如String类的intern（）方法，作用是String类维护了一个常量池，如果调用的字符”hello”已经在常量池中，则直接返回常量池中的地址，否则新建一个常量加入池中，并返回地址。

堆区（Heap）

堆区是GC最频繁的，也是理解GC机制最重要的区域。堆区由所有线程共享，在虚拟机启动时创建。堆区主要用于存放对象实例及数组，所有new出来的对象都存储在该区域。

栈（虚拟机栈）（VM Stack）后进先出

(线程操作，存放方法参数)

栈帧

执行的时候，每个线程都有一个Java栈，当前执行的栈称为当前栈。一个Java栈调用多个方法，则会push很多个栈帧，当前活动的栈帧称为当前栈帧。当前栈帧执行完毕之后，会把执行结果（如果有）压入到调用它的那个栈帧的操作数栈中，作为上一个栈帧的一个中间处理结果被调用，然后就会被pop出去。当所有调用的方法执行结束后，栈帧也就都pop掉没有了。

例如：执行代码

虚拟机栈占用的是操作系统内存，每个线程对应一个虚拟机栈，它是线程私有的，生命周期和线程一样，每个方法被执行时产生一个栈帧（Statck Frame），栈帧用于存储局部变量表、动态链接、操作数和方法出口等信息，当方法被调用时，栈帧入栈，当方法调用结束时，栈帧出栈。

局部变量表中存储着方法相关的局部变量，包括各种基本数据类型及对象的引用地址等，因此他有个特点：内存空间可以在编译期间就确定，运行时不再改变。

虚拟机栈定义了两种异常类型：StackOverFlowError(栈溢出SOF)和OutOfMemoryError（内存溢出）。如果线程调用的栈深度大于虚拟机允许的最大深度，则抛出StackOverFlowError；不过大多数虚拟机都允许动态扩展虚拟机栈的大小，所以线程可以一直申请栈，直到内存不足时，抛出OutOfMemoryError。

本地方法栈（Native Method Stack）

native是一个计算机函数，一个Native Method就是一个Java调用非Java代码的接口。方法的实现由非Java语言实现，比如C或C++。

native关键字说明其修饰的方法是一个原生态方法，方法对应的实现不是在当前文件，而是在用其他语言（如C和C++）实现的文件中。Java语言本身不能对操作系统底层进行访问和操作，但是可以通过JNI接口调用其他语言来实现对底层的访问。

JNI是Java本机接口（Java Native Interface），是一个本机编程接口，它是Java软件开发工具箱（Java Software Development Kit，SDK）的一部分。JNI允许Java代码使用以其他语言编写的代码和代码库。Invocation API（JNI的一部分）可以用来将Java虚拟机（JVM）嵌入到本机应用程序中，从而允许程序员从本机代码内部调用Java代码。

本地方法栈用于支持native方法的执行，存储了每个native方法的执行状态。本地方法栈和虚拟机栈他们的运行机制一致，唯一的区别是，虚拟机栈执行Java方法，本地方法栈执行native方法。在很多虚拟机中（如Sun的JDK默认的HotSpot虚拟机），会将虚拟机栈和本地方法栈一起使用。

程序计数器（Program Counter Register）

程序计数器是一个很小的内存区域，不在RAM上，而是直接划分在CPU上，程序猿无法操作它，它的作用是：JVM在解释字节码（.class）文件时，存储当前线程执行的字节码行号，只是一种概念模型，各种JVM所采用的方式不一样。字节码解释器工作时，就是通过改变程序计数器的值来取下一条要执行的指令，分支、循环、跳转等基础功能都是依赖此技术区完成的。

每个程序计数器只能记录一个线程的行号，因此它是线程私有的。

如果程序当前正在执行的是一个java方法，则程序计数器记录的是正在执行的虚拟机字节码指令地址，如果执行的是native方法，则计数器的值为空，此内存区是唯一不会抛出OutOfMemoryError的区域(OOM异常)。

GC(Garbage Collection)

一、哪些需要GC

a.该类的所有实例都已经被回收；

b.加载该类的ClassLoad已经被回收；

c.该类对应的反射类java.lang.Class对象没有被任何地方引用。

在上面介绍的五个内存区域中，有3个是不需要进行垃圾回收的：

本地方法栈、程序计数器、虚拟机栈。

因为他们的生命周期是和线程同步的，随着线程的销毁，他们占用的内存会自动释放。

所以，只有方法区和堆区需要进行垃圾回收，回收的对象就是那些不存在任何引用的对象。

可达性检测（哪些需要清理）

经典的引用计数算法，

每个对象添加到引用计数器，每被引用一次，计数器+1，失去引用，计数器-1，当计数器在一段时间内为0时，即认为该对象可以被回收了。但是这个算法有个明显的缺陷：当两个对象相互引用，但是二者都已经没有作用时，理应把它们都回收，但是由于它们相互引用，不符合垃圾回收的条件（循环引用），所以就导致无法处理掉这一块内存区域。

因此，Sun的JVM并没有采用这种算法，而是采用一个叫——根搜索算法，

根搜索算法

基本思想是：从一个叫GC Roots的根节点出发，向下搜索，如果一个对象不能达到GC Roots的时候，说明该对象不再被引用，可以被回收。如上图中的Object5、Object6、Object7，虽然它们三个依然相互引用，但是它们其实已经没有作用了，这样就解决了引用计数算法的缺陷。

GC Roots主要指：

a.虚拟机栈(栈桢中的本地变量表)中的引用的对象

b.方法区中的类静态属性引用的对象

c.方法区中的常量引用的对象

d.本地方法栈中JNI的引用的对象

补充概念，在JDK1.2之后引入了四个概念：强引用、软引用、弱引用、虚引用。

强引用：new出来的对象都是强引用，GC无论如何都不会回收，即使抛出OOM异常。

软引用：只有当JVM内存不足时才会被回收。

弱引用：只要GC,就会立马回收，不管内存是否充足。

虚引用：可以忽略不计，JVM完全不会在乎虚引用，你可以理解为它是来凑数的，凑够”四大天王”。它唯一的作用就是做一些跟踪记录，辅助finalize函数的使用。

二、如何GC

内存主要被分为三块：新生代（Youn Generation）、旧生代（Old Generation）、持久代（Permanent Generation）。三代的特点不同，造就了他们使用的GC算法不同，新生代适合生命周期较短，快速创建和销毁的对象，旧生代适合生命周期较长的对象，持久代在Sun Hotpot虚拟机中就是指方法区（有些JVM根本就没有持久代这一说法）。

堆内存

新生代（Youn Generation）：大致分为Eden区和Survivor区，Survivor区又分为大小相同的两部分：FromSpace和ToSpace。新建的对象都是从新生代分配内存，Eden区不足的时候，会把存活的对象转移到Survivor区。当新生代进行垃圾回收时会出发Minor GC（也称作Youn GC）。

新生代 ( Young ) 与老年代 ( Old ) 的比例的值为 1:2 ( 该值可以通过参数 –XX:NewRatio 来指定 )

默认的，Eden : from : to = 8 : 1 : 1 ( 可以通过参数 –XX:SurvivorRatio 来设定 )，即： Eden = 8/10 的新生代空间大小，from = to = 1/10 的新生代空间大小。

旧生代（Old Generation）：旧生代用于存放新生代多次回收依然存活的对象，如缓存对象。当旧生代满了的时候就需要对旧生代进行回收，旧生代的垃圾回收称作Major GC（也称作Full GC）。

持久代（Permanent Generation）：在Sun 的JVM中就是方法区的意思，尽管大多数JVM没有这一代。

GC算法

常见的GC算法：复制、标记-清除和标记-压缩

一、复制：

复制算法采用的方式为从根集合进行扫描，将存活的对象移动到一块空闲的区域，如图所示：

复制算法

当存活的对象较少时，复制算法会比较高效（新生代的Eden区就是采用这种算法），其带来的成本是需要一块额外的空闲空间和对象的移动。（缺点:内存使用率较低）

目前大部分垃圾收集器对于新生代都采取Copying算法，因为新生代中每次垃圾回收都要回收大部分对象，也就是说需要复制的操作次数较少，但是实际中并不是按照1：1的比例来划分新生代的空间的，一般来说是将新生代划分为一块较大的Eden空间和两块较小的Survivor空间，每次使用Eden空间和其中的一块Survivor空间，当进行回收时，将Eden和Survivor中还存活的对象复制到另一块Survivor空间中，然后清理掉Eden和刚才使用过的Survivor空间。

　对象的内存分配，往大方向上讲就是在堆上分配，对象主要分配在新生代的Eden Space和From Space，少数情况下会直接分配在老年代。如果新生代的Eden Space和From Space的空间不足，则会发起一次GC，如果进行了GC之后，Eden Space和From Space能够容纳该对象就放在Eden Space和From Space。在GC的过程中，会将Eden Space和From Space中的存活对象移动到To Space，然后将Eden Space和From Space进行清理。如果在清理的过程中，To Space无法足够来存储某个对象，就会将该对象移动到老年代中。在进行了GC之后，使用的便是Eden space和To Space了，下次GC时会将存活对象复制到From Space，如此反复循环。当对象在Survivor区躲过一次GC的话，其对象年龄便会加1，默认情况下，如果对象年龄达到15岁，就会移动到老年代中。

　　一般来说，大对象会被直接分配到老年代，所谓的大对象是指需要大量连续存储空间的对象，最常见的一种大对象就是大数组，比如：

　　byte[] data = new byte[4*1024*1024]

　　这种一般会直接在老年代分配存储空间。

上一点讲到MaxTenuringThreshold参数，但虚拟机并不是永远地要求对象的年龄必须达到MaxTenuringThreshold才能晋升老年代，如果Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象就可以直接进入老年代，无须等到MaxTenuringThreshold中要求的年龄。

PS：如果晋升到老年代，但是老年代空间不足，则会出发Full-GC

二、标记-清除：

该算法采用的方式是从跟集合开始扫描，对存活的对象进行标记，标记完毕后，再扫描整个空间中未被标记的对象，并进行清除。标记和清除的过程如下：

标记-清除

上图中蓝色部分是有被引用的对象，褐色部分是没有被引用的对象。在Marking阶段，需要进行全盘扫描，这个过程是比较耗时的。

标记-清除

清除阶段清理的是没有被引用的对象，存活的对象被保留。

标记-清除动作不需要移动对象，且仅对不存活的对象进行清理，在空间中存活对象较多的时候，效率较高，但由于只是清除，没有重新整理，因此会造成内存碎片。

CMS (java1.7以前主流)

优点：并发、低停顿

缺点：CPU敏感、浮动垃圾、标记-清除原地回收碎片多

G1(Garbage First) java1.9之后的默认垃圾回收算法

优点：

G1是一个有整理内存过程的垃圾收集器，不会产生很多内存碎片。

G1的Stop The World(STW)更可控，G1在停顿时间上添加了预测机制，用户可以指定期望停顿时间。

1、逻辑分代，非物理分代。

2、复制/清除（STW）优先对可回收较大的区域进行回收。每次只清理一部分的，增量式清理。由此来保证每次GC的STW(stop the world)不会停顿过长。

3、可通过设置JVM的region(块大小)1-32M、设置最大的期望GC停顿时间。。。

ZGC(java11过后，64位系统，支持4TB的堆)

ZGC

ZGC

二、标记-整理（压缩）：

该算法与标记-清除算法类似，都是先对存活的对象进行标记，但是在清除后会把活的对象向左端空闲空间移动，然后再更新其引用对象的指针，如下图所示

标记-整理

由于进行了移动规整动作，该算法避免了标记-清除的碎片问题，但由于需要进行移动，因此成本也增加了。（该算法适用于旧生代）

知识点汇总（三）JVM虚拟机与GC