JVM知识点(二)

1、G1垃圾收集器

  • -XX:MaxGCPauseMillis=10,G1的参数,表示在任意1s时间内,停顿时间不能超过10ms;
  • G1将堆切分成很多小堆区(Region),每一个Region可以是Eden、Survivor或Old区;这些区在内存上不是连续存放的;
  • 每一块Region大小都是相同的,大小为1-32M,若Region对象存储不下,大小超过Region50%的对象,将会存放到Humongous Region;
  • -XX:G1HeapRegionSize,可以调整Region大小;
  • -XX:G1HeapWastePercent:可以调整GC回收的阈值,默认为5%;只有达到这个阈值,GC才会回收对象,避免GC花费大量时间,回收内存却比较少;

JVM知识点(二)_第1张图片

垃圾回收过程:

  • G1“年轻代对象回收”,即Minor GC,发生时机为Eden满;
  • 老年代垃圾收集,他是一个并发标记过程,会顺便清理一点对象;
  • 混合清理,会同时清除年轻代和老年代对象;

RSet:

  • RSet记录的其他Region对象应用本Region对象的关系,是一个hash结构,key为引用的Region的地址,value为应用本Region的对象卡页集合;
  • 有了该结构,回收对象时,不必堆整个堆内存对象进行扫描;
  • RSet占用空间较大,通常为5%;

JVM知识点(二)_第2张图片

2、高并发下估算和调优

(1)GC考量指标

  • 系统容量:机器上的资源容量,资源容量限制比较严格的系统,对他的优化会越明显;
  • 吞吐量:在一个时间段内完成多少事务操作;
  • 延迟:等待时间;如查询一条sql,返回数据所等待时间;

JVM知识点(二)_第3张图片

(2)选择垃圾收集器

  • 堆大小空间不是很大(如100MB),使用串行收集器效果最好,XX:+UseSerialGC;
  • 如果机器为单核CPU,选择串行收集器较好;
  • 如果应用为“吞吐优先”,并且堆停顿时间没有要求,使用并行收集器合适,XX:+UseParallelGC;
  • 如果应用对响应时间要求较高,使用G1,CMS,ZGC较为合适,-XX:+UseConcMarkSweepGC、-XX:+UseG1GC、-XX:+UseZGC ,但会额外使用资源处理;

(3)大流量应用特点

  • 对延迟非常敏感的应用,通常可以通过机器集群来解决;
  • 考量系统指标有:
    • TPS:每秒处理的事务数量;
    • AVG:平均响应时间;
    • TP:表示机器有多少请求响应时间小于x毫秒;如TP80,代表有80%的请求响应时间小于x毫秒;

(4)估算

假设高峰请求6w/s,共有10台机器,每个请求大小20k,则每台机器JVM的流量为120MB/s

JVM知识点(二)_第4张图片

(5)调优

  • 假设给JVM分配了5460MB空间,则年轻代占用空间为5460/3=1820MB,Eden区大小大约为1820/10*8=1456MB,按照上面估算的120MB/s的流量,大约12s需要发生一次Minor GC;
  • 每隔半小时,会发送一次Major GC,Survivor区大小为182MB,若幸存下来的对象大于Survivor区内存大小,则会将对象直接分配到Old区,这样导致垃圾存储时间更长,只有Old区满了才能清除;
  • 大部分对象存活时间短,在Eden区发生GC后,会回收大量对象,我们可以分配一半的空间给Eden区,通过配置-XX:+UseConcMarkSweepGC -Xmx5460M -Xms5460M -Xmn2730M,Eden区发生GC时间为2730/10*8/120=18s;
  • 调大年轻代,顺便调大幸村去,这样对象在年轻代存活时间越大;
  • 元空间在扩容时,会发生Full GC,默认大小为20MB,可以通过参数- -XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M将其调大,减少发生Full GC;

3、OOM问题排查

(1)分析那个线程影响CPU

  1. 使用top命令查询占用CPU最多的线程,记录其pid,shitf+p可以按照CPU使用率进行排序;
  2. 使用 top -H -p 查看进程中哪个线程占用CPU最高,记录线程id;
  3. 将十进制是tid转换为16进制,printf %x
  4. 将线程栈信息输入到文件,jstack > ;
  5. 查看日志信息 less

(2)内存泄漏

  • 内存溢出是结果,内存泄漏是一个原因;
  • 不再被使用的对象,没有被切断和GC root链接,会导致内存泄漏;
  • 使用hashmap缓存数据时,没有使用LRU等策略,导致hashmap数据量越来越多,最终导致内存泄漏;
  • 操作文件读写时,没有将close放入finally中,最终导致文件描述符越来越多,导致内存泄漏;

4、JMM

(1)JMM结构

  • 主存储器:所有实例对象存储的位置,实例所拥有的字段也存储在里面,是所有线程共享的;
  • 工作存储器:每个线程都有自己的工作存储器,工作存储器存储主存储器所必要的数据拷贝;
  • 线程无法直接对主存储器进行操作,只能通过主存进行通信;

JVM知识点(二)_第5张图片

(2)操作类型

  • read:作用于主内存,将共享变量从主内存传送到工作内存中;
  • load:作用于工作内存,将read中的值读取到的值放入工作内存的变量副本中;
  • store:作用于工作内存,将工作内存中的变量副本传送到主内存中;
  • write:作用于主内存中,将strore的值写入到主内存的共享变量中;
  • use:作用域工作内存,会将工作内存的值传递给执行引擎,每当虚拟机需要使用该变量,就会执行该操作;
  • assign:作用于工作内存,每当虚拟机遇到一个赋值指令,就会把执行引擎中获取的值赋值给工作内存中的变量;
  • lock:作用于主内存,将变量标记为线程独占状态;
  • unlock:作用于主内存,释放独占状态;

JVM知识点(二)_第6张图片

(3)三大特性

  • 原子性:JMM 保证了 read、load、assign、use、store 和 write 六个操作具有原子性,除了long、double,其余基本数据类型都是原子性的;
  • 可见性:一个线程修改了变量,会同步给主内存,赶在其他线程修改之前刷新主内存。使用volatile修饰变量,变量更新会立即同步到主内存中,其他线程修改该变量之前,需要到主内存中拉取变量更新到自己的工作内存;
  • 有序性:在线程中观察,可以发现操作是有序的,而在另外一个线程中观察,操作是无序的;java中有一些默认的happen-before:
    • 程序次序:一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作。
    • 监视器锁定:unLock 操作先行发生于后面对同一个锁的 lock 操作。
    • volatile:对一个变量的写操作先行发生于后面对这个变量的读操作。
    • 传递规则:如果操作 A 先行发生于操作 B,而操作 B 又先行发生于操作 C,则操作 A 先行发生于操作 C。
    • 线程启动:对线程 start() 的操作先行发生于线程内的任何操作。
    • 线程中断:对线程 interrupt() 的调用先行发生于线程代码中检测到中断事件的发生,可以通过 Thread.interrupted() 方法检测是否发生中断。
    • 线程终结规则:线程中的所有操作先行发生于检测到线程终止,可以通过 Thread.join()、Thread.isAlive() 的返回值检测线程是否已经终止。
    • 对象终结规则:一个对象的初始化完成先行发生于它的 finalize() 方法的开始。

(4)内存屏障

  • load-load barriers:指令前插入load Barriers,会使高速缓存直接失效,强制重新从主内存加载数据;如下:load1数据的加载会先于load2及后面的数据的加载
load1
LoadLoad
load2
  • load-store Barriers:load1数据的加载会先于store2及后面数据存储指令加载到主内存;
load1
LoadStore
store2
  • store-store Barriers:store1数据写入主内存,优先于store2及后面的数据写入主内存,使用store barriers,能让写入缓存的数据最快加载如主内存,让其他线程可见;
store1
StoreStore
store2
  • store-load Barriers:在load2及后续所有读取操作执行之前,保证store1写入对多有处理器都可见;开销最大,涵盖前三条;
store1
StoreLoad
load2

5、字节码看并发编程

(1)线程模型

  • 对于java虚拟机中,每一个java线程会对应一个轻量级进程LWP;
  • 轻量级线程是调用系统内核所提供的一套接口,实际上还需要调用内核线程KLT;
  • 具体的概念,如创建,同步等,需要进行系统调用;
  • 系统调用需要用户态和内核态进行切换,即上下文切换,开销较大;

JVM知识点(二)_第7张图片

(2)Synchronized字节码

  • 方法加上Synchronized关键字,字节码是在flag标志处加上同步标志;

JVM知识点(二)_第8张图片

  • 对对象使用synchronized,字节码是通过一套monitorenter,monitorexit来使用的

JVM知识点(二)_第9张图片

public class SynchronizedDemo {
    synchronized void m1() {
        System.out.println("m1");
    }
    final Object lock = new Object();
    void doLock() {
        synchronized (lock) {
            System.out.println("lock");
        }
    }
}

(3)对象内存布局

  • Mark Word:用来存储 hashCode、GC 分代年龄、锁类型标记、偏向锁线程 ID、CAS 锁指向线程 LockRecord 的指针等,synconized 锁的机制与这里密切相关;
  • Class Point:用于执行对象所对应的类元数据信息,JVM通过他直到对象属于哪个Class;
  • Instance Data:真正存储对象数据,如字段内容等;
  • Padding:对象字节必须为8倍数,该字段会自动填充到8倍数;

JVM知识点(二)_第10张图片

6、

你可能感兴趣的:(jvm,java,算法)