JVM从入门到精通(八):JVM调优实战

案例1:系统CPU经常100%,如何调优?

推理过程是:CPU100%,那么一定有线程在占用系统资源,所以

  1. 找出哪个进程cpu高(top命令)
  2. 该进程中的哪个线程cpu高(top -Hp)
  3. 如果是java程序,导出该线程的堆栈 (jstack命令)
  4. 查找哪个方法(栈帧)消耗时间,哪个方法调用的哪个方法 (jstack),然后去看这个方法的代码
  5. 工作线程占比高 / 垃圾回收线程占比高?
案例2:系统内存飙高,如何查找问题?
  1. 导出堆内存 (jmap)
  2. 分析 (jhat jvisualvm mat jprofiler … )

如何监控JVM?

可以使用 jstat jvisualvm jprofiler arthas top…等等

一个案例理解常用工具

  1. 测试代码:
   package com.mashibing.jvm.gc;
   
   import java.math.BigDecimal;
   import java.util.ArrayList;
   import java.util.Date;
   import java.util.List;
   import java.util.concurrent.ScheduledThreadPoolExecutor;
   import java.util.concurrent.ThreadPoolExecutor;
   import java.util.concurrent.TimeUnit;
   
   /**
    * 从数据库中读取信用数据,套用模型,并把结果进行记录和传输
    */
   
   public class T15_FullGC_Problem01 {
   
       private static class CardInfo {
           BigDecimal price = new BigDecimal(0.0);
           String name = "张三";
           int age = 5;
           Date birthdate = new Date();
   
           public void m() {}
       }
   
       private static ScheduledThreadPoolExecutor executor = new ScheduledThreadPoolExecutor(50,
               new ThreadPoolExecutor.DiscardOldestPolicy());
   
       public static void main(String[] args) throws Exception {
           executor.setMaximumPoolSize(50);
   
           for (;;){
               modelFit();
               Thread.sleep(100);
           }
       }
   
       private static void modelFit(){
           List<CardInfo> taskList = getAllCardInfo();
           taskList.forEach(info -> {
               // do something
               executor.scheduleWithFixedDelay(() -> {
                   //do sth with info
                   info.m();
   
               }, 2, 3, TimeUnit.SECONDS);
           });
       }
   
       private static List<CardInfo> getAllCardInfo(){
           List<CardInfo> taskList = new ArrayList<>();
   
           for (int i = 0; i < 100; i++) {
               CardInfo ci = new CardInfo();
               taskList.add(ci);
           }
   
           return taskList;
       }
   }
  
  1. java -Xms200M -Xmx200M -XX:+PrintGC com.mashibing.jvm.gc.T15_FullGC_Problem01

  2. 一般是运维团队首先受到报警信息(CPU过高, Memory占比大…然后你才去查原因)

  3. top命令观察到问题:内存不断增长 CPU占用率居高不下

  4. top -Hp 观察进程中的线程,哪个线程CPU和内存占比高

  5. jps定位具体java进程
    jstack 定位线程状况,重点关注:WAITING BLOCKED
    e.g.
    waiting on <0x0000000088ca3310> (a java.lang.Object)
    假如有一个进程中100个线程,很多线程都在waiting on ,一定要找到是哪个线程持有这把锁
    怎么找?搜索jstack dump的信息,找 ,看哪个线程持有这把锁RUNNABLE
    作业:
    1: 写一个死锁程序,用jstack观察
    2: 写一个程序,一个线程持有锁不释放,其他线程等待

  6. 为什么阿里规范里规定,线程的名称(尤其是线程池)都要写有意义的名称?为了方便定位!
    怎么样自定义线程池里的线程名称?(自定义ThreadFactory)

  7. jinfo pid了解即可,用处不是特别大

  8. jstat -gc 动态观察gc情况 / 阅读GC日志发现频繁GC / arthas观察 / jconsole/jvisualVM/ Jprofiler(最好用,收费)
    jstat -gc 4655 500 : 每个500个毫秒打印GC的情况
    如果面试官问你是怎么定位OOM问题的?如果你回答用图形界面(错误)
    1:已经上线的系统不用图形界面用什么?(cmdline arthas)
    2:图形界面到底用在什么地方?测试!测试的时候进行监控!(压测观察)

  9. jmap - histo 4655 | head -20,查找有多少对象产生,这个命令对线上系统影响不大。
    jmap -dump:format=b,file=xxx pid手动导出堆文件,这个命令不能线上用。
    线上系统,内存特别大,jmap执行期间会对进程产生很大影响,甚至卡顿(电商不适合),你可以这么说:
    1:设定了参数HeapDump,OOM的时候会自动产生堆转储文件
    2:很多服务器备份(高可用),先把这台机器隔离开,停掉这台服务器对其他服务器不影响
    3:在线定位arthas(一般小点儿公司用不到,这样吹容易露馅儿)

  10. java -Xms20M -Xmx20M -XX:+UseParallelGC -XX:+HeapDumpOnOutOfMemoryError com.mashibing.jvm.gc.T15_FullGC_Problem01

  11. 使用MAT / jhat /jvisualvm 进行dump文件分析
    https://www.cnblogs.com/baihuitestsoftware/articles/6406271.html
    jhat -J-mx512M xxx.dump
    http://192.168.17.11:7000
    拉到最后:找到对应链接
    可以使用OQL查找特定问题对象

  12. 找到代码的问题

实战

在这里插入图片描述top 命令
JVM从入门到精通(八):JVM调优实战_第1张图片
在这里插入图片描述

列出1591进程下的所有线程,重点关注:WAITING BLOCKED
JVM从入门到精通(八):JVM调优实战_第2张图片
java 日志
JVM从入门到精通(八):JVM调优实战_第3张图片

你可能感兴趣的:(#,JVM从入门到精通)