JVM技术文档--JVM优化思路以及问题定位--JVM可调整参数汇总

阿丹:

        一个优秀的程序员,是因为在线上的排查以及遇到的线上、生产事故较多所以定位问题以及解决问题会比普通程序员快很多,所以一个优秀的程序员要逐渐形成自己的方法论,来完善和解决问题。

我们是如何发现问题的呢?

阿丹常用:

1、使用 Prometheus 监控 JVM

2、使用Arthas来定位和找到具体问题

3、定位到问题进行修改验证

另外一种方式:

1、打印日志

2、获取到对应的dump文件

3、使用MAT工具进行分析

4、定位到问题进行修改验证

补充说明MAT:

MAT(Memory Analyzer Tool)是一款用于Java堆转储分析的强大工具。它可以帮助识别和解决内存泄漏、查找大对象、分析垃圾回收行为等问题。

以下是使用MAT来导入dump文件和进行分析的基本步骤:

  1. 下载和安装MAT:可以从官方网站(https://www.eclipse.org/mat/)下载并安装适用于您操作系统的MAT版本。

  2. 导入dump文件:

    • 打开MAT工具。
    • 在欢迎界面上选择"Open Heap Dump"(打开堆转储)。
    • 在弹出窗口中,选择要导入的dump文件。这可以是.hprof、.phd或IBM格式的.dump文件。
    • 单击"Finish"完成导入。
  3. 分析堆转储文件:

    • 在导入后,MAT会花费一些时间进行分析和索引。
    • 一旦分析完成,您将看到一个“Histogram”(直方图)视图,其中显示了各个类的实例数和内存占用情况。
  4. 探索和分析数据:

    • 使用不同的视图和功能来分析内存使用情况、对象引用关系、内存泄漏等。
    • “Dominators”(支配者)视图可以帮助您找到占用最多内存的对象。
    • "Leak Suspects"(泄漏嫌疑)视图可帮助您识别潜在的内存泄漏问题。

MAT提供了许多功能和视图,涵盖了广泛的堆转储分析需求。您可以通过探索菜单、工具栏和上下文菜单来查看和使用这些功能。

请注意,由于堆转储文件通常很大(数百MB或更大),导入和分析过程可能需要一些时间和系统资源。

那么我们来整理和解决一下这些问题如何解决

这里是一个在线的JVM可调整参数的汇总网站,还是比较全面的。 

Java JVM 参数设置大全

以下是一份详细的JVM参数汇总:

  1. 通用参数:

    • -server:选择JVM运行在服务器模式。
    • -client:选择JVM运行在客户端模式。
    • -version:打印JVM版本信息并退出。
    • -verbose[:class|gc|jni]:启用详细输出,可选项为类加载、垃圾回收或JNI调试。
    • -showversion:打印JVM版本信息并继续执行。
    • -X:显示非标准选项帮助。
    • -ea[:...|:]:启用断言检查。
    • -da[:...|:]:禁用断言检查。
  2. 堆相关参数:

    • -Xmx:设置最大堆内存大小。
    • -Xms:设置初始堆内存大小。
    • -Xmn:设置新生代大小。
    • -XX:NewSize=:设置新生代初始大小。
    • -XX:MaxNewSize=:设置新生代最大大小。
    • -XX:SurvivorRatio=:设置Eden区与Survivor区的比率。
    • -XX:MaxTenuringThreshold=:设置对象晋升到老年代的年龄阈值。
  3. GC(垃圾回收)相关参数:

    • -XX:+UseSerialGC:使用串行垃圾回收器。
    • -XX:+UseParallelGC:使用并行垃圾回收器。
    • -XX:+UseConcMarkSweepGC:使用CMS(并发标记清除)垃圾回收器。
    • -XX:+UseG1GC:使用G1(Garbage First)垃圾回收器。
    • -XX:MaxGCPauseMillis=:设置最大垃圾收集停顿时间。
    • -XX:GCTimeRatio=:设置垃圾回收时间与应用程序执行时间的比率。
    • -XX:+ExplicitGCInvokesConcurrent:明确调用System.gc()时触发并发GC。
  4. 类加载参数:

    • -XX:+TraceClassLoading:跟踪类加载过程。
    • -XX:+TraceClassUnloading:跟踪类卸载过程。
    • -XX:+TraceClassResolution:跟踪类解析过程。
  5. JIT(即时编译器)相关参数:

    • -XX:+TieredCompilation:启用分层编译。
    • -XX:+PrintCompilation:输出已编译方法的日志信息。
  6. 线程相关参数:

    • -Xss:设置线程栈大小。
    • -XX:ThreadStackSize=:设置线程栈大小。

接下来我将记录一下一种经常出现的问题以及它们的优化思路

在JVM在线上环境中,可能会出现以下常见的报错和问题:

  1. 内存相关问题:

    • OutOfMemoryError:表示JVM无法分配更多的内存,可能是由于堆或永久代空间不足导致。
    • PermGen Space错误(JDK 8之前)或Metaspace错误(JDK 8及更高版本):表示永久代(JDK 8之前)或元空间(JDK 8及更高版本)已满。这通常是因为动态生成类太多或者加载的类太多,导致永久代或元空间不足。
  2. 垃圾回收相关问题:

    • Full GC过长:当垃圾回收需要大量时间时,可能会导致系统停顿或性能下降。
    • GC Overhead Limit Exceeded:当垃圾回收所占用的CPU时间超过一定比例时,JVM会抛出此错误。
  3. 线程相关问题:

    • Deadlock(死锁):两个或多个线程相互等待对方释放资源,导致程序无法继续执行。
    • Thread starvation(线程饥饿):某些线程无法获得足够的CPU时间或资源,导致长时间处于等待状态。
  4. 类加载问题:

    • ClassNotFoundException:JVM无法找到特定的类。
    • NoClassDefFoundError:类在编译时存在,但在运行时无法找到。
  5. 并发问题:

    • Race Condition(竞态条件):多个线程同时访问共享资源,导致数据不一致或错误。
    • Synchronization errors(同步错误):使用不正确的同步机制可能导致死锁、饥饿或性能下降。
  6. 其他常见问题:

    • StackOverflowError:递归调用过深,导致栈溢出。
    • NullPointerException:尝试使用空引用对象。

以上只是一些常见的问题和报错。由于JVM的复杂性和灵活性,实际上可能会遇到各种其他问题和异常。解决这些问题需要详细的日志分析、监控和调优技巧。因此,在生产环境中,建议进行合适的监控和日志记录,以便及时发现和解决潜在的问题。

上面这些问题都可以使用我前面提供的解决方案1,就是使用普罗米修斯来监控预警。然后通过具体的阿尔萨斯来解决这些问题。

你可能感兴趣的:(JVM-java基础,jvm)