记一次解决生产环境内存泄漏问题

场景描述

生产环境应用服务在运行过程中,内存使用量不断升高,并且没有下降的趋势。由服务刚启动时10%左右的使用率,之后便缓慢升高。服务运行大约一星期后内存使用率能够达到75%。

image

解决步骤

  1. jdk1.8内存模型分析。
    JVM内存总共分为:
  • 虚拟机栈、本地方法栈、pc寄存器(程序计数器)<线程独有的内存空间>
  • 方法区、堆<线程公共内存空间>
    五个部分。
    • 虚拟栈:每个线程独有的栈。栈中存放有“栈帧”,栈帧中存放有方法的局部变量信息(基本数据类型、对象引用),操作数栈,方法出口等信息。
    • 本地方法栈:这部分主要是与java调用native方法有关。
    • pc寄存器:也叫程序计数器,记录线程执行指令的地址
    • 方法区:存放类的元数据信息、常量池、方法数据、方法代码等。(jvm线程共享区域)
    • 堆:线程共享部分,所有对象和数组都会分配到该区域,GC主要发生的区域
  1. 结合JVM内存模型与内存增长分析,内存增长速度增加是在每天用户量较大时发生的。因此,判断出有可能是程序中忘记关闭资源导致的内存泄漏。
  2. 排查代码后发现,代码业务代码有InputStream没有关闭。修改之后在生产部署其中一台服务观察内存增长情况。
    修复结果
    在关闭InputStream之后依然没有效果,内存依旧缓慢上升。所以资源没有关闭不是症结所在。

再次找原因

在服务器执行jstat -gc pid 5000 查看gc情况。

image

从gc次数与所用时间看,没有频繁Fgc的情况,所以判断应该不是堆内内存的问题。如果是old区域内存快要用完应该会发生频繁fullgc的情况,或者直接内存溢出。
因此,初步判断因为堆外内存使用量过大,并且没有回收。
先导出堆内存快照分析下吧。
jmap -dump:file=javaDump.hprof,format=b pid
导出hprof之后使用jdk自带的工具查看数量较多的实例进行分析。
经过分析,看到fontTrueType这个类的实例比较多,30多w。初步判断是后台生成图片时,创建的字体实例没有回收造成内存泄漏。(字体是读取的自己下载的ttf文件)
再查阅了一些资料之后,找到了问题所在。https://blog.csdn.net/weixin_34200628/article/details/93182316
原因概述
每次new Font()之后,调用g.drawString()方法都会在Non-Heap区域分配一块内存且不回收。由于每次生成图片时都会new Font()。都会在堆外分配一块内存并且不回收。所以应用内存无限增长。
解决方案
由于用到的字体为固定的,所以选择将使用到的字体实例缓存在本地。这样不用每次使用时都new一个实例,而在堆外分配内存。本次使用的是Google 的guava cache将字体实例进行缓存。

你可能感兴趣的:(记一次解决生产环境内存泄漏问题)