一次解决因GRPC导致的cpu占用率异常的经历

背景:

本人负责的一个数据转换项目(java)中用到了google的grpc远程调用框架,在移交测试后发现,程序持续运行一段时间后cpu占用率总会在一个时间点由<5%突变到>20%并且再也不会下降到原来的水平。经过一系列排查最终确定,是由于所使用的grpc(1.13.1)版本中包含了一个有bug的netty(4.1.25.Final)版本导致的。

解决过程:

    由于并未及时博客记录所以没用详细的截图,只能凭记忆大致写出解决过程以及所以用到的工具。

1、起初怀疑是由内存泄漏导致jvm在频繁的gc使cpu占用率升高,于是使用jdk自带工具jvisiualvm和jstat监测分析进程运行情况。发现gc发生的频率并不高并且,发生gc时cpu占用率比问题复现且未发生gc时还低。

2、在使用jvisiualvm和jstat对进程长时间的监测分析后发现每次突发cpu异常飙高的时候都恰好有一个新线程产生,于是立马用jstack命令查看此线程的详细信息,发现这个线程是在netty框架用于回收资源的线程ObjectCleanerThread。翻阅netty和grpc-java的官方github->ISSUES得知是由于netty框架未正确关闭ObjectCleanerThread导致的cpu占用异常。

3升级grpc版本至1.17.1->问题解决!

 

 

 

 

你可能感兴趣的:(软件相关)