linux服务器cpu飙高问题排查实践记录

问题描述:
测试环境大量请求出现504错误
1、第一反应上服务器看看资源消耗情况(登陆服务器时出现卡顿)
2、使用top命令查看cpu消耗情况,查看结果如下:
linux服务器cpu飙高问题排查实践记录_第1张图片
很明显cpu使用率已经满了(两核CPU)
3、使用ps -mp 23481 -o THREAD,tid,time | sort -rn命令获取线程信息,并找到占用CPU高的线程,信息如下:
linux服务器cpu飙高问题排查实践记录_第2张图片
4、使用命令printf “%x\n” 41846将将需要的线程ID转换为16进制格式

在这里插入图片描述
5、使用sudo jstack 23481 |grep “5c0d” -A 30命令打印线程的堆栈信息
linux服务器cpu飙高问题排查实践记录_第3张图片
通过代码很容易的分析出是因为最近项目加入了disruptor高效的消息队列

YieldingWaitStrategy是它的三种策略之一

com.lmax.disruptor.BlockingWaitStrategy
最低效的策略,但其对CPU的消耗最小,并且在各种部署环境中能提供更加一致的性能表现;

com.lmax.disruptor.SleepingWaitStrategy
性能表现和com.lmax.disruptor.BlockingWaitStrategy差不多,对CPU的消耗也类似,但其对生产者线程的影响最小,适合用于异步日志类似的场景;

com.lmax.disruptor.YieldingWaitStrategy
性能最好,适合用于低延迟的系统;在要求极高性能且事件处理线程数小于CPU逻辑核心树的场景中,推荐使用此策略;

你可能感兴趣的:(linux,cpu,linux)