Linux C++ 程序占cpu%问题排查

Linux C++ 程序占cpu%问题排查

缘起

对一个服务(room_status_server)进行了一些优化,并顺便修改了部分配置文件,重启后用top命令观察,发现该程序cpu几乎占到了100%
在这里插入图片描述

初步判断

发现这个问题后,想到前两天还上线了该服务,立马去线上看了看,还好线上是正常的。那么问题肯定是刚才的修改导致的!
把线上的版本拿过来运行,还是cpu几乎占到了100%,那很大可能是配置文件哪里改错了(后面验证表明我的猜测是对的)。

想到这是一个好的学习的机会,我想还是从运行的程序来看看到底出了什么事。

定位问题

思路:

  1. 程序占用100%的cpu,程序即进程,也就是说进程占了100%的cpu(一个核)
  2. 一个进程有多个线程,究竟是哪一个线程占了100%的cpu?
  3. 这个线程在干什么?

1. 查看程序的进程号

命令:top -c。 输入大写P,top的输出会按使用cpu多少排序。
在这里插入图片描述

PID就是进程号,我程序的进程号是4918

2. 查看耗CPU的线程号

命令:top -Hp 进程号。 同样输入大写P,top的输出会按使用cpu多少排序。

输入top -Hp 4918,展示内容如图:
Linux C++ 程序占cpu%问题排查_第1张图片
可以看出PID是4927的线程占到了100%的cpu,我的业务日志是打印线程号的,打开日志,哦~~ 原来是这个原因(先卖个关子不说)。

3. 查看耗CPU的任务

上面找到了耗CPU的线程,那这个线程在做什么呢?
看线程在干什么,可以看线程的堆栈,命令是pstack 进程号,会输出所有线程的堆栈信息。

输入pstack 4918,并搜索线程4927的堆栈,展示内容如图:
Linux C++ 程序占cpu%问题排查_第2张图片

从堆栈信息看,程序在执行boost创建socket监听等任务,为什么一直执行这个呢?因为,我的端口号重复使用了。

终章

其实从堆栈信息定位问题还是有些抽象的,但是大概可以看出线程在做什么,至少给排查问题指明了方向。

你可能感兴趣的:(c++问题排查,C++,cpu%,C++,cpu占满,linux,C++,cpu,100%,程序cpu%,c,cpu%)