Linux中Python应用CPU占用高问题排查

公司购买了一套由外部供应商提供的呼叫中心系统,在使用的过程中发现其LOAD和CPU占用偏高,由于没有源代码也不太清楚其内部的实现逻辑,只能够通过观察系统资源的消耗来排除其问题,以下记录的是问题排查的过程。

1、通过top命令查看其CPU占用

Linux中Python应用CPU占用高问题排查_第1张图片

可以看到其load占用为“20.14, 16.42, 19.16”,三个数字分别表示cpu在1分钟、5分钟及15分钟的load,cpu的使用率也偏高,达到了68.8%,占用cpu较高的进程ID为281020。

2、通过ps查看该应用

$ ps aux|grep 281020
root     212891  0.0  0.0 103328   848 pts/3    S+   15:41   0:00 grep 281020
ipcc     281020 39.5  2.6 1025560 425540 ?      Sl   01:18 341:29 /usr/bin/python ./ctiRealtimeCdrMain.py default.xml

结果显示该应用为python应用。

3、查看进程中线程的CPU占用情况

top中加入-H参数,查看该进程中线程的cpu战胜情况:

$ top -H -p 281020

结果如下:

Linux中Python应用CPU占用高问题排查_第2张图片

可以看到进程281020中线程号为281042的线程战胜的CPU最多。

4、跟踪进程的执行栈

通过watchpstack命令查看线程中命令的执行情况:

watch pstack 281042

Linux中Python应用CPU占用高问题排查_第3张图片

可以看到从mysql中读取数据占用资源较多。

5、跟踪函数的调用

进一步通过strace命令进行验证:

$ strace -f -p 281042

结果如下:

Linux中Python应用CPU占用高问题排查_第4张图片

其中大量的数据在执行数据库的写入(write)及读取(read)操作,上面的pstack命令并没有反映出write的问题,那问题应该出现在数据库的read操作上,初步猜测是数据库的select语句有问题,或者是没有走索引。

6、检查MySql的慢日志

进一步检查MySql的慢日志发现:

Linux中Python应用CPU占用高问题排查_第5张图片

其中有大量的查询慢日志,SQL中使用了全表扫描的count、max、min这样的函数,终于确认问题造成的原因了,余下的就是让对方对做优化了。

你可能感兴趣的:(调试分析,Linux,架构设计)