linux下cpu飙高原因排查过程详解

前言

cpu飙高是很常见的线上问题,这都不会的话,属实有点拉跨

linux下cpu飙高原因排查过程详解_第1张图片

兄弟萌不用慌,来我教你一套连招

开始

先来个项目,整个api,到时候我们请求/cpu/{count}就能手动拉高cpu,机智鬼~

    @GetMapping("/cpu/{count}")
    public long cpuTest(@PathVariable("count") long count) {
        long number = 0;
        for (int i = 0; i < count; i++) {
            number++;
        }
        return number;
    }

打包、上传、启动

在这里插入图片描述

跑起来了,记住这个进程号 14849

我们先top看看正常情况下的cpu使用率

linux下cpu飙高原因排查过程详解_第2张图片

很合理

模拟线上cpu飙高

我们请求/cpu/{100000000000}接口,把cpu拉起来,同时top观察cpu使用率

linux下cpu飙高原因排查过程详解_第3张图片

直接干到98%,很nice

ok入戏,我们现在线上出问题了,cpu一直很高,老大叫你找找原因,开始支棱起来

其实我们现在已经知道是谁把cpu拉高了,但还不够细,只知道哪个项目出的问题远远不够,我们应该找到罪魁祸首,到底是哪个方法的多少行导致的问题,这才能让老大直呼内行

步骤

jps+top 定位应用进程

pidtop -Hp {pid}找到线程tid

将 tid 转换成十六进制 printf “%x\n” {tid}

打印堆栈信息 jstack

过滤出我们想要的

排查

进程id已经确定是 14849,下一步我们要找到是哪个线程搞的鬼

top -Hp 14849

linux下cpu飙高原因排查过程详解_第4张图片

很明显是这个14908搞的鬼

转十六进制

在这里插入图片描述

打印堆栈

linux下cpu飙高原因排查过程详解_第5张图片

堆栈信息显示是TestController里面的第20行出的幺蛾子,我们进入代码验证

linux下cpu飙高原因排查过程详解_第6张图片

问题不大

破案

撒花

到此这篇关于linux下cpu飙高原因排查过程详解的文章就介绍到这了,更多相关linux cpu飙高原因排查内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

你可能感兴趣的:(linux下cpu飙高原因排查过程详解)