CPU使用率简单介绍

通过/proc/stat计算CPU使用率介绍

linux通过/proc虚拟文件系统,想用户提供了系统内部状态信息,/proc/stat提供的就是系统CPU和任务统计信息

# cat /proc/stat | grep ^cpu
cpu  1206478 257 1197978 341057442 40732 0 785 0 0 0
cpu0 1206478 257 1197978 341057442 40732 0 785 0 0 0
  • 第一行cpu没有编号,表示所有cpu的累加信息
  • 第二行cpu0代表系统中单一cpu信息

每列数值按顺序介绍:

  • user(通常缩写为 us),代表用户态 CPU 时间。注意,它不包括下面的 nice 时间,但包括了 guest 时间。
  • nice(通常缩写为 ni),代表低优先级用户态 CPU 时间,也就是进程的 nice 值被调整为 1-19 之间时的 CPU 时间。这里注意,nice 可取值范围是 -20 到 19,数值越大,优先级反而越低。
  • system(通常缩写为 sys),代表内核态 CPU 时间。
  • idle(通常缩写为 id),代表空闲时间。注意,它不包括等待 I/O 的时间(iowait)。
  • iowait(通常缩写为 wa),代表等待 I/O 的 CPU 时间。iowait不太表磁盘i/o有瓶颈,只代表cpu上i/o操作占用的时间比,假如当前没其它进程运行,很小的i/o也会导致iowait升高
  • irq(通常缩写为 hi),代表处理硬中断的 CPU 时间。
  • softirq(通常缩写为 si),代表处理软中断的 CPU 时间。
  • steal(通常缩写为 st),代表当系统运行在虚拟机中的时候,被其他虚拟机占用的 CPU 时间。
  • guest(通常缩写为 guest),代表通过虚拟化运行其他操作系统的时间,也就是运行虚拟机的 CPU 时间。
  • guest_nice(通常缩写为 gnice),代表以低优先级运行虚拟机的时间

可以通过/proc/stat 计算出CPU使用率,比如计算间隔1秒CPU使用率,需要在间隔1秒获取/proc/stat进行下面公式计算

  • CPU使用率 = (1 - (new_空闲时间 - old_空闲时间) / (new_总CPU时间 - old_总CPU时间)) * 100
  • 总CPU时间:user + nice + system + idle + iowait + softirq + steal + guest + guest_nice
  • 空闲时间:idle

通过工具获取CPU使用率

top:显示系统整体CPU和内存使用情况,以及可以动态显示各个进程情况
ps:只显示每个进程资源使用情况

top输出:

top - 11:42:35 up 40 days, 12:35,  4 users,  load average: 0.00, 0.01, 0.05
Tasks:  71 total,   1 running,  70 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.3 us,  0.3 sy,  0.0 ni, 99.3 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  1883420 total,   531820 free,   120892 used,  1230708 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  1577520 avail Mem

  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
31680 root      10 -10  130384  12896   5308 S  1.0  0.7 363:53.95 AliYunDun
    1 root      20   0  190908   3480   2120 S  0.0  0.2   0:17.85 systemd
    2 root      20   0       0      0      0 S  0.0  0.0   0:00.01 kthreadd

可以直观看到%Cpu(s)行显示了CPU的使用率信息,按1键可以展示所有CPU,在中间的空行下显示的为进程信息,这里 %CPU 的展示的就是该进程在内核态和用户态的CPU使用率总和

但是top并没有针对进程区分展示内核态和用户态分别CPU使用情况,这时候我们可以使用pidstat命令查看

 pidstat 1 5
Linux 3.10.0-693.2.2.el7.x86_64 (iz2zeab8t820b32tt9i96gz)   2019年12月15日     _x86_64_    (1 CPU)

11时48分52秒   UID       PID    %usr %system  %guest   %wait    %CPU   CPU  Command
11时48分53秒     0     20554    0.00    1.00    0.00    1.00    1.00     0  kworker/0:0
11时48分53秒     0     31680    1.00    1.00    0.00    0.00    2.00     0  AliYunDun
  • %usr :用户态使用率
  • %system:内核态使用率
  • %guest:运行虚拟机CPU使用率
  • %wait :等待CPU使用率
  • %CPU :总CPU使用率

常用参数:
-t:显示进程的所有线程信息
-w: 显示任务上下文切换报告
-u:显示CPU使用率
-d:显示进程占用磁盘i/o

CPU使用率升高程序分析工具

我们可以通过ps,top,pidstat定位到那个进程占用CPU使用比较多后,需要在定位这个进程里那个函数导致CPU使用率升高

  • GDB:(The GNU Project Debugger), 这个功能强大的程序调试利器。的确,GDB 在调试程序错误方面很强大。但是,我又要来“挑刺”了。请你记住,GDB 并不适合在性能分析的早期应用
  • perf :是 Linux 2.6.31 以后内置的性能分析工具。它以性能事件采样为基础,不仅可以分析系统的各种事件和内核性能,还可以用来分析指定应用程序的性能问题
Samples: 1K of event 'cpu-clock', 4000 Hz, Event count (approx.): 218249930 lost: 0/0 drop: 0/0
Overhead  Shared Object              Symbol
   5.53%  [kernel]                   [k] kallsyms_expand_symbol.constprop.1
   4.92%  [kernel]                   [k] finish_task_switch
   4.22%  perf                       [.] rb_next
  • 第一列 Overhead ,是该符号的性能事件在所有采样中的比例,用百分比来表示。
  • 第二列 Shared ,是该函数或指令所在的动态共享对象(Dynamic Shared Object),如内核、进程名、动态链接库名、内核模块名等。
  • 第三列 Object ,是动态共享对象的类型。比如 [.] 表示用户空间的可执行程序、或者动态链接库,而 [k] 则表示内核空间。
  • 最后一列 Symbol 是符号名,也就是函数名。当函数名未知时,用十六进制的地址来表示。

perf第二种常见用法是 perf record 和perf report,在性能分析时候,perf top展示了性能信息,但是没有保存起来,无法离线分析,而perf record 用于保存数据,perf report用于展示保存的数据

你可能感兴趣的:(CPU使用率简单介绍)