CPU占用率计算原理

 1 CPU占用率计算原理

  1.1 相关概念

  在Linux/Unix下,CPU利用率分为用户态、系统态和空闲态, 分别表示CPU处于用户态执行的时间,系统内核执行的时间,和空闲系统进程执行的时间。    下面是几个与CPU占用率相关的概念。

  n CPU利用率       CPU的使用情况。

  n 用户时间(User time)

  表示CPU执行用户进程的时间,包括nices时间。通常期望用户空间CPU越高越好。

  n 系统时间(System time)

  表示CPU在内核运行时间,包括IRQ和softirq时间。系统CPU占用率高,表明系统某部分存在瓶颈。通常值越低越好。

  n 等待时间(Waiting time)

  CPI在等待I/O操作完成所花费的时间。系统部应该花费大量时间来等待I/O操作,否则就说明I/O存在瓶颈。

  n 空闲时间(Idle time)

  系统处于空闲期,等待进程运行。

  n Nice时间(Nice time)

  系统调整进程优先级所花费的时间。

  n 硬中断处理时间(Hard Irq time)       系统处理硬中断所花费的时间。

  n 软中断处理时间(SoftIrq time)       系统处理软中断中断所花费的时间。

  n 丢失时间(Steal  time)

  被强制等待(involuntary wait)虚拟CPU的时间,此时hypervisor在为另一个虚拟处理器服务。

  下面是我们在top命令看到的CPU占用率信息及各项值含义。

  Cpu(s):  0.2%us,  0.2%sy,  0.0%ni, 99.2%id,  0.5%wa,  0.0%hi,  0.0%si,  0.0%st

  us: User time

  sy: System time

  ni: Nice time

  id: Idle time

  wa: Waiting time

  hi: Hard Irq time

  si: SoftIrq time

  st: Steal time

  1.2 CPU占用率计算

  Linux CPU占用率计算,都是根据/proc/stat文件内容计算而来,下面是stat文件内容样例,内核版本不同,会稍有不同,但内容基本一致。

  1.top

  使用权限:所有使用者

  使用方式:top [-] [d delay] [q] [c] [S] [s] [i] [n] [b]

  说明:即时显示process的动态

  d :改变显示的更新速度,或是在交谈式指令列( interactive command)按s

  q :没有任何延迟的显示速度,如果使用者是有superuser的权限,则top将会以最高的优先序执行

  c :切换显示模式,共有两种模式,一是只显示执行档的名称,另一种是显示完整的路径与名称S :累积模式,会将己完成或消失的子行程( dead child process )的CPU time累积起来

  s :安全模式,将交谈式指令取消,避免潜在的危机

  i :不显示任何闲置(idle)或无用(zombie)的行程

  n :更新的次数,完成后将会退出top

  b :批次档模式,搭配"n"参数一起使用,可以用来将top的结果输出到档案内

  范例:

  显示更新十次后退出;

  top -n 10

  使用者将不能利用交谈式指令来对行程下命令:

  top -s

  将更新显示二次的结果输入到名称为top.log的档案里:

  top -n 2 -b < top.log

  另附一个命令简介linux traceroutewindows tracert两个命令相当,跟踪网络路由

  2.vmstat

  正如我们之前讨论的任何系统的性能比较都是基于基线的,并且监控CPU的性能就是以上3点,运行队列、CPU使用率和上下文切换。以下是一些对于CPU很普遍的性能要求:

  1.对于每一个CPU来说运行队列不要超过3,例如,如果是双核CPU就不要超过6;

  2.如果CPU在满负荷运行,应该符合下列分布,

  a) User Time:65%~70%

  b) System Time:30%~35%

  c) Idle:0%~5%

  3. mpstat

  对于上下文切换要结合CPU使用率来看,如果CPU使用满足上述分布,大量的上下文切换也是可以接受的。

  常用的监视工具有:vmstat, top,dstat和mpstat.

  # vmstat 1

  procs -----------memory---------- ---swap-- -----io---- --system-- ----cpu----

  r b swpd free buff cache si so bi bo in cs us sy id wa

  0 0 104300 16800 95328 72200 0 0 5 26 7 14 4 1 95 0

  0 0 104300 16800 95328 72200 0 0 0 24 1021 64 1 1 98 0

  0 0 104300 16800 95328 72200 0 0 0 0 1009 59 1 1 98 0

  r表示运行队列的大小,

  b表示由于IO等待而block的线程数量,

  in表示中断的数量,

  cs表示上下文切换的数量,

  us表示用户CPU时间,

  sys表示系统CPU时间,

  wa表示由于IO等待而是CPU处于idle状态的时间,

  id表示CPU处于idle状态的总时间。

  dstat可以给出每一个设备产生的中断数:

  # dstat -cip 1

  ----total-cpu-usage---- ----interrupts--- ---procs---

  usr sys idl wai hiq siq| 15 169 185 |run blk new

  6 1 91 2 0 0| 12 0 13  | 0 0 0

  1 0 99 0 0 0| 0    0  6 | 0 0 0

  0 0 100 0 0 0| 18 0  2 | 0 0 0

  0 0 100 0 0 0| 0    0  3 | 0 0 0

  我们可以看到这里有3个设备号15,169和185.设备名和设备号的关系我们可以参考文件/proc/interrupts,这里185代表网卡eth1.

  # cat /proc/interrupts

  CPU0

  0: 1277238713 IO-APIC-edge timer

  6: 5 IO-APIC-edge floppy

  7: 0 IO-APIC-edge parport0

  8: 1 IO-APIC-edge rtc

  9: 1 IO-APIC-level acpi

  14: 6011913 IO-APIC-edge ide0

  15: 15761438 IO-APIC-edge ide1

  169: 26 IO-APIC-level Intel 82801BA-ICH2

  185: 16785489 IO-APIC-level eth1

  193: 0 IO-APIC-level uhci_hcd:usb1

你可能感兴趣的:(CPU占用率计算原理)