linux 性能度量参考标准

CPU

1.cpu使用率。它描述了每个处理器的整体使用率。如果在一段持续时间内cpu的使用率超过80%。可能cpu 有瓶颈
2.用户进程消耗cpu的时间。描述了cpu 花费在用户进程的百分比,包括nice time。
较高值的user time 通常是有利的,因为,通常在这种情况下。系统在执行实际的工作。
3.内核操作消耗CPU的时间(系统时间) 。其描述了cpu 花费在内核操作的百分比,包括IRQ和softirq 时间。较高和持续的system time 值可以指出在网络和驱动程序堆栈中的瓶颈。一个系统通常应该保持在内核操作上的时间尽可能的少
4.等待 。CPU 花费在等待(由于一个I/O 操作发生等待)上的时间总量。像是阻塞值。一个系统通常不应该花费太多时间等待。否则应该检查各自的I/O子系统性能
5.CPU空闲时间。其描述了系统空间等待任务的CPU的百分比
6.Nice 消耗CPU的时间。描述了CPU 花费在re-nicing 进程(更改进程的执行顺序和优先级)上的百分比
7.平均负载。load average 不是一个百分比,而是一下综合的滚动平均值:
·队列中等待处理的进程数
·等待不可中断任务被完成的进程数
也就是,TASK_RUNNING 和TASK_UNINDERRUPTIBLE 进程数的总和的平均值。如果进程请求cpu时间而被阻塞(这意味着cpu没有时间处理它们),load average 会增加。另一方面,如果每个进程得到直接访问cpu的时间,它们没有在cpu周期丢失,意味着负载将减少
8.可运行的进程。这个值描述了已经准备好执行的进程数。在一段持续的时间内,这个值不应该超过无力处理器数量的10倍。否则cpu可能处于瓶颈
9.阻塞进程,不被执行的进程数,因为它们要等待I/O操作结束。阻塞的进程数能反应I/O瓶颈
10.上下文切换。在系统上发生线程之间切换的数量。大量上下文切换如果与大量中断相关,则可能是驱动程序或者应用程序出现问题的信号。
11.中断 中断包括软中断和硬中断。硬中断对系统性能有更加不利的影响。较高的中断值表示有软件瓶颈。还有可能包括cpu时钟引起的中断

内存

1.空闲内存。在linux中不应该只关注free 内存的值。
linux 内核分配大部分未使用的内存作为文件系统缓存,所以从used 内存中减去缓冲(buffer)和缓存(cache)的内存数,来确定有效的空闲内存
2.使用的swap。描述了已经使用了swap空间的数量。swap IO是一个识别内存瓶颈的可靠手段。在一段持续的时间内每秒200到300以上的分页值,表明可能有内存瓶颈
3.缓冲和缓存。缓冲被分配作为文件系统和块设备的缓存
4.slab ,内核使用的内存数。注意内核的分页不能移出到磁盘

块设备

1.I/O等待。cpu等待一个I/O操作的发生所花费的时间。较高或者持续的值很多时间可能存在瓶颈

  1. 平均队列长度。未完成的I/O请求数量。一般情况下,一个磁盘有2到3个队列是最佳的。较高则表明可能有瓶颈。
    3.平均等待时间。服务一个I/O请求所测量的平均时间,以毫秒为单位。等待时间是由实际I/O操作和它在I/O队列中等待的时间组成
    4.每秒传输 。描述了每秒钟多少个I/O操作被执行(读写) 。该指标要结合每秒KB值,以帮助你确定系统的平均传输大小。平均传输大小一般应该与你的磁盘子系统使用的条带大小相匹配
    5.每秒读取/写入的字节。从块设备(到块设备)传输的实际数据量

网络接口

  1. 接收和发送的数据包。一个给定网络接收和发送的字节数
  2. 接收和发送的字节。
    3.每秒的冲突数量。给出了在网络上连接的每个接口发生冲突的相对数量,如果发生持续冲突通常要关注网络基础设施的问题
    4.丢弃的数据包。
    5,溢出。这个指标表示网络接口溢出缓冲区空间的次数。这个指标应该结合数据包被丢弃的值来使用,用来确定是网络缓冲区还是网络队列长度出现的瓶颈
    6.错误。标志为故障帧的数量。通常是由于网络不匹配,或者部分电缆中断导致的。

你可能感兴趣的:(linux 性能度量参考标准)