linux性能分析命令--vmstat

vmstat简介

vmstat命令是最常见的Linux/Unix监控工具，可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率，内存使用，虚拟内存交换情况,IO读写情况。相比top，可以看到整个机器的CPU,内存,IO的使用情况，而不是单单看到各个进程的CPU使用率和内存使用率(使用场景不一样)

命令简单用法

一般vmstat工具的使用是通过两个数字参数来完成的，第一个参数是采样的时间间隔数，单位是秒，第二个参数是采样的次数

[root@vircent7 ~]# vmstat 2 3
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0 1068348   2108 372104    0    0   593    42  217  214  1  5 91  3  0
 0  0      0 1068324   2108 372104    0    0     0     0   92  136  0  0 100  0  0
 0  0      0 1068324   2108 372104    0    0     0     0  102  149  0  0 100  0  0

以上命令表示每隔2秒采样一次，一共采样3次，小面的每一行实际的数字就是每次采样的数据。
如果想在一段时间内连续监控，则不需要加采样次数的参数，就会一直采样，直至手动结束。

vmstat各字段说明

1、procs-进程相关

r：表示运行和等待CPU时间片的进程数（就是说多少个进程真的分配到CPU），这个值如果长期大于系统CPU个数，说明CPU不足，需要增加CPU

b：显示多少进程在不可中断的休眠，表示在等待资源的进程数，比如正在等待I/O或者内存交换等。

2、memory--内存相关

swpd：表示切换到内存交换区的内存大小，即虚拟内存已使用的大小（单位KB），如果大于0，表示你的机器物理内存不足了，如果不是程序内存泄露的原因，那么你该升级内存了或者把耗内存的任务迁移到其他机器。

free：表示当前空闲的物理内存

buff：表示baffers cached内存大小，也就是缓冲大小，一般对块设备的读写才需要缓冲

Cache：表示page cached的内存大小，也就是缓存大小，一般作为文件系统进行缓冲，频繁访问的文件都会被缓存，如果cache值非常大说明缓存文件比较多，如果此时io中的bi比较小，说明文件系统效率比较好（Linux/Unix的聪明之处，把空闲的物理内存的一部分拿来做文件和目录的缓存，是为了提高程序执行的性能，当程序使用内存时，buffer/cached会很快地被使用）

3、swap--交换分区

si：每秒从磁盘读入虚拟内存的大小，如果这个值大于0，表示物理内存不够用或者内存泄露了，要查找耗内存进程解决掉。

so：每秒虚拟内存写入磁盘的大小。

注意：一般情况下si、so的值都为0，如果si、so的值长期不为0，则说明系统内存不足，需要增加系统内存

4、io

bi：块设备每秒接收的块数量，即读磁盘，这里的块设备是指系统上所有的磁盘和其他块设备，默认块大小是1024byte，单位kb/s

bo：表示写到块设备数据的总量，即写磁盘，单位kb/s

注意：如果bi+bo的值过大，且wa值较大，则表示系统磁盘IO瓶颈

5、system

in：每秒CPU的中断次数，包括时间中断

cs：cpu每秒产生的上下文切换次数(cs自愿上下文切换\nvcs非自愿上下文切换)

例如我们调用系统函数，就要进行上下文切换，线程的切换，也要进程上下文切换，这个值要越小越好，太大了，要考虑调低线程或者进程的数目,例如在apache和nginx这种web服务器中，我们一般做性能测试时会进行几千并发甚至几万并发的测试，选择web服务器的进程可以由进程或者线程的峰值一直下调，压测，直到cs到一个比较小的值，这个进程和线程数就是比较合适的值了。系统调用也是，每次调用系统函数，我们的代码就会进入内核空间，导致上下文切换，这个是很耗资源，也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换，导致CPU干正经事的时间少了，CPU没有充分利用，是不可取的。

注意：

这两个值越大，则由内核消耗的CPU就越多

6、CPU

us：表示用户进程消耗的CPU时间百分比，us值越高，说明用户进程消耗CPU时间越多，如果长期大于50%，则需要考虑优化程序或者算法

sy：表示系统内核进程消耗的CPU时间百分比，如果太高，表示系统调用时间长，例如是IO操作频繁。

一般来说us+sy应该小于80%，如果大于80%，说明可能存在CPU瓶颈

id：表示CPU处在空间状态的时间百分比

wa：表示等待所占用的CPU时间百分比，wa值越高，说明I/O等待越严重，根据经验wa的参考值为20%，如果超过20%，说明I/O等待严重，引起I/O等待的原因可能是磁盘大量随机读写造成的，也可能是磁盘或者监控器的贷款瓶颈（主要是块操作）造成的

综上所述，如果评估CPU，需要重点关注procs项的r列值和CPU项的us、sy、wa列的值