Top命令是Linux下常用的系统性能分析工具,能实时查看系统中各个进程资源占用情况。
top - 16:24:25 up 284 days, 4:59, 1 user, load average: 0.10, 0.05, 0.01 Tasks: 115 total, 1 running, 114 sleeping, 0 stopped, 0 zombie Cpu(s): 0.1%us, 0.0%sy, 0.0%ni, 99.8%id, 0.0%wa, 0.0%hi, 0.1%si, 0.0%st Mem: 4074364k total, 3733628k used, 340736k free, 296520k buffers Swap: 2104504k total, 40272k used, 2064232k free, 931680k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 11836 root 15 0 2324 1028 800 R 0.3 0.0 0:00.02 top 27225 root 25 0 1494m 696m 11m S 0.3 17.5 2304:03 java 1 root 18 0 2072 620 532 S 0.0 0.0 7:04.48 init
第一行分别显示:
16:24:25当前时间、
up 284 days, 4:59系统启动时间、
1 user当前系统登录用户数目、
load average: 0.10, 0.05, 0.01平均负载(1分钟,10分钟,15分钟)。平均负载(load average),一般对于单个cpu来说,负载在0~1.00之间是正常的,超过1.00须引起注意。在多核cpu中,系统平均负载不应该高于cpu核心的总数。
第二行分别显示:
115 total进程总数、
1 running运行进程数、
114 sleeping休眠进程数、
0 stopped终止进程数、
0 zombie僵死进程数。
第三行:
0.1%us %us用户空间占用cpu百分比;
0.0%sy %sy内核空间占用cpu百分比;
0.0%ni %ni用户进程空间内改变过优先级的进程占用cpu百分比;
99.8%id %id空闲cpu百分比,反映一个系统cpu的闲忙程度。越大越空闲;
0.0%wa %wa等待输入输出(I/O)的cpu百分比;
0.0%hi %hi指的是cpu处理硬件中断的时间;
0.1%si %si值的是cpu处理软件中断的时间;
0.0%st %st用于有虚拟cpu的情况,用来指示被虚拟机偷掉的cpu时间。
第四行(Mem):
4074364k total total总的物理内存;
3733628k used used使用物理内存大小;
340736k free free空闲物理内存;
296520k buffers buffers用于内核缓存的内存大小
第五行(Swap):
2104504k total total总的交换空间大小;
40272k used used已经使用交换空间大小;
2064232k free free空间交换空间大小;
931680k cached cached缓冲的交换空间大小buffers与cached区别:buffers指的是块设备的读写缓冲区,cached指的是文件系统本身的页面缓存。他们都是Linux系统底层的机制,为了加速对磁盘的访问。
然后下面就是和ps相仿的各进程情况列表了
第六行:
PID 进程号
USER 运行用户
PR
优先级,PR(Priority)所代表的值有什么含义?它其实就是进程调度器分配给进程的时间片长度,单位是时钟个数,那么一个时钟需要多长时间呢?这
跟CPU的主频以及操作系统平台有关,比如linux上一般为10ms,那么PR值为15则表示这个进程的时间片为150ms。
NI 任务nice值
VIRT 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
RES 物理内存用量
SHR 共享内存用量
S 该进程的状态。其中S代表休眠状态;D代表不可中断的休眠状态;R代表运行状态;Z代表僵死状态;T代表停止或跟踪状态
%CPU 该进程自最近一次刷新以来所占用的CPU时间和总时间的百分比
%MEM 该进程占用的物理内存占总内存的百分比
TIME+ 累计cpu占用时间
COMMAND 该进程的命令名称,如果一行显示不下,则会进行截取。内存中的进程会有一个完整的命令行
-----------------------------------------------------------------------------------------------------------
越来越多人开始接触Linux操作系统,从VPS到无线路由的刷机系统(如OpenWRT、Tomato),同时也必不可少地会在各式各样的探针和系统监测界面上看到"系统平均负载"或者"Load Average"这样的字眼,但是它并不像我们习惯中Windows、Mac操作系统提供百分比显示CPU、内存占用率,而是以几个用空格隔开的浮点数来表示系统平均负载,那么它们到底是什么意思呢?又如何衡量系统负载及系统的稳定性呢?
系统平均负载-基本解释
在Linux shell下,有很多命令可以看到Load Average,例如:
[email protected]:~# uptime
12:49:10 up 182 days, 16:54, 2 users, load average: 0.08, 0.04, 0.01
[email protected]:~# w
12:49:18 up 182 days, 16:54, 2 users, load average: 0.11, 0.07, 0.01
[email protected]:~# top
top - 12:50:28 up 182 days, 16:55, 2 users, load average: 0.02, 0.05, 0.00
先大致给一下这3个数字的含义:分别表示系统在过去1分钟、5分钟、15分钟内运行进程队列中的平均进程数量。
运行队列嘛,没有等待IO,没有WAIT,没有KILL的进程通通都进这个队列。
另外还有一个最直接的显示系统平均负载的命令
[email protected]:~# cat /proc/loadavg
0.10 0.06 0.01 1/72 29632
除了前3个数字表示平均进程数量外,后面的1个分数,分母表示系统进程总数,分子表示正在运行的进程数;最后一个数字表示最近运行的进程ID.
系统平均负载-进阶解释
只是上面那一句话的解释,基本等于没解释。写这篇文章的缘由就是因为看到了一篇老外写的关于Load Average的文章,觉得解释的很好,所以才打算摘取一部分用自己的话翻译一下。
@scoutapp Thanks for your article Understanding Linux CPU Load, I just translate and share it to Chinese audiences.
为了更好地理解系统负载,我们用交通流量来做类比。
1、单核CPU - 单车道 - 数字在0.00-1.00之间正常
路况管理员会告知司机,如果前面比较拥堵,那司机就要等待,如果前面一路畅通,那么司机就可以驾车直接开过。
具体来说:
0.00-1.00 之间的数字表示此时路况非常良好,没有拥堵,车辆可以毫无阻碍地通过。
1.00 表示道路还算正常,但有可能会恶化并造成拥堵。此时系统已经没有多余的资源了,管理员需要进行优化。
1.00-*** 表示路况不太好了,如果到达2.00表示有桥上车辆一倍数目的车辆正在等待。这种情况你必须进行检查了。
2、多核CPU - 多车道 - 数字/CPU核数 在0.00-1.00之间正常
多核CPU的话,满负荷状态的数字为 "1.00 * CPU核数",即双核CPU为2.00,四核CPU为4.00。
3、安全的系统平均负载
作者认为单核负载在0.7以下是安全的,超过0.7就需要进行优化了。
4、应该看哪一个数字,1分钟,5分钟还是15分钟?
作者认为看5分钟和15分钟的比较好,即后面2个数字。
5、怎样知道我的CPU是几核呢?
使用以下命令可以直接获得CPU核心数目
grep 'model name' /proc/cpuinfo | wc -l
结论
取得CPU核心数目N,观察后面2个数字,用数字/N,如果得到的值小于0.7即可无忧。
--------------------------------------------------------------
top(随便一台服务器top了一下 ) grep 'model name' /proc/cpuinfo | wc -l
32
--------------------------------------------------------------