目的:经常用top来监控linux的系统状况,但列出的细节信息却一知半解,基本只会看cpu idle ,找出一个时间来仔细分析一下这个命令中的细节。
1.查看多核或多cpu
2.top基本视图
2.1 第一行
- 16:19:28--当前系统时间
- 4 days 32min 系统已经运行了4天32分钟(在这期间没有重启)
- 5 users: 当前有5个用户登录系统
- load average;0.41, 0.44, 0.43 -- load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况
说明:
load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。
2.2 第二行
- Tasks--任务(进程),系统现在共有323个进程
- running -- 正在运行
- sleeping -- 正在休眠
- stopped -- 停止的是0个
- zombie状态(僵尸) -- 僵尸状态的有1个!
如果发现了僵尸进程就要把它杀死:
第一步:找出来
ps -e -o stat,ppid,pid,cmd | egrep '^[Zz]'
或
ps -ef | grep "defunct"
第二步:结束进程
说明:
ps:ps命令用于获取当前系统的进程信息.
-e:参数用于列出所有的进程
-o:参数用于设定输出格式,这里只输出进程的stat(状态信息)、ppid(父进程pid)、pid(当前进程的pid),cmd(即进程的可执行文件。
egrep:是linux下的正则表达式工具
'^[Zz]':这是正则表达式,^表示第一个字符的位置,[Zz],表示z或者大写的Z字母,即表示第一个字符为Z或者z开头的进程数据,只所以这样是因为僵尸进程的状态信息以Z或者z字母开头。
2.3 第三行:cpu 状态
- us -- 用户空间占用cpu的百分比
- sy -- 内核空间占用CPU的百分比
- ni -- 改变过优先级的进程占用CPU的百分比
- id -- 空闲CPU百分比
- wa -- IO等待占用CPU的百分比
- hi -- 硬中断(Hardware IRQ)占用CPU的百分比
- si -- 软中断(Software Interrupts)占用CPU的百分比
说明:
内核空间中存放的是内核代码和数据,而进程的用户空间中存放的是用户程序的代码和数据
2.4 第四行:内存状态
- total -- 物理内存总量8GB
- used -- 使用中的内存总量7.6GB
- free -- 空闲内存总量372M
- buffers -- 缓存的内存量737M
2.5 第五行:swap 交换分区
- total -- 交换区总量
- used -- 使用的交换区总量
- free -- 空闲交换区总量
- cached -- 缓冲的交换区总量
说明:关于内存
不能用windows的内存概念理解这些数据,如果按windows的方式此台服务器“危矣”:8G的内存总量只剩下372M的可用内存.
第四行中使用中的内存总量(used)指的是现在系统内核控制的内存数,空闲内存总量(free)是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中,还包括过去使用过的现在可以被重复利用的内存,内核并不把这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少,但不用为此担心。
第四行的free + 第四行的buffers + 第五行的cached,按这个公式此台服务器的可用内存:
372976 + 737960 + 1484680 = 2595616,还有2.5G的可用内存。
2.6 第六行:空
2.7 第七行:各进程(任务)的状态监控
- PID — 进程id
- USER — 进程所有者
- PR — 进程优先级
- NI — nice值。负值表示高优先级,正值表示低优先级
- VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
- RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
- SHR — 共享内存大小,单位kb
- S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
- %CPU — 上次更新到现在的CPU时间占用百分比
- %MEM — 进程使用的物理内存百分比
- TIME+ — 进程使用的CPU时间总计,单位1/100秒
- COMMAND — 进程名称(命令名/命令行)
3.多核cpu的使用情况
方法:进入top基本视图后,按‘1’
说明:
①
物理CPU
实际Server中插槽上的CPU个数
物理cpu数量,可以数不重复的 physical id 有几个
~$ cat /proc/cpuinfo |grep "physical id"|sort |uniq|wc -l
1
② 逻辑CPU
Linux用户对 /proc/cpuinfo 这个文件肯定不陌生. 它是
用来存储cpu硬件信息的
信息内容分别列出了processor 0 – n 的规格。这里需要注意,如果你认为n就是真实的cpu数的话, 就大错特错了
一般情况,我们认为一颗cpu可以有多核,加上intel的超线程技术(HT), 可以在逻辑上再分一倍数量的cpu core出来
逻辑CPU数量=物理cpu数量 x cpu cores 这个规格值 x 2(如果支持并开启ht)
备注一下:Linux下top查看的CPU也是逻辑CPU个数
~$ cat /proc/cpuinfo |grep "processor"|wc -l
8
③ CPU核数
一块CPU上面能处理数据的芯片组的数量、比如现在的i5 760,是双核心四线程的CPU、而 i5 2250 是四核心四线程的CPU
一般来说,物理CPU个数×每颗核数就应该等于逻辑CPU的个数,如果不相等的话,则表示服务器的CPU支持超线程技术
~$ cat /proc/cpuinfo |grep "cores"|uniq
cpu cores : 4
分析:
我现在的pc是1个cpu, 每个cpu有4个core, 支持超线程,所以显示逻辑cpu为8
4.top中的进程字段排序
默认排序:按照CPU的占用量
改变排序列:通过”shift + >”或”shift + <”可以向右或左改变排序列
5.系统监控命令的补充
ps -eLf | grep
process_name
| wc -l
netstat -n | grep tcp | grep 侦听端口 | wc -l