Linux中的top细节

目的:经常用top来监控linux的系统状况,但列出的细节信息却一知半解,基本只会看cpu idle ,找出一个时间来仔细分析一下这个命令中的细节。

1.查看多核或多cpu

$ cat /proc/cpuinfo

2.top基本视图


2.1 第一行

  • 16:19:28--当前系统时间
  • 4 days 32min  系统已经运行了4天32分钟(在这期间没有重启)
  • 5 users: 当前有5个用户登录系统
  • load average;0.41, 0.44, 0.43 --  load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况
说明:
load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。

2.2 第二行

  • Tasks--任务(进程),系统现在共有323个进程
  • running -- 正在运行
  • sleeping -- 正在休眠
  • stopped -- 停止的是0个
  • zombie状态(僵尸) -- 僵尸状态的有1个!

如果发现了僵尸进程就要把它杀死:
第一步:找出来
ps -e -o stat,ppid,pid,cmd | egrep '^[Zz]'
ps -ef | grep "defunct"
第二步:结束进程
kill -9 父进程pid号

说明:
ps:ps命令用于获取当前系统的进程信息.

-e:参数用于列出所有的进程

-o:参数用于设定输出格式,这里只输出进程的stat(状态信息)、ppid(父进程pid)、pid(当前进程的pid),cmd(即进程的可执行文件。

egrep:是linux下的正则表达式工具

'^[Zz]':这是正则表达式,^表示第一个字符的位置,[Zz],表示z或者大写的Z字母,即表示第一个字符为Z或者z开头的进程数据,只所以这样是因为僵尸进程的状态信息以Z或者z字母开头。

2.3 第三行:cpu 状态

  • us -- 用户空间占用cpu的百分比
  • sy -- 内核空间占用CPU的百分比
  • ni -- 改变过优先级的进程占用CPU的百分比
  • id -- 空闲CPU百分比
  • wa -- IO等待占用CPU的百分比
  • hi -- 硬中断(Hardware IRQ)占用CPU的百分比
  • si --  软中断(Software Interrupts)占用CPU的百分比
说明:
内核空间中存放的是内核代码和数据,而进程的用户空间中存放的是用户程序的代码和数据

2.4 第四行:内存状态

  • total -- 物理内存总量8GB
  • used -- 使用中的内存总量7.6GB
  • free -- 空闲内存总量372M
  • buffers -- 缓存的内存量737M

2.5 第五行:swap 交换分区

  • total -- 交换区总量
  • used -- 使用的交换区总量
  • free -- 空闲交换区总量
  • cached -- 缓冲的交换区总量
说明:关于内存
不能用windows的内存概念理解这些数据,如果按windows的方式此台服务器“危矣”:8G的内存总量只剩下372M的可用内存.
第四行中使用中的内存总量(used)指的是现在系统内核控制的内存数,空闲内存总量(free)是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中,还包括过去使用过的现在可以被重复利用的内存,内核并不把这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少,但不用为此担心。
第四行的free + 第四行的buffers + 第五行的cached,按这个公式此台服务器的可用内存:
372976 + 737960 + 1484680 = 2595616,还有2.5G的可用内存。

2.6 第六行:空

2.7 第七行:各进程(任务)的状态监控

  • PID — 进程id
  • USER — 进程所有者
  • PR — 进程优先级
  • NI — nice值。负值表示高优先级,正值表示低优先级
  • VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
  • RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
  • SHR — 共享内存大小,单位kb
  • S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
  • %CPU — 上次更新到现在的CPU时间占用百分比
  • %MEM — 进程使用的物理内存百分比
  • TIME+ — 进程使用的CPU时间总计,单位1/100秒
  • COMMAND — 进程名称(命令名/命令行)

3.多核cpu的使用情况
方法:进入top基本视图后,按‘1’

说明:
  ① 物理CPU               
  实际Server中插槽上的CPU个数
  物理cpu数量,可以数不重复的 physical id 有几个  
 
~$ cat /proc/cpuinfo |grep "physical id"|sort |uniq|wc -l  
1
    
  ② 逻辑CPU               
  Linux用户对 /proc/cpuinfo 这个文件肯定不陌生. 它是 用来存储cpu硬件信息的
  信息内容分别列出了processor 0 – n 的规格。这里需要注意,如果你认为n就是真实的cpu数的话, 就大错特错了
  一般情况,我们认为一颗cpu可以有多核,加上intel的超线程技术(HT), 可以在逻辑上再分一倍数量的cpu core出来
  逻辑CPU数量=物理cpu数量 x cpu cores 这个规格值 x 2(如果支持并开启ht)
  备注一下:Linux下top查看的CPU也是逻辑CPU个数  

~$ cat /proc/cpuinfo |grep "processor"|wc -l  
8
       
  ③ CPU核数           
  一块CPU上面能处理数据的芯片组的数量、比如现在的i5 760,是双核心四线程的CPU、而 i5 2250 是四核心四线程的CPU              
  一般来说,物理CPU个数×每颗核数就应该等于逻辑CPU的个数,如果不相等的话,则表示服务器的CPU支持超线程技术
~$ cat /proc/cpuinfo |grep "cores"|uniq  
cpu cores : 4
分析:
我现在的pc是1个cpu, 每个cpu有4个core, 支持超线程,所以显示逻辑cpu为8

4.top中的进程字段排序
默认排序:按照CPU的占用量
改变排序列:通过”shift + >”或”shift + <”可以向右或左改变排序列

5.系统监控命令的补充
  • 监控 process_name 线程数:

ps -eLf | grep  process_name | wc -l

  • 监控网络客户连接数:

netstat -n | grep tcp | grep 侦听端口 | wc -l





你可能感兴趣的:(Linux)