top命令可以实时动态地查看系统的整体运行情况,是一个综合了多方信息监测系统性能和运行信息的实用工具。通过top命令所提供的互动式界面,用热键可以管理。
top(选项)
-b:以批处理模式操作;
-c:显示完整的治命令;
-d:屏幕刷新间隔时间;
-I:忽略失效过程;
-s:保密模式;
-S:累积模式;
-i<时间>:设置间隔时间;
-u<用户名>:指定用户名;
-p<进程号>:指定进程;
-n<次数>:循环显示的次数。
在top命令执行过程中可以使用的一些交互命令。这些命令都是单字母的,如果在命令行中使用了-s选项, 其中一些命令可能会被屏蔽。
h:显示帮助画面,给出一些简短的命令总结说明;
k:终止一个进程;
i:忽略闲置和僵死进程,这是一个开关式命令;
q:退出程序;
r:重新安排一个进程的优先级别;
S:切换到累计模式;
s:改变两次刷新之间的延迟时间(单位为s),如果有小数,就换算成ms。输入0值则系统将不断刷新,默认值是5s;
f或者F:从当前显示中添加或者删除项目;
o或者O:改变显示项目的顺序;
l:切换显示平均负载和启动时间信息;
m:切换显示内存信息;
t:切换显示进程和CPU状态信息;
c:切换显示命令名称和完整命令行;
M:根据驻留内存大小进行排序;
P:根据CPU使用百分比大小进行排序;
T:根据时间/累计时间进行排序;
w:将当前设置写入~/.toprc文件中。
详解:
[tongqianzhang@shwgq-t-tomcat-188-193 ~]$ top
top - 16:07:37 up 241 days, 20:11, 1 user, load average: 0.96, 1.13, 1.25
Tasks: 231 total, 1 running, 230 sleeping, 0 stopped, 0 zombie
Cpu(s): 12.7%us, 8.4%sy, 0.0%ni, 77.1%id, 0.0%wa, 0.0%hi, 1.8%si, 0.0%st
Mem: 12196436k total, 12056552k used, 139884k free, 64564k buffers
Swap: 2097144k total, 151016k used, 1946128k free, 3120236k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
18411 pplive 20 0 11.9g 7.8g 5372 S 220.2 67.1 16761:00 java
1875 pplive 20 0 3958m 127m 4564 S 4.6 1.1 12497:35 java
4 root 20 0 0 0 0 S 0.3 0.0 184:01.76 ksoftirqd/0
13 root 20 0 0 0 0 S 0.3 0.0 135:49.83 ksoftirqd/2
25 root 20 0 0 0 0 S 0.3 0.0 136:54.49 ksoftirqd/5
top命令的结果分为两个部分:
统计信息说明:
us
用户空间占用CPU百分比,例如:Cpu(s): 12.7%us,sy
内核空间占用CPU百分比,例如:8.4%sy,ni
用户进程空间内改变过优先级的进程占用CPU百分比,例如:0.0%ni,id
空闲CPU百分比,例如:77.1%id,wa
等待输入输出的CPU时间百分比,例如:0.0%wa,hi
CPU服务于硬件中断所耗费的时间总额,例如:0.0%hi,si
CPU服务软中断所耗费的时间总额,例如:1.8%si,st
Steal time 虚拟机被hypervisor偷去的CPU时间(如果当前处于一个hypervisor下的vm,实际上hypervisor也是要消耗一部分CPU处理时间的)在top命令中按f按可以查看显示的列信息,按对应字母来开启/关闭列,大写字母表示开启,小写字母表示关闭。带*号的是默认列。
PID
= (Process Id) 进程Id;USER
= (User Name) 进程所有者的用户名;PR
= (Priority) 优先级NI
= (Nice value) nice值。负值表示高优先级,正值表示低优先级VIRT
= (Virtual Image (kb)) 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RESRES
= (Resident size (kb)) 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATASHR
= (Shared Mem size (kb)) 共享内存大小,单位kbS
= (Process Status) 进程状态。D=不可中断的睡眠状态,R=运行,S=睡眠,T=跟踪/停止,Z=僵尸进程%CPU
= (CPU usage) 上次更新到现在的CPU时间占用百分比%MEM
= (Memory usage (RES)) 进程使用的物理内存百分比TIME
+ = (CPU Time, hundredths) 进程使用的CPU时间总计,单位1/100秒 PPID
= (Parent Process Pid) 父进程Id RUSER
= (Real user name) UID
= (User Id) 进程所有者的用户id GROUP
= (Group Name) 进程所有者的组名 TTY
= (Controlling Tty) 启动进程的终端名。不是从终端启动的进程则显示为 ? P
= (Last used cpu (SMP)) 最后使用的CPU,仅在多CPU环境下有意义 SWAP
= (Swapped size (kb)) 进程使用的虚拟内存中,被换出的大小,单位kb TIME
= (CPU Time) 进程使用的CPU时间总计,单位秒 CODE
= (Code size (kb)) 可执行代码占用的物理内存大小,单位kb DATA
= (Data+Stack size (kb)) 可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb nFLT
= (Page Fault count) 页面错误次数 nDRT
= (Dirty Pages count) 最后一次写入到现在,被修改过的页面数 WCHAN
= (Sleeping in Function) 若该进程在睡眠,则显示睡眠中的系统函数名 Flags
= (Task Flags COMMAND
= (Command name/line) 命令名/命令行Fields Management for window 1:Def, whose current sort field is %CPU
Navigate with Up/Dn, Right selects for move then
'd' or
* PID = Process Id SWAP = Swapped Size (KiB)
* USER = Effective User Name CODE = Code Size (KiB)
* PR = Priority DATA = Data+Stack (KiB)
* NI = Nice Value nMaj = Major Page Faults
* VIRT = Virtual Image (KiB) nMin = Minor Page Faults
* RES = Resident Size (KiB) nDRT = Dirty Pages Count
* SHR = Shared Memory (KiB) WCHAN = Sleeping in Function
* S = Process Status Flags = Task Flags
* %CPU = CPU Usage CGROUPS = Control Groups
* %MEM = Memory Usage (RES) SUPGIDS = Supp Groups IDs
* TIME+ = CPU Time, hundredths SUPGRPS = Supp Groups Names
* COMMAND = Command Name/Line TGID = Thread Group Id
PPID = Parent Process pid ENVIRON = Environment vars
UID = Effective User Id vMj = Major Faults delta
RUID = Real User Id vMn = Minor Faults delta
RUSER = Real User Name USED = Res+Swap Size (KiB)
SUID = Saved User Id nsIPC = IPC namespace Inode
SUSER = Saved User Name nsMNT = MNT namespace Inode
GID = Group Id nsNET = NET namespace Inode
GROUP = Group Name nsPID = PID namespace Inode
PGRP = Process Group Id nsUSER = USER namespace Inode
TTY = Controlling Tty nsUTS = UTS namespace Inode
TPGID = Tty Process Grp Id
SID = Session Id
nTH = Number of Threads
P = Last Used Cpu (SMP)
TIME = CPU Time
-b
:以批处理模式操作;-c
:显示完整的治命令;-d
:屏幕刷新间隔时间;-I
:忽略失效过程;-s
:保密模式;-S
:累积模式;-i<时间>
:设置间隔时间;-u<用户名>
:指定用户名;-p<进程号>
:指定进程;-n<次数>
:循环显示的次数。Help for Interactive Commands - procps version 3.2.8
Window 1:Def: Cumulative mode Off. System: Delay 3.0 secs; Secure mode Off.
Z,B Global: 'Z' change color mappings; 'B' disable/enable bold
Z:修改颜色配置;B:关闭/开启粗体
l,t,m Toggle Summaries: 'l' load avg; 't' task/cpu stats; 'm' mem info
l:隐藏/显示第1行负载信息;t:隐藏/显示第2~3行CPU信息;m:隐藏/显示第4~5行内存信息;
1,I Toggle SMP view: '1' single/separate states; 'I' Irix/Solaris mode
1:单行/多行显示CPU信息;I:Irix/Solaris模式切换
f,o . Fields/Columns: 'f' add or remove; 'o' change display order
f:列显示控制;o:列排序控制,按字母进行调整
F or O . Select sort field 选择排序列
<,> . Move sort field: '<' next col left; '>' next col right 上下移动内容
R,H . Toggle: 'R' normal/reverse sort; 'H' show threads
R:内容排序;H:显示线程
c,i,S . Toggle: 'c' cmd name/line; 'i' idle tasks; 'S' cumulative time
c:COMMAND列命令名称与完整命令行路径切换;i:忽略闲置和僵死进程开关;S:累计模式切换
x,y . Toggle highlights: 'x' sort field; 'y' running tasks
x:列排序;y:运行任务
z,b . Toggle: 'z' color/mono; 'b' bold/reverse (only if 'x' or 'y')
z:颜色模式;b:粗体开关 仅适用于x,y模式中
u . Show specific user only 按用户进行过滤,当输入错误可按Ctrl + Backspace进行删除
n or # . Set maximum tasks displayed 设置进程最大显示条数
k,r Manipulate tasks: 'k' kill; 'r' renice
k:终止一个进程;r:重新设置一个进程的优先级别
d or s Set update interval 改变两次刷新之间的延迟时间(单位为s),如果有小数,就换算成ms。输入0值则系统将不断刷新,默认值是5s;
W Write configuration file 将当前设置写入~/.toprc文件中
q Quit 退出
( commands shown with '.' require a visible task display window )
注意:带.的命令需要一个可见的任务显示窗口
Press 'h' or '?' for help with Windows, any other key to continue
多核CPU监控
查看多核CPU命令 : mpstat -P ALL 和 sar -P ALL
在top基本视图中,按键盘数字“1”,可监控每个逻辑CPU的状况:
转存失败重新上传取消
top视图 02
观察上图,服务器有16个逻辑CPU,实际上是4个物理CPU。
进程字段排序
默认进入top时,各进程是按照CPU的占用量来排序的,在【top视图 01】中进程ID为14210的Java进程排在第一(cpu占用100%),进程ID为14183的java进程排在第二(cpu占用12%)。可通过键盘指令来改变排序字段,比如想监控哪个进程占用MEM最多,我一般的使用方法如下:
1. 敲击键盘“b”(打开/关闭加亮效果),top的视图变化如下:
转存失败重新上传取消
top视图 03
我们发现进程id为10704的“top”进程被加亮了,top进程就是视图第二行显示的唯一的运行态(runing)的那个进程,可以通过敲击“y”键关闭或打开运行态进程的加亮效果。
2. 敲击键盘“x”(打开/关闭排序列的加亮效果),top的视图变化如下:
top视图 04
可以看到,top默认的排序列是“%CPU”。
3. 通过”shift + >”或”shift + <”可以向右或左改变排序列,下图是按一次”shift + >”的效果图:
top视图 05
视图现在已经按照%MEM来排序了。
改变进程显示字段
1. 敲击“f”键,top进入另一个视图,在这里可以编排基本视图中的显示字段:
转存失败重新上传取消
top视图 06
这里列出了所有可在top基本视图中显示的进程字段,有”*”并且标注为大写字母的字段是可显示的,没有”*”并且是小写字母的字段是不显示的。如果要在基本视图中显示“CODE”和“DATA”两个字段,可以通过敲击“r”和“s”键:
top视图 07
2. “回车”返回基本视图,可以看到多了“CODE”和“DATA”两个字段:
top视图 08
top命令的补充
top命令是Linux上进行系统监控的首选命令,但有时候却达不到我们的要求,比如当前这台服务器,top监控有很大的局限性。这台服务器运行着websphere集群,有两个节点服务,就是【top视图 01】中的老大、老二两个java进程,top命令的监控最小单位是进程,所以看不到我关心的java线程数和客户连接数,而这两个指标是java的web服务非常重要的指标,通常我用ps和netstate两个命令来补充top的不足。
上面两个命令,可改动grep的参数,来达到更细致的监控要求。
在Linux系统“一切都是文件”的思想贯彻指导下,所有进程的运行状态都可以用文件来获取。系统根目录/proc中,每一个数字子目录的名字都是运行中的进程的PID,进入任一个进程目录,可通过其中文件或目录来观察进程的各项运行指标,例如task目录就是用来描述进程中线程的,因此也可以通过下面的方法获取某进程中运行中的线程数量(PID指的是进程ID):
在linux中还有一个命令pmap,来输出进程内存的状况,可以用来分析线程堆栈:
pmap PID