TOP命令的解析及使用

承接上一次VMSTAT的解析之后,来看一下另一个重要的诊断工具top
top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器

oracle@oracle [/home/oracle] top

top - 12:13:31 up 130 days, 17:36,  3 users,  load average: 0.20, 0.18, 0.58
Tasks: 199 total,   1 running, 194 sleeping,   0 stopped,   4 zombie
Cpu(s):  1.7%us,  0.2%sy,  0.0%ni, 97.9%id,  0.2%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8178424k total,  8133072k used,    45352k free,    10604k buffers
Swap: 163838892k total,   194732k used, 163644160k free,  6791868k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
11218 oracle    15   0 5270m 5.0g 5.0g S  8.0 64.5   1:45.07 oracle
    1 root      15   0 10348  312  280 S  0.0  0.0   0:40.50 init
    2 root      RT  -5     0    0    0 S  0.0  0.0   0:01.84 migration/0
    3 root      34  19     0    0    0 S  0.0  0.0   2:35.73 ksoftirqd/0
    4 root      RT  -5     0    0    0 S  0.0  0.0   0:00.00 watchdog/0
    5 root      RT  -5     0    0    0 S  0.0  0.0   0:00.48 migration/1
    6 root      34  19     0    0    0 S  0.0  0.0   0:14.11 ksoftirqd/1
    7 root      RT  -5     0    0    0 S  0.0  0.0   0:00.00 watchdog/1
    8 root      RT  -5     0    0    0 S  0.0  0.0   0:00.83 migration/2
    9 root      34  19     0    0    0 S  0.0  0.0   0:16.29 ksoftirqd/2
   10 root      RT  -5     0    0    0 S  0.0  0.0   0:00.00 watchdog/2
   11 root      RT  -5     0    0    0 S  0.0  0.0   0:00.77 migration/3
   12 root      34  19     0    0    0 S  0.0  0.0   0:01.23 ksoftirqd/3
   13 root      RT  -5     0    0    0 S  0.0  0.0   0:00.00 watchdog/3
   14 root      10  -5     0    0    0 S  0.0  0.0   0:00.65 events/0
   15 root      10  -5     0    0    0 S  0.0  0.0   0:00.46 events/1
   16 root      10  -5     0    0    0 S  0.0  0.0   0:00.28 events/2


一.  TOP前五行统计信息

统计信息区前五行是系统整体的统计信息。

1. 第一行是任务队列信息
同 uptime  命令的执行结果:
[root@localhost ~]# uptime
2:13:31 up 130 days, 17:36,  3 users,  load average: 0.20, 0.18, 0.58
其内容如下:
2:13:31   当前时间
up 130 days  系统运行时间,格式为时:天
3 user  当前登录用户数
load average: 0.20, 0.18, 0.58  系统负载,即任务队列的平均长度。 三个数值分别为  1分钟、5分钟、15分钟前到现在的平均值。

2. 第二、三行为进程和CPU的信息
当有多个CPU时,这些内容可能会超过两行。内容如下:
Tasks: 199 total                    进程总数
1 running                                正在运行的进程数
194 sleeping                         睡眠的进程数
0 stopped                               停止的进程数
4 zombie                                 僵尸进程数
Cpu(s): 0.3% us                    用户空间占用CPU百分比
1.0% sy                                   内核空间占用CPU百分比
0.0% ni                                    用户进程空间内改变过优先级的进程占用CPU百分比
98.7% id                                  空闲CPU百分比
0.0% wa                                  等待输入输出的CPU时间百分比
0.0% hi
0.0% si

3. 第四五行为内存信息。
内容如下:
Mem: 8178424k total              物理内存总量
8133072k used                       使用的物理内存总量
45352k free                              空闲内存总量
10604k buffers                        用作内核缓存的内存量
Swap: 163838892k total       交换区总量
194732k used                         使用的交换区总量
163644160k free                    空闲交换区总量
6791868k cached                   缓冲的交换区总量。
内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖, 该数值即为这些内容已存在于内存中的交换区的大小。相应的内存再次被换出时可不必再对交换区写入

二.  进程信息

列名                                           含义
PID                                            进程id
PPID                                          父进程id
RUSER                                     Real user name
UID                                            进程所有者的用户id
USER                                        进程所有者的用户名
GROUP                                    进程所有者的组名
TTY                                            启动进程的终端名。不是从终端启动的进程则显示为 ?
PR                                             优先级
NI                                               nice值。负值表示高优先级,正值表示低优先级
P                                                最后使用的CPU,仅在多CPU环境下有意义
%CPU                                      上次更新到现在的CPU时间占用百分比
TIME                                          进程使用的CPU时间总计,单位秒
TIME+                                        进程使用的CPU时间总计,单位1/100秒
%MEM                                       进程使用的物理内存百分比
VIRT                                           进程使用的虚拟内存总量,单位kb
VIRT=SWAP+RESSWAP       进程使用的虚拟内存中,被换出的大小,单位kb。
RES                                           进程使用的、未被换出的物理内存大小,单位kb
RES=CODE+DATACODE     可执行代码占用的物理内存大小,单位kb
DATA                                         可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb
SHR                                           共享内存大小,单位kb
nFLT                                          页面错误次数
nDRT                                        最后一次写入到现在,被修改过的页面数。
S                                                进程状态。
                                                   D=不可中断的睡眠状态
                                                   R=运行
                                                   S=睡眠
                                                   T=跟踪/停止
                                                   Z=僵尸进程
COMMAND                              命令名/命令行
WCHAN                                   若该进程在睡眠,则显示睡眠中的系统函数名
Flags                                        任务标志,参考 sched.h
 
TOP的参数解析

参数:
-d : 后面可以接秒数,就是整个程序画面更新的秒数。预设是 5秒;
-b : 以批次的方式执行 top ,还有更多的参数可以使用喔! 
          通常会搭配数据流重导向来将批次的结果输出成为档案。
-n : 与 -b 搭配,意义是,需要进行几次 top 的输出结果。
-p : 指定某些个 PID来进行观察监测而已。
          在 top 执行过程当中可以使用的按键指令:
? :  显示在 top 当中可以输入的按键指令;
P:   以 CPU的使用资源排序显示;
M:   以 Memory 的使用资源排序显示;
N:   以 PID来排序喔!
T:   由该 Process 使用的 CPU时间累积 (TIME+) 排序。
k :   给予某个 PID一个讯号 (signal)
r :   给予某个 PID重新制订一个 nice 值。


范例1:每两秒钟更新一次   oracle@oracle [/home/oracle] top -d 2
范例2:将结果输出到/tmp/top.txt         oracle@oracle [/home/oracle] top -b -n 2 > /tmp/top.txt
范例3:假设10218是一个已经存在的pid,观察该进程

oracle@oracle [/home/oracle] top -d 2 -p 11218
top - 12:53:23 up 130 days, 18:15,  3 users,  load average: 0.24, 0.18, 0.21
Tasks:   1 total,   0 running,   1 sleeping,   0 stopped,   0 zombie
Cpu(s):  3.1%us,  2.9%sy,  0.0%ni, 93.4%id,  0.5%wa,  0.0%hi,  0.1%si,  0.0%st
Mem:   8178424k total,  8128604k used,    49820k free,    10460k buffers
Swap: 163838892k total,   194732k used, 163644160k free,  6781040k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
11218 oracle    15   0 5270m 5.0g 5.0g S 10.5 64.5   5:18.06 oracle


top命令一般只用来简单的查看一下cpu和内存使用,看看你自己的进程占用的高不高,另外注意看看那个load averge负载,负载高不高什么的,一般零点几就没什么问题的。而且正常要压力

起来的时候,你的进程的cpu和内存使用会很高的,但如果没有压力他也很高,那就有问题了。
另外的注意看他的内存上涨情况,如果你的进程跑的这段时间,内存一直在涨,注意下会不会有内存泄露问题。
结合上一次的VMSTAT命令,找出系统的瓶颈,是CPU的问题,

 

你可能感兴趣的:(LINUX)