在项目性能测试的中,经常需要监控服务器,DB服务器的各项计算器,其中在LINUX下我们最常用的命令实时查看命令TOP,用的最多,但真正对这一命令的各项值,确又了解甚微,甚至根本不知道这些值所代表的含义,及是如何得出来的:
在谷哥一些资料后,将其各项的字段所代表的含义及其来源,以做为记录:
在TOP命令中有一行CPU的中信息:us,sy,ni,wa,si,hi,st,其中us,sy,是CPU是用户态使用的CPU时间百分比,sy是系统使用CPU时间的百分比,ni是用做nice加权的进程分配用户态使用CPU时间的百分比,wa是CPU等待硬盘写入完成时间的百分比,hi是硬中断消耗时间百分比,si是软中断消耗时间的百分比,ST是虚拟机偷取时间的百分比,这些百分比的来源如下:
将文件从磁盘的src位置拷贝到磁盘的dst位置。文件会从src先读取进入到内核空间,然后再读取到用户空间,然后拷贝数据到用户空间的buf上,再通过用户空间,内核空间,数据才到磁盘的dst上。
所以从上面这个程序来看,cpu消耗在kernel space的时候就是sy(系统态使用的cpu百分比),cpu消耗在user space的时候就是us(用户态使用的cpu百分比)。
如果程序都没什么问题,那么是没有hi和si的,但是实际上有个硬中断和软中断的概念。比如硬中断,cpu在执行程序的时候,突然外设硬件(比如硬盘出现问题了)机器需要立刻通知cpu进行现场保存工作。这个时候会cpu会出现上下文切换。就是cpu会有一部分时间会被硬中断占用了,这个时间就是hi。相类似,si是软中断的cpu占用时间,软中断是由软件的指令方式触发的。
ni是nice的意思,nice是什么呢,每个linux进程都有个优先级,优先级高的进程有优先执行的权利,这个叫做pri。进程除了优先级外,还有个优先级的修正值。即比如你原先的优先级是20,然后修正值为-2,那么你最后的进程优先级为18。这个修正值就叫做进程的nice值。
wa指的是CPU等待磁盘写入完成的时间,就是说前提是要进行IO操作,在进行IO操作的时候,CPU等待时间。比如上面那个程序,最后一步,从系统空间到dst硬盘空间的时候,如果程序是阻塞的,那么这个时候cpu就要等待数据写入磁盘才能完成写操作了。所以这个时候cpu等待的时间就是wa。
st的名字很生动,偷取。。。是专门对虚拟机来说的,一台物理是可以虚拟化出几台虚拟机的。在其中一台虚拟机上用top查看发现st不为0,就说明本来有这么多个cpu时间是安排给我这个虚拟机的,但是由于某种虚拟技术,把这个cpu时间分配给了其他的虚拟机了。这就叫做偷取。
剩下的id就是除了上面那么多cpu处理上下文以外的cpu时间片。当然在这些时间片上,cpu是空闲的。
dstat命令
可以查看相应的字段的数据统计
%mem 内存使用率
virt 是虚拟内存
res是常驻内存
shr是共享内存
op命令下按f键可以看到详细说明
* A: PID = Process Id
* E: USER = User Name
* H: PR = Priority
* I: NI = Nice value
* O: VIRT = Virtual Image (kb)
* Q: RES = Resident size (kb)
* T: SHR = Shared Mem size (kb)
* W: S = Process Status
* K: %CPU = CPU usage
* N: %MEM = Memory usage (RES)
* M: TIME+ = CPU Time, hundredths
b: PPID = Parent Process Pid
c: RUSER = Real user name
d: UID = User Id
f: GROUP = Group Name
g: TTY = Controlling Tty
j: P = Last used cpu (SMP)
p: SWAP = Swapped size (kb)
l: TIME = CPU Time
r: CODE = Code size (kb)
s: DATA = Data+Stack size (kb)
u: nFLT = Page Fault count
v: nDRT = Dirty Pages count
y: WCHAN = Sleeping in Function
z: Flags = Task Flags
* X: COMMAND = Command name/line
top命令下要查看某个用户启动的进程:先输入u,然后输入用户名,再回车
VIRT:virtual memory usage。Virtual这个词很神,一般解释是:virtual adj.虚的, 实质的, [物]有效的, 事实上的。到底是虚的还是实的?让Google给Define之后,将就明白一点,就是这东西还是非物质的,但是有效果的,不发生在真实世界的,发生在软件世界的等等。这个内存使用就是一个应用占有的地址空间,只是要应用程序要求的,就全算在这里,而不管它真的用了没有。写程序怕出错,又不在乎占用的时候,多开点内存也是很正常的。
RES:resident memory usage。常驻内存。这个值就是该应用程序真的使用的内存,但还有两个小问题,一是有些东西可能放在交换盘上了(SWAP),二是有些内存可能是共享的。
SHR:shared memory。共享内存。就是说这一块内存空间有可能也被其他应用程序使用着;而Virt - Shr似乎就是这个程序所要求的并且没有共享的内存空间。
DATA:数据占用的内存。如果top没有显示,按f键可以显示出来。这一块是真正的该程序要求的数据空间,是真正在运行中要使用的。
============================================
top里面描述进程内存使用量的数据来源于/proc/$pid/statm这个文件。通过观察kernel的代码就能弄清楚SHR,VIRT和RES这些数值的具体含义。
Linux通过一个叫做 task_statm 的函数来返回进程的内存使用状况
int task_statm(struct mm_struct *mm, int *shared, int *text,
int *data, int *resident)
{
*shared = get_mm_counter(mm, file_rss);
*text = (PAGE_ALIGN(mm->end_code) - (mm->start_code & PAGE_MASK))
>> PAGE_SHIFT;
*data = mm->total_vm - mm->shared_vm;
*resident = *shared + get_mm_counter(mm, anon_rss);
return mm->total_vm;
}
上面的代码中shared就是page cache里面实际使用了的物理内存的页数,text是代码所占用的页
数,data是总虚拟内存页数减去共享的虚拟内存页数,resident是所有在使用的物理内存的页
数。最后返回的mm->total_vm是进程虚拟内存的寻址空间大小。
函数get_mm_counter并不会做什么计算,它的功能是保证数值读取的原子性。
上面的数值最后会通过 procfs输出 到/proc/$pid/statm中去。他们与top显示的数值对应关系如下。
SHR: shared
RES: resident
VIRT: mm->total_vm
CODE: code
DATA: data
=======================================
o: VIRT (Virtual Image) - 进程使用的总虚拟内存 (virtual memory) 大小,包括进程的程序码、资料和共享程序库再加上被置换 (swap out) 的空间。VIRT = SWAP + RES
p: SWAP (Swapped size) - 进程被置换的虚拟内存空间大小。
q: RES (Resident size) - 进程非被置换的实体内存大小。RES = CODE + DATA
r: CODE' (Code size) - 进程的程序码在实体内存佔用空间大小,亦叫作 text resident set (TRS)。
s: DATA (Data+Stack size) - 进程佔用实体内存中的非程序码部份大小,亦叫作 data resident set (DRS)。
t: SHR (Shared Mem size) - 进程使用的共享内存大小,即可以和其他进程共享的内存空间。
n: %MEM (Memory usage) - 进程佔用实体内存大小对系统总实体内存大小的比例,以百分比显示。