Linux进程管理与性能监控

1. 进程管理工具

这一节我们介绍进程管理工具;

使用进程管理工具,我们可以查询程序当前的运行状态,或终止一个进程;

任何进程都与文件关联;我们会用到lsof工具(list opened files),作用是列举系统中已经被打开的文件。在linux环境中,任何事物都是文件,设备是文件,目录是文件,甚至sockets也是文件。用好lsof命令,对日常的linux管理非常有帮助。

1.1. 查询进程

查询正在运行的进程信息

$ps -ef

eg:查询归属于用户colin115的进程

$ps -ef | grep colin115
$ps -lu colin115

查询进程ID(适合只记得部分进程字段)

$pgrep 查找进程

eg:查询进程名中含有re的进程
[/home/weber#]pgrep -l re
2 kthreadd
28 ecryptfs-kthrea
29515 redis-server

以完整的格式显示所有的进程

$ps -ajx

显示进程信息,并实时更新

$top

查看端口占用的进程状态:

lsof -i:3306

查看用户username的进程所打开的文件

$lsof -u username

查询init进程当前打开的文件

$lsof -c init

查询指定的进程ID(23295)打开的文件:

$lsof -p 23295

查询指定目录下被进程开启的文件(使用+D 递归目录):

$lsof +d mydir1/

1.2. 终止进程

杀死指定PID的进程 (PID为Process ID)

$kill PID

杀死相关进程

kill -9 3434

杀死job工作 (job为job number)

$kill %job

1.3. 进程监控

查看系统中使用CPU、使用内存最多的进程;

$top
(->)P

输入top命令后,进入到交互界面;接着输入字符命令后显示相应的进程状态:

对于进程,平时我们最常想知道的就是哪些进程占用CPU最多,占用内存最多。以下两个命令就可以满足要求:

P:根据CPU使用百分比大小进行排序。
M:根据驻留内存大小进行排序。
i:使top不显示任何闲置或者僵死进程。

这里介绍最使用的几个选项,对于更详细的使用,详见top linux下的任务管理器

1.4. 分析线程栈

使用命令pmap,来输出进程内存的状况,可以用来分析线程堆栈;

$pmap PID

eg:
[/home/weber#]ps -fe| grep redis
weber    13508 13070  0 08:14 pts/0    00:00:00 grep --color=auto redis
weber    29515     1  0  2013 ?        02:55:59 ./redis-server redis.conf
[/home/weber#]pmap 29515
29515:   ./redis-server redis.conf
08048000    768K r-x--  /home/weber/soft/redis-2.6.16/src/redis-server
08108000      4K r----  /home/weber/soft/redis-2.6.16/src/redis-server
08109000     12K rw---  /home/weber/soft/redis-2.6.16/src/redis-server

1.5. 综合运用

将用户colin115下的所有进程名以av_开头的进程终止:

ps -u colin115 |  awk '/av_/ {print "kill -9 " $1}' | sh

将用户colin115下所有进程名中包含HOST的进程终止:

ps -fe| grep colin115|grep HOST |awk '{print $2}' | xargs kill -9;

2.性能监控

在使用操作系统的过程中,我们经常需要查看当前的性能如何,需要了解CPU、内存和硬盘的使用情况; 本节介绍的这几个工具能满足日常工作要求;

2.1. 监控CPU

查看CPU使用率

$sar -u

eg:
$sar -u 1 2
[/home/weber#]sar -u 1 2
Linux 2.6.35-22-generic-pae (MyVPS)     06/28/2014      _i686_  (1 CPU)

09:03:59 AM     CPU     %user     %nice   %system   %iowait    %steal     %idle
09:04:00 AM     all      0.00      0.00      0.50      0.00      0.00     99.50
09:04:01 AM     all      0.00      0.00      0.00      0.00      0.00    100.00

后面的两个参数表示监控的频率,比如例子中的1和2,表示每秒采样一次,总共采样2次;

查看CPU平均负载

$sar -q 1 2

sar指定-q后,就能查看运行队列中的进程数、系统上的进程大小、平均负载等;

2.2. 查询内存

查看内存使用状况 sar指定-r之后,可查看内存使用状况;

$sar -r 1 2
09:08:48 AM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact
09:08:49 AM     17888    359784     95.26     37796     73272    507004     65.42    137400    150764
09:08:50 AM     17888    359784     95.26     37796     73272    507004     65.42    137400    150764
Average:        17888    359784     95.26     37796     73272    507004     65.42    137400    150764

查看内存使用量

$free -m

2.3. 查询页面交换

查看页面交换发生状况 页面发生交换时,服务器的吞吐量会大幅下降;服务器状况不良时,如果怀疑因为内存不足而导致了页面交换的发生,可以使用sar -W这个命令来确认是否发生了大量的交换;

$sar -W 1 3

2.4. 查询硬盘使用

查看磁盘空间利用情况

$df -h

查询当前目录下空间使用情况

du -sh  -h是人性化显示 s是递归整个目录的大小

查看该目录下所有文件夹的排序后的大小

for i in `ls`; do du -sh $i; done | sort
或者
du -sh `ls`

2.5. 综合应用

当系统中sar不可用时,可以使用以下工具替代:linux下有 vmstat、Unix系统有prstat

eg: 查看cpu、内存、使用情况: vmstat n m (n 为监控频率、m为监控次数)

[/home/weber#]vmstat 1 3
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
0  0  86560  42300   9752  63556    0    1     1     1    0    0  0  0 99  0
1  0  86560  39936   9764  63544    0    0     0    52   66   95  5  0 95  0
0  0  86560  42168   9772  63556    0    0     0    20  127  231 13  2 84  0

使用watch 工具监控变化 当需要持续的监控应用的某个数据变化时,watch工具能满足要求; 执行watch命令后,会进入到一个界面,输出当前被监控的数据,一旦数据变化,便会高亮显示变化情况;

eg:操作redis时,监控内存变化:

$watch -d -n 1 './redis-cli info | grep memory'
(以下为watch工具中的界面内容,一旦内存变化,即实时高亮显示变化)
Every 1.0s: ./redis-cli info | grep memory            

used_memory:45157376
used_memory_human:43.07M
used_memory_rss:47628288
used_memory_peak:49686080
used_memory_peak_human:47.38M

你可能感兴趣的:(Linux进程管理与性能监控)