1, #cat /proc/stat/ 信息包含了所有CPU活动的信息,该文件中的所有值都是从系统启动开始累积到当前时刻
2, #vmstat –s 或者 #vmstat 虚拟内存统计
3, #cat /proc/loadavg 从系统启动开始到当前累积时刻
4, #uptime 系统运行多长时间
5, #mpstat CPU的一些统计信息
一, linux系统CPU,内存,磁盘,网络流量监控脚本
[root@china213 ~]# cd /bin
[root@china213 bin]# ./cme.sh
cpu 99
disk 39
mem 38
nic 19855 33 0
[root@china213 bin]#
CPU剩余率,磁盘剩余率,内存剩余率,以及网卡接收的bps,pps和dps(丢包)
把下面内容用vi命令写入到cme.sh中[root@china213 bin]# vi cme.sh,同时用[root@china213 bin]# chmod +x cme.sh增加可执行权限
注意:shell文件开头必须以#!/bin/sh开始,在window中保存成cme.sh上传的时候会执行不了,可能是文件头的问题。
==============================不要把这行分各符放到cme.sh文件中=========================================
#!/bin/sh
eth="eth0 eth1 "
function get_eth_info()
{
name=$1
cat /proc/net/dev | awk -F ':' '{if(NR>2)print $1" "$2" "$9" "$10}' | awk '{print$1" "$2" "$3" "$5}' | while
read line
do
# echo $line
data=`echo $name" "$line | awk '{if($1==$2)print $3" "$4" "$5}'`
if ! [ -z "$data" ]
then
echo $data
fi
done
}
function sum_eth()
{
rm -fr 12321.txt
for name in $eth
do
ret=`get_eth_info $name`
#echo $ret | awk '{bps+=$0;pps+$1;dps+=$2;print bps" "pps" "dps}'
echo $ret >> 12321.txt
done
cat 12321.txt | awk 'BEGIN{bps=0;pps=0;dps=0} {bps+=$1;pps+=$2;dps+=$3}END{print bps" "pps" "dps}'
}
flow=`sum_eth`
disk=`df | awk 'BEGIN{total=0;avl=0;used=0;}NR > 1 {total+=$2;used+=$3;avl+=$4;}END{printf"%d", avl/total*100}'`
#top -b -n 1 | grep -w Mem | awk '{print"tot_mem: "$2" used_mem: " $4 " free_mem: "$6" left:"$6/$2"%"}'
mem=`top -b -n 1 | grep -w Mem | awk '{printf"%d",$6/$2*100}'`
#top -b -n 1 | grep -w Cpu | awk '{print"cpu: "$5}' | awk -F '%' {print$1}
cpu=`top -b -n 1 | grep -w Cpu | awk '{print$5}' | awk -F '%' '{printf"%d",$1}'`
tm=`date +%s`
if ! [ -f "flow.txt" ]
then
echo $tm" "$flow >flow.txt
sleep 1
tm=`date +%s`
flow=`sum_eth`
fi
old_flow=`cat flow.txt`
new_flow=`echo $tm $flow`
echo $new_flow >flow.txt
#echo $old_flow
#echo $new_flow
final_flow=`echo $old_flow $new_flow | awk '{dif_tm=$5- $1;dif_byte=$6-$2;dif_pkt=$7-$3;dif_dpkt=$8-$4;printf"%d %d % d",dif_byte*8/dif_tm, dif_pkt/dif_tm, dif_dpkt/dif_tm}'`
#final_flow=`echo $old_flow $new_flow | awk '{print$0}'`
echo "cpu "$cpu
echo "disk "$disk
echo "mem "$mem
echo "nic "$final_flow
二, 监控CPU进程的CPU使用率
例如: mysqld
脚本:
1,获取某个进程的使用率
[root@test testCPU]# cat topmysql.sh
#!/bin/bash
top -n 1 > /root/testCPU/topmysql.log
if grep -q mysqld /root/testCPU/topmysql.log
then cpu=`grep "mysqld" /root/testCPU/topmysql.log | gawk '{print $9}'`
echo $cpu
else
echo "0"
fi
exit
[root@test testCPU]#
2,获取cpu使用率
[root@test home]# cat getCPU.sh
#!/bin/sh
awk '$0 ~/cpu[0-9]/' /proc/stat | while read line
do
echo "$line" | awk '{total=$2+$3+$4+$5+$6+$7+$8;free=$5;\
print$1" Free "free/total*100"%",\
"Used " (total-free)/total*100"%"}'
done
[root@test home]# ./getCPU.sh
cpu0 Free 90.0662% Used 9.93379%
[root@test home]#
3,监控进程占用cpu最高的前几个进程
[root@test testCPU]# cat pscpu.sh
#!/bin/bash
time=`date +%m%d%T`
ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head -3 > /root/testCPU/pscpu$time.log
[root@test testCPU]#
# linux 下 取进程占用 cpu 最高的前10个进程
#ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head
取进程占用CPU最高的前五个进程
或者# ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head -5
# linux 下 取进程占用内存(MEM)最高的前10个进程
#ps aux|head -1;ps aux|grep -v PID|sort -rn -k +4|head
####################################
Linux 进程管理命令详解(ps和top)
1, ps命令
作用:ps命令主要查看系统中进程的状态。
格式:ps 【选项】
主要选项如下。
-A:显示系统中所有进程的信息。
-e:显示所有进程的信息。
-f:显示进程的所有信息。
-l:以长格式显示进程信息。
-r:只显示正在运行的进程。
-u:显示面向用户的格式(包括用户名、CPU及内存使用情况等信息)。
-x:显示所有非控制终端上的进程信息。
-p:显示由进程ID指定的进程的信息。
-t:显示指定终端上的进程的信息。
说明:要对进程进行监测和控制,首先要了解当前进程的情况,也就是需要查看当前进程。ps命令就是最基本、也是非常强大的进程查看命令。根据显示的信息可以确定哪个进程正在运行、哪个进程被挂起、进程已运行了多久、进程正在使用的资源、进程的相对优先级,以及进程的标志号(PID)。所有这些信息对用户都很有用,对于系统管理员来说更为重要。使用"ps -aux"命令可以获得终端上所有用户的有关进程的所有信息,下面结合图讲解进程的基本信息。
root@Linux ~]# ps -aux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.0 2064 624 ? Ss Sep27 0:03 init [3]
root 2 0.0 0.0 0 0 ? S< Sep27 0:03 [migration/0]
root 3 0.0 0.0 0 0 ? SN Sep27 0:00 [ksoftirqd/0]
root 4 0.0 0.0 0 0 ? S< Sep27 0:00 [watchdog/0]
root 5 0.0 0.0 0 0 ? S< Sep27 0:04 [migration/1]
root 6 0.0 0.0 0 0 ? SN Sep27 0:00 [ksoftirqd/1]
root 7 0.0 0.0 0 0 ? S< Sep27 0:00 [watchdog/1]
root 8 0.0 0.0 0 0 ? S< Sep27 0:05 [migration/2]
root 9 0.0 0.0 0 0 ? SN Sep27 0:00 [ksoftirqd/2]
root 10 0.0 0.0 0 0 ? S< Sep27 0:00 [watchdog/2]
图中第二行代码中,USER表示启动进程用户。PID表示进程标志号。%CPU表示运行该进程占用CPU的时间与该进程总的运行时间的比例。%MEM表示该进程占用内存和总内存的比例。VSZ表示占用的虚拟内存大小,以KB为单位。RSS为进程占用的物理内存值,以KB为单位。TTY表示该进程建立时所对应的终端,"?"表示该进程不占用终端。STAT表示进程的运行状态,包括以下几种代码:D,不可中断的睡眠;R,就绪(在可运行队列中);S,睡眠;T,被跟踪或停止;Z,终止(僵死)的进程,Z不存在,但暂时无法消除;W,没有足够的内存分页可分配;<高优先序的进程;N,低优先序的进程;L,有内存分页分配并锁在内存体内(实时系统或I/O)。START为进程开始时间。TIME为执行的时间。COMMAND是对应的命令名。
应用实例如下。
在进行系统维护时,如果CPU负载突然增加,而又不知道是哪一个进程造成的情况。使用命令:
#ps aux | sort +3n
因为%CPU选项在第三列,所以sort选3作为参数,+表示升序输出结果 .
2.top命令
top命令用来显示系统当前的进程状况。
格式:top [选项]
主要选项如下。
d:指定更新的间隔,以秒计算。
q:没有任何延迟的更新。如果使用者有超级用户,则top命令将会以最高的优先序执行。
c:显示进程完整的路径与名称。
S:累积模式,会将已完成或消失的子进程的CPU时间累积起来。
s:安全模式。
i:不显示任何闲置(Idle)或无用(Zombie)的进程。
n:显示更新的次数,完成后将会退出top。
说明:top命令和ps命令的基本作用是相同的,都显示系统当前的进程状况。但是top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态。这里结合图来说明它给出的信息。
top - 15:01:27 up 48 days, 20:31, 3 users, load average: 0.08, 0.12, 0.42
Tasks: 174 total, 1 running, 171 sleeping, 0 stopped, 2 zombie
Cpu(s): 0.0%us, 0.1%sy, 0.0%ni, 99.6%id, 0.3%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 2075312k total, 1996848k used, 78464k free, 179360k buffers
Swap: 4128760k total, 68k used, 4128692k free, 1298736k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
9013 root 15 0 2328 1056 796 R 0.3 0.1 0:00.02 top
1 root 15 0 2064 624 536 S 0.0 0.0 0:03.80 init
2 root RT -5 0 0 0 S 0.0 0.0 0:03.88 migration/0
3 root 36 19 0 0 0 S 0.0 0.0 0:00.04 ksoftirqd/0
4 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/0
5 root RT -5 0 0 0 S 0.0 0.0 0:04.06 migration/1
6 root 34 19 0 0 0 S 0.0 0.0 0:00.05 ksoftirqd/1
7 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/1
8 root RT -5 0 0 0 S 0.0 0.0 0:05.96 migration/2
9 root 34 19 0 0 0 S 0.0 0.0 0:00.04 ksoftirqd/2
10 root RT -5 0 0 0 S 0.0 0.0 0:00.00 watchdog/2
11 root RT -5 0 0 0 S 0.0 0.0 0:02.98 migration/3
12 root 34 19 0 0 0 S 0.0 0.0 0:00.09 ksoftirqd/3
在图中,第一行表示的项目依次为当前时间、系统启动时间、当前系统登录用户数目、平均负载。第二行显示的是所有启动的、目前运行的、挂起(Sleeping)的和无用(Zombie)的进程。第三行显示的是目前CPU的使用情况,包括系统占用的比例、用户使用比例、闲置(Idle)比例。第四行显示物理内存的使用情况,包括总的可以使用的内存、已用内存、空闲内存、缓冲区占用的内存。第五行显示交换分区的使用情况,包括总的交换分区、使用的、空闲的和用于高速缓存的交换分区。第六行显示的项目最多,下面列出了详细解释。
PID(Process ID):进程标志号,是非零正整数。USER:进程所有者的用户名。PR:进程的优先级别。NI:进程的优先级别数值。VIRT:进程占用的虚拟内存值。RES:进程占用的物理内存值。SHR:进程使用的共享内存值。STAT:进程的状态,其中S表示休眠,R表示正在运行,Z表示僵死状态,N表示该进程优先值是负数。%CPU:该进程占用的CPU使用率。%MEM:该进程占用的物理内存和总内存的百分比。TIME:该进程启动后占用的总的CPU时间。COMMAND:进程启动的启动命令名称,如果这一行显示不下,进程会有一个完整的命令行。top命令使用过程中,还可以使用一些交互的命令来完成其他参数的功能。这些命令是通过快捷键启动的。
<空格>:立刻刷新。
P:根据CPU使用大小进行排序。
T:根据时间、累计时间排序。
q:退出top命令。
m:切换显示内存信息。
t:切换显示进程和CPU状态信息。
c:切换显示命令名称和完整命令行。
M:根据使用内存大小进行排序。
W:将当前设置写入~/.toprc文件中。这是写top配置文件的推荐方法。
可以看到,top命令是一个功能十分强大的监控系统的工具,对于系统管理员而言尤其重要。但是,它的缺点是会消耗很多系统资源。