linux系统CPU,内存,磁盘,网络流量监控脚本

前序

1 #cat /proc/stat/  信息包含了所有CPU活动的信息,该文件中的所有值都是从系统启动开始累积到当前时刻

2 #vmstat –s   或者 #vmstat    虚拟内存统计

3,  #cat /proc/loadavg  从系统启动开始到当前累积时刻

4,  #uptime    系统运行多长时间

5,  #mpstat     CPU的一些统计信息

6,  #

 

 

一, linux系统CPU,内存,磁盘,网络流量监控脚本

 

[作者:佚名 来源:不详 时间: 2010-7-6 【我来说两句 小】  cme.sh网络流量监控使用

 

  [root@china213 ~]# cd /bin

 

  [root@china213 bin]# ./cme.sh

 

  cpu 99

 

  disk 39

 

  mem 38

 

  nic 19855 33 0

 

  [root@china213 bin]#

 

  CPU剩余率,磁盘剩余率,内存剩余率,以及网卡接收的bps,ppsdps(丢包)

 

  把下面内容用vi命令写入到cme.sh[root@china213 bin]# vi cme.sh,同时用[root@china213 bin]# chmod +x cme.sh增加可执行权限

 

  注意:shell文件开头必须以#!/bin/sh开始,在window中保存成cme.sh上传的时候会执行不了,可能是文件头的问题。

 

  ==============================不要把这行分各符放到cme.sh文件中=========================================

 

#!/bin/sh

 

eth="eth0 eth1 "

 

function get_eth_info()

 

{

 

name=$1

 

cat /proc/net/dev | awk -F ':' '{if(NR>2)print $1" "$2" "$9"     "$10}' | awk '{print$1" "$2" "$3" "$5}' | while \

 

read line

 

do

 

# echo $line

 

data=`echo $name" "$line | awk '{if($1==$2)print $3" "$4" "$5}'`

 

if ! [ -z "$data" ]

 

then

 

echo $data

 

fi

 

done

 

}

 

function sum_eth()

 

{

 

rm -fr 12321.txt

 

for name in $eth

 

do

 

ret=`get_eth_info $name`

 

#echo $ret | awk '{bps+=$0;pps+$1;dps+=$2;print bps" "pps"     "dps}'

 

echo $ret >> 12321.txt

 

done

 

cat 12321.txt | awk 'BEGIN{bps=0;pps=0;dps=0}    {bps+=$1;pps+=$2;dps+=$3}END{print bps" "pps" "dps}'

 

}

 

flow=`sum_eth`

 

disk=`df | awk 'BEGIN{total=0;avl=0;used=0;}NR > 1    {total+=$2;used+=$3;avl+=$4;}END{printf"%d", avl/total*100}'`

 

#top -b -n 1 | grep -w Mem | awk '{print"tot_mem: "$2" used_mem:     " $4 " free_mem: "$6" left:"$6/$2"%"}'

 

mem=`top -b -n 1 | grep -w Mem | awk '{printf"%d",$6/$2*100}'`

 

#top -b -n 1 | grep -w Cpu | awk '{print"cpu: "$5}' | awk -F '%'     {print$1}

 

cpu=`top -b -n 1 | grep -w Cpu | awk '{print$5}' | awk -F '%'     '{printf"%d",$1}'`

 

tm=`date +%s`

 

if ! [ -f "flow.txt" ]

 

then

 

echo $tm" "$flow >flow.txt

 

sleep 1

 

tm=`date +%s`

 

flow=`sum_eth`

 

fi

 

old_flow=`cat flow.txt`

 

new_flow=`echo $tm $flow`

 

echo $new_flow >flow.txt

 

#echo $old_flow

 

#echo $new_flow

 

final_flow=`echo $old_flow $new_flow | awk '{dif_tm=$5-    $1;dif_byte=$6-$2;dif_pkt=$7-$3;dif_dpkt=$8-$4;printf"%d %d %    d",dif_byte*8/dif_tm, dif_pkt/dif_tm, dif_dpkt/dif_tm}'`

 

#final_flow=`echo $old_flow $new_flow | awk '{print$0}'`

 

echo "cpu "$cpu

 

echo "disk "$disk

 

echo "mem "$mem

 

echo "nic "$final_flow

 

二, 监控CPU进程的CPU使用率

例如: mysqld

脚本:

1,获取某个进程的使用率

[root@test testCPU]# cat topmysql.sh

#!/bin/bash

top -n 1 > /root/testCPU/topmysql.log

if grep -q mysqld /root/testCPU/topmysql.log

then cpu=`grep "mysqld" /root/testCPU/topmysql.log | gawk '{print $9}'`

echo $cpu

else

echo "0"

fi

exit

[root@test testCPU]#

2,获取cpu使用率

[root@test home]# cat getCPU.sh

#!/bin/sh

awk '$0 ~/cpu[0-9]/' /proc/stat | while read line

do

echo "$line" | awk '{total=$2+$3+$4+$5+$6+$7+$8;free=$5;\

               print$1" Free "free/total*100"%",\

                "Used " (total-free)/total*100"%"}'

done

 

[root@test home]# ./getCPU.sh

cpu0 Free 90.0662% Used 9.93379%

[root@test home]#

3,监控进程占用cpu最高的前几个进程

[root@test testCPU]# cat pscpu.sh

#!/bin/bash

time=`date +%m%d%T`

ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head -3 > /root/testCPU/pscpu$time.log

[root@test testCPU]#

 

# linux 下 取进程占用 cpu 最高的前10个进程
#ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head

取进程占用CPU最高的前五个进程

或者# ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head -5


# linux
下 取进程占用内存(MEM)最高的前10个进程
#ps aux|head -1;ps aux|grep -v PID|sort -rn -k +4|head

 

####################################

Linux 进程管理命令详解(pstop

1, ps命令

作用:ps命令主要查看系统中进程的状态。

格式:ps 【选项】

主要选项如下。

-A:显示系统中所有进程的信息。
-e:显示所有进程的信息。
-f:显示进程的所有信息。
-l:以长格式显示进程信息。
-r:只显示正在运行的进程。
-u:显示面向用户的格式(包括用户名、CPU及内存使用情况等信息)。
-x:显示所有非控制终端上的进程信息。
-p:显示由进程ID指定的进程的信息。
-t:显示指定终端上的进程的信息。

 

说明:要对进程进行监测和控制,首先要了解当前进程的情况,也就是需要查看当前进程。ps命令就是最基本、也是非常强大的进程查看命令。根据显示的信息可以确定哪个进程正在运行、哪个进程被挂起、进程已运行了多久、进程正在使用的资源、进程的相对优先级,以及进程的标志号(PID)。所有这些信息对用户都很有用,对于系统管理员来说更为重要。使用"ps aux"命令可以获得终端上所有用户的有关进程的所有信息,下面结合图讲解进程的基本信息。

root@Linux ~]# ps -aux
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1 0.0 0.0   2064   624 ?        Ss   Sep27   0:03 init [3]                                  
root         2 0.0 0.0      0     0 ?        S<   Sep27   0:03 [migration/0]
root         3 0.0 0.0      0     0 ?        SN   Sep27   0:00 [ksoftirqd/0]
root         4 0.0 0.0      0     0 ?        S<   Sep27   0:00 [watchdog/0]
root         5 0.0 0.0      0     0 ?        S<   Sep27   0:04 [migration/1]
root         6 0.0 0.0      0     0 ?        SN   Sep27   0:00 [ksoftirqd/1]
root         7 0.0 0.0      0     0 ?        S<   Sep27   0:00 [watchdog/1]
root         8 0.0 0.0      0     0 ?        S<   Sep27   0:05 [migration/2]
root         9 0.0 0.0      0     0 ?        SN   Sep27   0:00 [ksoftirqd/2]
root        10 0.0 0.0      0     0 ?        S<   Sep27   0:00 [watchdog/2]

图中第二行代码中,USER表示启动进程用户。PID表示进程标志号。%CPU表示运行该进程占用CPU的时间与该进程总的运行时间的比例。%MEM表示该进程占用内存和总内存的比例。VSZ表示占用的虚拟内存大小,以KB为单位。RSS为进程占用的物理内存值,以KB为单位。TTY表示该进程建立时所对应的终端,"?"表示该进程不占用终端。STAT表示进程的运行状态,包括以下几种代码:D,不可中断的睡眠;R,就绪(在可运行队列中);S,睡眠;T,被跟踪或停止;Z,终止(僵死)的进程,Z不存在,但暂时无法消除;W,没有足够的内存分页可分配;<高优先序的进程;N,低优先序的进程;L,有内存分页分配并锁在内存体内(实时系统或I/O)。START为进程开始时间。TIME为执行的时间。COMMAND是对应的命令名。
应用实例如下。
在进行系统维护时,如果CPU负载突然增加,而又不知道是哪一个进程造成的情况。使用命令:

#ps aux | sort +3n

因为%CPU选项在第三列,所以sort3作为参数,+表示升序输出结果 .

2.top命令
top命令用来显示系统当前的进程状况。
格式:top [选项]
主要选项如下。

d:指定更新的间隔,以秒计算。
q
:没有任何延迟的更新。如果使用者有超级用户,则top命令将会以最高的优先序执行。
c
:显示进程完整的路径与名称。
S
:累积模式,会将已完成或消失的子进程的CPU时间累积起来。
s
:安全模式。
i
:不显示任何闲置(Idle)或无用(Zombie)的进程。
n
:显示更新的次数,完成后将会退出top

说明:top命令和ps命令的基本作用是相同的,都显示系统当前的进程状况。但是top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态。这里结合图来说明它给出的信息。

top - 15:01:27 up 48 days, 20:31, 3 users, load average: 0.08, 0.12, 0.42
Tasks: 174 total,   1 running, 171 sleeping,   0 stopped,   2 zombie
Cpu(s): 0.0%us, 0.1%sy, 0.0%ni, 99.6%id, 0.3%wa, 0.0%hi, 0.0%si, 0.0%st
Mem:   2075312k total, 1996848k used,    78464k free,   179360k buffers
Swap: 4128760k total,       68k used, 4128692k free, 1298736k cached

PID USER      PR NI VIRT RES SHR S %CPU %MEM    TIME+ COMMAND                                                            
9013 root      15   0 2328 1056 796 R 0.3 0.1   0:00.02 top                                                                
    1 root      15   0 2064 624 536 S 0.0 0.0   0:03.80 init                                                               
    2 root      RT -5     0    0    0 S 0.0 0.0   0:03.88 migration/0                                                        
    3 root      36 19     0    0    0 S 0.0 0.0   0:00.04 ksoftirqd/0                                                        
    4 root      RT -5     0    0    0 S 0.0 0.0   0:00.00 watchdog/0                                                         
    5 root      RT -5     0    0    0 S 0.0 0.0   0:04.06 migration/1                                                        
    6 root      34 19     0    0    0 S 0.0 0.0   0:00.05 ksoftirqd/1                                                        
    7 root      RT -5     0    0    0 S 0.0 0.0   0:00.00 watchdog/1                                                         
    8 root      RT -5     0    0    0 S 0.0 0.0   0:05.96 migration/2                                                        
    9 root      34 19     0    0    0 S 0.0 0.0   0:00.04 ksoftirqd/2                                                        
   10 root      RT -5     0    0    0 S 0.0 0.0   0:00.00 watchdog/2                                                         
   11 root      RT -5     0    0    0 S 0.0 0.0   0:02.98 migration/3                                                        
   12 root      34 19     0    0    0 S 0.0 0.0   0:00.09 ksoftirqd/3    

在图中,第一行表示的项目依次为当前时间、系统启动时间、当前系统登录用户数目、平均负载。第二行显示的是所有启动的、目前运行的、挂起(Sleeping)的和无用(Zombie)的进程。第三行显示的是目前CPU的使用情况,包括系统占用的比例、用户使用比例、闲置(Idle)比例。第四行显示物理内存的使用情况,包括总的可以使用的内存、已用内存、空闲内存、缓冲区占用的内存。第五行显示交换分区的使用情况,包括总的交换分区、使用的、空闲的和用于高速缓存的交换分区。第六行显示的项目最多,下面列出了详细解释。
PID
Process ID):进程标志号,是非零正整数。USER:进程所有者的用户名。PR:进程的优先级别。NI:进程的优先级别数值。VIRT:进程占用的虚拟内存值。RES:进程占用的物理内存值。SHR:进程使用的共享内存值。STAT:进程的状态,其中S表示休眠,R表示正在运行,Z表示僵死状态,N表示该进程优先值是负数。%CPU:该进程占用的CPU使用率。%MEM:该进程占用的物理内存和总内存的百分比。TIME:该进程启动后占用的总的CPU时间。COMMAND:进程启动的启动命令名称,如果这一行显示不下,进程会有一个完整的命令行。top命令使用过程中,还可以使用一些交互的命令来完成其他参数的功能。这些命令是通过快捷键启动的。

<空格>:立刻刷新。
P
:根据CPU使用大小进行排序。
T
:根据时间、累计时间排序。
q
:退出top命令。
m
:切换显示内存信息。
t
:切换显示进程和CPU状态信息。
c
:切换显示命令名称和完整命令行。
M
:根据使用内存大小进行排序。
W
:将当前设置写入~
/.toprc文件中。这是写top配置文件的推荐方法。

可以看到,top命令是一个功能十分强大的监控系统的工具,对于系统管理员而言尤其重要。但是,它的缺点是会消耗很多系统资源。

 

 

你可能感兴趣的:(linux,网络,内存,流量监控,linux脚本)