最近时不时有朋友问我关于服务器监控方面的问题,问常用的服务器监控除了用开源软件,比如:cacti,nagios监控外是否可以自己写shell脚本呢?根据自己的需求写出的shell脚本更能满足需求,更能细化主机监控的全面性。
下面是我常用的几个主机监控的脚本,大家可以根据自己的情况在进行修改,希望能给大家一点帮助。
1、查看主机网卡流量
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
#!/bin/bash
#!/bin/bash
#network
#Mike.Xu
while
: ;
do
time
=
'date +%m"-"%d" "%k":"%M'
day=
'date +%m"-"%d'
rx_before=
'ifconfig eth0|sed -n "8"p|awk '
{print $2}
'|cut -c7-'
tx_before=
'ifconfig eth0|sed -n "8"p|awk '
{print $6}
'|cut -c7-'
sleep
2
rx_after=
'ifconfig eth0|sed -n "8"p|awk '
{print $2}
'|cut -c7-'
tx_after=
'ifconfig eth0|sed -n "8"p|awk '
{print $6}
'|cut -c7-'
rx_result=$[(rx_after-rx_before)
/256
]
tx_result=$[(tx_after-tx_before)
/256
]
echo
"$time Now_In_Speed: "
$rx_result
"kbps Now_OUt_Speed: "
$tx_result
"kbps"
sleep
2
done
done
|
2、系统状况监控
1
2
3
4
5
6
7
8
9
10
11
12
13
|
#!/bin/sh
#systemstat.sh
#Mike.Xu
IP=192.168.1.227
top
-n 2|
grep
"Cpu"
>>.
/temp/cpu
.txt
free
-m |
grep
"Mem"
>> .
/temp/mem
.txt
df
-k |
grep
"sda1"
>> .
/temp/drive_sda1
.txt
#df -k | grep sda2 >> ./temp/drive_sda2.txt
df
-k |
grep
"/mnt/storage_0"
>> .
/temp/mnt_storage_0
.txt
df
-k |
grep
"/mnt/storage_pic"
>> .
/temp/mnt_storage_pic
.txt
time
=`
date
+%m
"."
%d
" "
%k
":"
%M`
connect=`
netstat
-na |
grep
"219.238.148.30:80"
|
wc
-l`
echo
"$time $connect"
>> .
/temp/connect_count
.txt
|
3、监控主机的磁盘空间,当使用空间超过90%就通过发mail来发警告
1
2
3
4
5
6
7
|
#!/bin/bash
#monitor available disk space
SPACE=
'df | sed -n '
/ \ / $ / p
' | gawk '
{print $5}
' | sed '
s/%
//
'
if
[ $SPACE -
ge
90 ]
then
fi
|
4、 监控CPU和内存的使用情况
1
2
3
4
5
6
7
8
9
10
11
12
|
#!/bin/bash
#script to capture system statistics
OUTFILE=
/home/xu/capstats
.csv
DATE=
'date +%m/%d/%Y'
TIME=
'date +%k:%m:%s'
TIMEOUT=
'uptime'
VMOUT=
'vmstat 1 2'
USERS=
'echo $TIMEOUT | gawk '
{print $4}
' '
LOAD=
'echo $TIMEOUT | gawk '
{print $9}
' | sed "s/,//'
'
FREE=
'echo $VMOUT | sed -n '
/[0-9]
/p
' | sed -n '
2p
' | gawk '
{print $4}
' '
IDLE=
'echo $VMOUT | sed -n '
/[0-9]
/p
' | sed -n '
2p
' |gawk '
{print $15}
' '
echo
"$DATE,$TIME,$USERS,$LOAD,$FREE,$IDLE"
>> $OUTFILE
|
5、全方位监控主机
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
|
#!/bin/bash
# check_xu.sh
# 0 * * * * /home/check_xu.sh
DAT=
"`date +%Y%m%d`"
HOUR=
"`date +%H`"
DIR=
"/home/oslog/host_${DAT}/${HOUR}"
DELAY=60
COUNT=60
# whether the responsible directory exist
if
!
test
-d ${DIR}
then
/bin/mkdir
-p ${DIR}
fi
# general check
export
TERM=linux
/usr/bin/top
-b -d ${DELAY} -n ${COUNT} > ${DIR}
/top_
${DAT}.log 2>&1 &
# cpu check
/usr/bin/sar
-u ${DELAY} ${COUNT} > ${DIR}
/cpu_
${DAT}.log 2>&1 &
#/usr/bin/mpstat -P 0 ${DELAY} ${COUNT} > ${DIR}/cpu_0_${DAT}.log 2>&1 &
#/usr/bin/mpstat -P 1 ${DELAY} ${COUNT} > ${DIR}/cpu_1_${DAT}.log 2>&1 &
# memory check
/usr/bin/vmstat
${DELAY} ${COUNT} > ${DIR}
/vmstat_
${DAT}.log 2>&1 &
# I/O check
/usr/bin/iostat
${DELAY} ${COUNT} > ${DIR}
/iostat_
${DAT}.log 2>&1 &
# network check
/usr/bin/sar
-n DEV ${DELAY} ${COUNT} > ${DIR}
/net_
${DAT}.log 2>&1 &
#/usr/bin/sar -n EDEV ${DELAY} ${COUNT} > ${DIR}/net_edev_${DAT}.log 2>&1 &
|
放在crontab里每小时自动执行:
1
|
0 * * * *
/home/check_xu
.sh
|
这样会在/home/oslog/host_yyyymmdd/hh目录下生成各小时cpu、内存、网络,IO的统计数据。
如果某个时间段产生问题了,就可以去看对应的日志信息,看看当时的主机性能如何。
J4ML