批量服务器硬件监控

#!/bin/bash
array=(`cat /usr/local/dsh/etc/hard.txt`)  //需要监控的服务器ip
disk_limit=80          //硬盘阀值
cpu_limit=80           //CPU阀值

mem_limit=80        //内存阀值

e_mail=‘[email protected]’       //报警邮件

function max(){       //求最大值函数
eval nums=($*)
max=0
for((i=0;i<${#nums[@]};i++))
do
  array_num=${nums[$i]}
  [ $array_num -gt $max ]&&max=$array_num
done
echo $max
}
function disk_info(){     //硬盘监控
for ((i=0;i<${#array[@]};i++));do
host=${array[$i]}
disk=(`dsh -r ssh -m $host -- df -Th|awk 'NR>1{print $6}'|awk -F % '{print $1}'`)  //得到各服务器硬盘使用
diskuse=`max ${disk[*]}`  //找出各服务器硬盘使用的最大值
if [ $diskuse -gt $disk_limit ]; then  //大于阀值报警
    disk_message="${host}硬盘使用率大于${disk_limit}%"
    `echo $disk_message|mail -s "${host}disk!" $e_mail`
    echo "disk: $disk_message"
fi

done
}

function mem_info(){   //内存监控
for ((x=0;x<${#array[@]};x++));do
host=${array[$x]}
mem_free=`dsh -r ssh -m $host --  cat /proc/meminfo | grep 'MemFree' | awk '{print $2}'`
mem_buff=`dsh -r ssh -m $host --  cat /proc/meminfo | grep 'Buffers' | awk '{print $2}'`
mem_cached=`dsh -r ssh -m $host --  cat /proc/meminfo| grep '^Cached' | awk '{print $2}'`
mem_free_total=`echo ${mem_free}+${mem_buff}+${mem_cached}|bc`
mem_total=`dsh -r ssh -m $host -- cat /proc/meminfo | grep MemTotal|awk '{print $2}'`
mem_use=$((100-${mem_free_total}*100/${mem_total}))
if [ $mem_use -gt $mem_limit ];then
    mem_message="${host}内存使用率为:${mem_use}%"
    `echo $mem_message | mail -s "${host}memory${mem_use}%!" $e_mail`
    echo "$mem: {mem_message}"
 fi
done
}

function cpu_info(){     //cpu监控
for ((j=0;j<${#array[@]};j++));do
host=${array[$j]}
cpu_get1=`dsh -r ssh -m $host -- cat /proc/stat | grep 'cpu[0-9]*'|awk '{use+=$2+$3+$4;free+=$5+$6+$7+$8}END{print use,free}'`
sleep 8
cpu_get2=`dsh -r ssh -m $host -- cat /proc/stat | grep 'cpu[0-9]*'|awk '{use+=$2+$3+$4;free+=$5+$6+$7+$8}END{print use,free}'`
cpu_use=`echo $cpu_get1 $cpu_get2 |awk '{used=$3-$1;total=$3+$4-$2-$1;print used*100/total}'`
cpu_useexp=`echo $cpu_use/1+1|bc`
echo $cpu_useexp
if [ $cpu_useexp -gt $cpu_limit ]; then
   cpu_usepid=`ps aux|sort -nnk 3r|head -2|sed -e '1d'|awk '{print $3,$11}'`
   cpu_message="${host}cpu使用率为:${cpu_use},进程名:`echo ${cpu_usepid}|awk '{print $2}'`,占用:`echo ${cpu_usepid}|awk '{print $1}'`%"
   `echo $cpu_message | mail -s "${host}cpu${cpu_use}%!" $e_mail`
   echo "cpu: $cpu_message"
fi
done
}
echo `date`
disk_info
mem_info
cpu_info

你可能感兴趣的:(function,服务器,监控,硬件)