公司有几个服务器开着多个memcached进程,除了要监控他们是否正常telnet通,实例是否存在外还要监控他们的缓存命中率。针对他们的缓存命中率进行报警。

   网上有个perl写的,需要编译安装。有个python写的,贴过来运行下,发现python库版本不对。这么简单的脚本搞得这么费劲,就手动写了个。

   越写就越觉得shell处理数据,函数,字符串数组这方面太弱势了。

   还好,凑合用吧。这个脚本比较简单,通过check_tcp脚本获取memcached的stats信息。然后将该信息格式化成一个字符串,然后将get_hits比上cmd_gets就能得到缓存命中率。基础原理比较简单。但是还要实现nagios的报警格式,以及性能数据的输出,支持pnp绘图。

   为了伸手党们方便些,将以前的函数直接按需插入到该脚本中,应该是复制粘贴运行就行。

   如果有bug请反馈!

#!/bin/bash
###############################
#检查memcached的命中率
#加载nagios自带utils.sh
###############################
#source /usr/local/nagios/libexec/utils.sh
print_usage()
{
    echo "check_memcached -H IP -P port -w warning -c critical"
}
###################
#获取命令行执行参数
###################
if  [ $# == 0 ];then
    print_usage;
    exit;
else
while test -n "$1";do
    case "$1" in
        -H)
            host=$2
            shift
            ;;
        -P)
            port=$2
            shift
            ;;
        -w)
            warning=$2
            shift
            ;;
        -c)
            critical=$2
            shift
            ;;
        *)
            echo "Unknown argument:$1"
            print_usage
            exit $STATE_UNKNOWN
            ;;
    esac
    shift
done
fi
########################
#function div_f()
#检查参数,返回两个数字比
########################
function div_f()
{
    ref=`awk -v num_a=$1 -v num_b=$2 'BEGIN{printf "%0.2f \n",num_a/num_b}'`;
    echo $ref;
}
##################
#得到命中率函数
##################
function getMemcachedHits()
{
    memcachedinfo=`/usr/local/nagios/libexec/check_tcp -H $host -p $port -E -s 'stats\r\nquit\r\n' -e 'uptime' | tr "\r" "@"`
    get_hits=`echo $memcachedinfo | grep -o "@ STAT get_hits [0-9]*"| awk '{print $4}'`
    cmd_get=`echo $memcachedinfo | grep -o "@ STAT cmd_get [0-9]*"| awk '{print $4}'`
    div_f $get_hits $cmd_get;
}
hits=`getMemcachedHits $host $port`;
##################
#得到命中率所在区间
##################
function re_rang()
{
    rang=$hits;
    interval_a=$critical;
    interval_b=$warningl
    if [[ $rang < $interval_a ]];then
        echo "0";
    elif [[ $rang < $interval_b ]];then
        echo "1";
    elif [[ $rang > $interval_b ]]||[[ $rang == $interval_b ]] ;then
        echo "2";
    else
        return;
    fi
}
res=`re_rang $critical $warning $hits`;
case "$res" in
    0)
        echo "Critical memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;"
        exit $STATE_CRITICAL
        ;;
    1)
        echo "Warning  memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;"
        exit $STATE_WARNING
        ;;
    2)
        echo "Ok  memcached_hits=$hits|memcached_hits=$hits;$warning;$critical;"
        exit $STATE_OK
        ;;
    *)
        echo "Unkown"
        exit $STATE_UNKNOWN
        ;;
esac