zabbix监控日志

  • zabbix是一个强大的监控服务,它能够监控服务器的各个方面,来实时监控并反映服务器的健康状况。前面演示过如何通过端口号来监控服务,这里就来演示下通过脚本来监控日志文件,可以自定义监控日子里出现的关键字。

监控日志文件中遇到Error报错

[root@localhost ~]#vim log.py
#!/usr/bin/env python3

import sys
import re

def prePos(seekfile):
    global curpos
    try:
        cf = open(seekfile)
    except IOError:
        curpos = 0
        return curpos
    except FileNotFoundError:
        curpos = 0
        return curpos
    else:
        try:
            curpos = int(cf.readline().strip())
        except ValueError:
            curpos = 0
            cf.close()
            return curpos
        cf.close()
    return curpos

def lastPos(filename):
    with open(filename) as lfile:
        if lfile.readline():
            lfile.seek(0,2)
        else:
            return 0
        lastPos = lfile.tell()
    return lastPos

def getSeekFile():
    try:
        seekfile = sys.argv[2]
    except IndexError:
        seekfile = '/tmp/logseek'
    return seekfile

def getKey():
    try:
        tagKey = str(sys.argv[3])
    except IndexError:
        tagKey = 'Error'
    return tagKey

def getResult(filename,seekfile,tagkey):
    destPos = prePos(seekfile)
    curPos = lastPos(filename)

    if curPos < destPos:
        curpos = 0

    try:
        f = open(filename)
    except IOError:
        print('Could not open file: %s' % filename)
    except FileNotFoundError:
        print('Could not open file: %s' % filename)
    else:
        f.seek(destPos)

        while curPos != 0 and f.tell() < curPos:
            rresult = f.readline().strip()
            global result
            if re.search(tagkey, rresult):
                result = 1
                break
            else:
                result = 0

        with open(seekfile,'w') as sf:
            sf.write(str(curPos))
    finally:
        f.close()
    return result

if __name__ == "__main__":
    result = 0
    curpos = 0
    tagkey = getKey()
    seekfile = getSeekFile()
    result = getResult(sys.argv[1],seekfile,tagkey)
    print(result)

[root@localhost ~]# cat a.log 
rizhi
qwertyusdfgh
asdfmzzxcvbn
qwe
dsfserwerwe
sdfsgrrwh
asfiuytrjhgfnbv
bvmnbvjhgfiuytre
hgfds
nbvcgftr
error                      //在模拟的日志文件中随意加一些内容

#修改日志文件的属主和属组,并赋予脚本执行权限
[root@localhost ~]# chown zabbix.zabbix /root/a.log 
[root@localhost ~]# chmod +x log.py 
[root@localhost ~]# chown -R zabbix.zabbix /tmp
[root@localhost ~]# chown zabbix.zabbix /root/ -R
[root@localhost ~]# chown zabbix.zabbix log.py
//测试下脚本
[root@localhost ~]# python log.py a.log 
0                                       //日志中没有Error
这时/tmp目录下会生成一个logseek的文件,这个是用来记录脚本检查日志的位置。
将这个文件的属主与属组修改为zabbix的。
[root@localhost ~]# chown -R zabbix.zabbix /tmp/logseek
模拟日志中出现了定义的关键字Error,并用脚本监测
[root@localhost ~]# echo 'Error' >>a.log 
[root@localhost ~]# python log.py a.log 
1                                             //检测出是有关键字的
证明脚本是没有问题的
//修改客户端配置文件
[root@localhost ~]# vim /usr/local/etc/zabbix_agentd.conf
UserParameter=checklog,/usr/bin/python /root/log.py /root/a.log /tmp/seeklog Error    //文件末尾添加此行内容
#第一个参数为日志文件名(必须有,相对路径、绝对路径均可)
#第二个参数为seek position文件的路径(可选项,若不设置则默认为/tmp/logseek文件。相对路径、绝对路径均可)
#第三个参数为搜索关键字,默认为 Error

//再次向日志文件中写入Error,并重启服务
[root@localhost ~]# echo 'Error' >>a.log 
[root@localhost ~]# pkill zabbix
[root@localhost ~]# zabbix_agentd

在服务端测试

[root@zabbix ~]# zabbix_get -s 192.168.225.129 -k checklog
1
[root@zabbix ~]# zabbix_get -s 192.168.225.129 -k checklog
0                           //测试成功


web界面配置
添加监控项
zabbix监控日志_第1张图片
添加触发器
zabbix监控日志_第2张图片
验证
触发警告

[root@localhost ~]# echo 'Error' >>a.log             //客户端

zabbix监控日志_第3张图片

警告邮件
zabbix监控日志_第4张图片

监控日志脚本点这里自行下载

你可能感兴趣的:(zabbix监控日志)