Zabbix完整的监控流程


前面学习了zabbix的工作原理和安装方法,今天我们学习zabbix 添加监控主机:


    1、添加一台主机( 配置--主机--添加主机)


Zabbix 完整的监控流程_第1张图片

Zabbix 完整的监控流程_第2张图片

这样 node2 就被添加上来了。


  2、添加node2 的应用集(aplication)

  选择node2 应用集--创建应用集--名称为cpu stats  (再创建一个memory stats)

Zabbix 完整的监控流程_第3张图片

Zabbix 完整的监控流程_第4张图片


    3、添加item (选择node2 item--创建item)

Zabbix 完整的监控流程_第5张图片

Zabbix 完整的监控流程_第6张图片


 注:如果监控网卡进/出站流量,先创建一个关于net 的aplication 再创建item,选择 item 时key 值选择 net.if.in[eth0,bytes]


  4、 默认Item 有多种类型,

        zabbix-agent 工作模式有:passive,active

        网卡流量相关:

            net.if.in [if,]  //if 接口,如eth0 ;mode :bytes,packets,errors,dropped

            net.if.out [if,]

            net.if.total [if,]

        监控端口相关:

            net.tcp.listen [port]  //监听了哪些端口

            net.tcp.port [ip,]  //监听了某IP哪些端口

            net.tcp.service [service,]  //监听在哪个IP的服务,哪个端口

        进程相关:

            kernel.maxfiles  //进程允许打开的最大连接数

            kernel.maxproc   //kernel允许运行的最大进程数

        cpu相关:

            system.cpu.intr  //中断次数

            system.cpu.load [,]  //cpu 的负载


    自定义item:

            关键:选取一个唯一的key:

            命令:收集数据的命令或脚本





    5、定义Triggers (可以存在依赖关系的组件)

    选择node2--Triggers--创建Triggers

    Trigger的状态一般就2种,要么OK ,要么Problem  超出定义的数值就显示Problem,即一个事件发生

    每次接受到一个item的新数据时都会对item的当前采样值进行判断(与triggers的表达式比较)

    一个triggers 只能属于一个item,一个item 可以有多个trigger

Zabbix 完整的监控流程_第7张图片


Zabbix 完整的监控流程_第8张图片

 

  6、 定义Graph( 选择node2--Graph--创建Graph)

Zabbix 完整的监控流程_第9张图片


    7、定义Actions

      (1)触发条件一般为事件:

        Trigger events: ok---problem

        Discovery events: zabbix的network discovery 工作时发现主机

        Auto registration events: 主动模式的agent注册时产生的事件

        Internal events :Item 变成不再被支持或Trigger变成未知状态


Zabbix 完整的监控流程_第10张图片


    (2)operations 的功能:

        动作:send message 、Remote command

        配置send message:

            (1)定义media---(2)定义好用户---(3)配置要发送的消息---(4)报警升级

             所以我们要定义一个操作时,事先要定义好media、用户等

        


Zabbix 完整的监控流程_第11张图片


Zabbix 完整的监控流程_第12张图片

Zabbix 完整的监控流程_第13张图片

   

    8、定义media types      Zabbix 完整的监控流程_第14张图片


    9、定义用户有三个选项,

      (1)用户-----》

    Zabbix 完整的监控流程_第15张图片



















    (2)报警媒介------》

Zabbix 完整的监控流程_第16张图片

    (3)权限------!

Zabbix 完整的监控流程_第17张图片



    11、定义好用户、报警媒介、权限后回头再来action的条件、操作等

Zabbix 完整的监控流程_第18张图片


这样就定制了一个完整的监控报警机制,一旦触发一个事件,就会以定义的媒介通知定义的管理员。