公司使用zabbix来监测会议室设备(会议室主机、iPad控制器、预约屏iPad、拾音设备等),这些设备在日常运行过程中,由于外部等多种因素,可能会导致设备无法正常使用,从而影响用户使用体验,并且如果监管不到问题,也会给运维带了很多不必要的麻烦。虽然zabbix有自带的Problem Dashboard(不太直观和方便),然后我们也将设备告警和公司内部IM做了联动(会议室告警机器人),当会议室产生一个问题时就会在群里at所有人,信噪比太高了,且在群里的消息容易被忽略或者淹没,所以就想结合实际的业务需求做一个会议室故障展示面板。
在网上查了一些资料,找来找去还是觉得Grafana相对比较适合来做本次的面板展示,结合网上大神的一些文档和操作,分析了下业务场景,需求如下:
需求整理完毕,那么就可以开始着手准备实施了,分为以下几个步骤:
Grafana创建一个Dashboard(此处省略)
获取zabbix所有主机群组
Dashboard settings->Variables创建一个Zabbix-liteams的变量,如下图
OK,准备工作已完成,那么接下来直接开始做图!
告警机器人配合上这个故障看板还是比较OK的,最近也在研究如何调用zabbix api进行二次开发制作定制版的Dashboard,我开发技能比较菜,耗时可能会比较长!