【SNMP采集】解决方案——惠普服务器SNMP采集频繁导致服务停止

 

运维软件:zabbix
采集方式:snmp
采集设备:惠普-DL380_Gen9-服务器
采集周期:根据指标要求频率有5分钟到1天
主要命令:reset /map1

snmp采集惠普服务器一段时间后,zabbix提示连接失败,重启ilo后又可以重新采集,我们可以利用这一点做一个自动重启脚本,保证采集正常。
实现思路:zabbix检查自定时间内没有数据->触发告警脚本->告警脚本登录设备执行 reset /map1

1.我们要模板里加一个多久没有采集到数据的触发器如:
【SNMP采集】解决方案——惠普服务器SNMP采集频繁导致服务停止_第1张图片 

2.增加报警媒介。
管理->报警媒介类型->创建报警媒介类型。

【SNMP采集】解决方案——惠普服务器SNMP采集频繁导致服务停止_第2张图片 
脚本的操作是根据传过来的参数到数据库是找出此设备管理口IP、帐号、密码。

主要sql:

SELECT i.ip,h.ipmi_username,h.ipmi_password from `hosts` as h LEFT JOIN interface as i on i.hostid = h.hostid where h.host="'.$hostName.'"  and  i.port= 161。
然后用ssh连接到该设备,执行reset /map1 就可以重启该ilo了。

3.添加动作
配置->动作->创建动作
【SNMP采集】解决方案——惠普服务器SNMP采集频繁导致服务停止_第3张图片 
到此重启设备ilo口完成。
面对snmp频繁采集导致snmp连接失败,这也是一个解决方案。

 

【SNMP采集】解决方案——惠普服务器SNMP采集频繁导致服务停止_第4张图片


转自
解决方案 ——惠普服务器SNMP采集频繁导致服务停止
(出处: 乐维论坛)

你可能感兴趣的:(【SNMP采集】解决方案——惠普服务器SNMP采集频繁导致服务停止)