2019-01-07 安装Nagios监控华为OLT遇到的坑

首先是MIB库很难弄,要有华为账号,开单申请,签一个电子的保密协议,才能通过华为内部审批,得到一个临时的下载链接。恩,我申请的是OLT的MIB,MA5600和MA5800的不一样,所有文件加起来有大概有400M多。

第一个坑是MIB文件的问题,把所有MIB文件拷贝到 /usr/share/snmp/mibs 目录下之后,仍然提示有两个mib文件找不到,一个是“IEEE8021-BRIDGE-MIB.mib”, 另一个是“IEEE8021-Q-BRIDGE-MIB.mib”, 自己从网上下载了再放到这个目录下面吧。

第二个坑是OID的问题。同样型号的OLT,OID竟然还不一样,估计是加载的补丁有差异。导致不能直接用型号分组hostgroup,需要根据实际的OID情况分不同的组。

root@ax:/usr/local/nagios/libexec# ./check_snmp -C kjsd934js -H 10.111.192.2 -o 1.3.6.1.4.1.2011.6.2.1.6.1.1.2.1.0
SNMP OK - 100 | RFC1155-SMI::enterprises.2011.6.2.1.6.1.1.2.1.0=100
root@ax:/usr/local/nagios/libexec# ./check_snmp -C kjsd934js -H 10.111.56.2 -o 1.3.6.1.4.1.2011.6.2.1.6.1.1.2.1.0
External command error: Error in packet
Reason: (noSuchName) There is no such variable name in this MIB.
Failed object: RFC1155-SMI::enterprises.2011.6.2.1.6.1.1.2.1.0

root@ax:/usr/local/nagios/libexec# ./check_snmp -C kjsd934js -H 10.111.56.2 -o 1.3.6.1.4.1.2011.6.2.1.6.1.1.2.0.0
SNMP OK - 100 | RFC1155-SMI::enterprises.2011.6.2.1.6.1.1.2.0.0=100

所以需要先跑一下snmpwalk,看下OID具体后面的数值是啥

root@ax:/usr/local/nagios/libexec# snmpwalk -v2c -c kjsd934js 10.111.192.2 1.3.6.1.4.1.2011.6.2.1.6.1.1.2
SNMPv2-SMI::enterprises.2011.6.2.1.6.1.1.2.1.0 = INTEGER: 100

第三个坑是我自己挖的,snmpwalk能跑出来读数,比如OID:1.3.6.1.4.1.2011.6.2.1.6.1.1.2, 这个没问题,但是写到nagios里面,调用"check_snmp"的时候,就必须把“1.3.6.1.4.1.2011.6.2.1.6.1.1.2.1.0” 后面的".1.0"写全了,不然nagios会报错"External command error: Error in packet "

最后还有一个坑我到现在也没弄明白是啥情况,希望有高手能帮忙解答。主要是OLT的电源,不管是AC/DC还是电池的Current Lod,在服务器上snmpwalk和check_snmp都能跑出读数,同样放到nagios里就始终是超时状态,“CRITICAL - Plugin timed out while executing system call ”,这是在MA5800,而在MA5600,只要加了对current load的监控,会导致除了ping以外所有查询的超时报错,看起来是这个查询引占用了设备所有资源导致无法返回数据?

root@ax:/usr/local/nagios/libexec# snmpwalk -v2c -c kjsd934js 10.111.68.2 1.3.6.1.4.1.2011.6.2.1.3.1.10
SNMPv2-SMI::enterprises.2011.6.2.1.3.1.10.2.0 = INTEGER: 6400
root@ax:/usr/local/nagios/libexec# ./check_snmp -C kjsd934js -H 10.111.68.2 -o 1.3.6.1.4.1.2011.6.2.1.3.1.10.2.0
SNMP OK - 6400 | RFC1155-SMI::enterprises.2011.6.2.1.3.1.10.2.0=6400

此外类似设备防火墙配置(华为OLT是sysman命令),SNMP通讯字串的配置等常规的坑就不用细说了吧。

你可能感兴趣的:(2019-01-07 安装Nagios监控华为OLT遇到的坑)