本文首发于烂泥行天下

公司的业务有几台服务器存放在IDC机房中,说是双线路。但是我看到网卡的配置是单网卡双IP的形式。如下:

烂泥:nagios监控单网卡双IP_第1张图片

烂泥:nagios监控单网卡双IP_第2张图片

而公司这边的线路是联通的IP,如下:

烂泥:nagios监控单网卡双IP_第3张图片

nagios监控搭建在公司内部,由于南北线路联通的问题。导致公司这边nagios监控IDC机房中的服务器经常误报。特别是一大夜间,妹的,误报的信息多的都让人头疼。如下:

烂泥:nagios监控单网卡双IP_第4张图片

刚开始怀疑是公司路由器不稳定导致的。但是重启了几次后,还是这样的问题。,如下:

烂泥:nagios监控单网卡双IP_第5张图片

查看nagios监控其中一台服务器的IP地址为电信IP。如下:

烂泥:nagios监控单网卡双IP_第6张图片

在公司内部白天ping该IP地址,一切都正常。但是一到晚上那个丢包严重的,我都不好意思截图了。

后来猜想是不是因为这个问题导致的,因为nagios有一定的监测周期。如果在一段时间内,获取不到数据,那么nagios就会发邮件通知。

果断把nagios监测该服务器的IP地址修改为联通的IP,如下:

烂泥:nagios监控单网卡双IP_第7张图片

修改完毕后,重启nagiso,进行监控,如下:

/etc/init.d/nagios restart

烂泥:nagios监控单网卡双IP_第8张图片

观察一段时间后,发现还是不行,还会是误报信息。

这客人让人头疼,ping那个联通的IP也是通的。如下:

烂泥:nagios监控单网卡双IP_第9张图片

后来仔细观察该服务器上的IP地址配置,如下:

烂泥:nagios监控单网卡双IP_第10张图片

发现在默认网关中只有电信的IP,而没有联通的IP。猜想是不是因为这个原因导致的,果断添加进去。如下:

烂泥:nagios监控单网卡双IP_第11张图片

添加完毕后,重启nagios,再次监控。发现还是误报,这次坑爹了。在想不出问题出在什么地方,就胡乱的点击。突然发现在网卡显示的IP出与网卡配置的IP有一定的出入,如下:

烂泥:nagios监控单网卡双IP_第12张图片

注意图中标记出来的***部分。

可以看到刚刚在前面添加的联通IP地址作为网关,没有起作用。

这个是怎么回事呢?查了相关资料还是没有头绪。

测试下把原来电信IP的网关删除,添加联通IP后,再次重新添加电信IP,却发现可以正常监测。如下:

烂泥:nagios监控单网卡双IP_第13张图片

查看该服务器的路由表,如下:

route print

烂泥:nagios监控单网卡双IP_第14张图片

现在我怀疑,由于原来使用的是电信IP作为默认网关。造成nagios在接收数据是,造成网络不稳定。这样就导致了nagios的误报。

到此nagios的误报已经大大减少了……