nagios优化

一直在使用nagios做系统的监控管理,最多的一台nagios服务器已经管理了769台机器,5658个服务,运行良好,状态更新很及时,但在这个过程中做了很多优化,在此列举一下。

1.调整external_command_buffer_slots

nagios的命令都是通过这个接收的,处理不过来的命令都会在这排队,如果你管理的service较多,建议将这个值调大。

2.避免servicegroup,hostgroup过大

有一次我的一个servicegroup下的service达到了3670个,导致nagios plugin返回127.将这个servicegroup下的service降到2900个后恢复正常。

3.设置use_large_installation_tweaks

这个设置缺省是关闭的,在监控的service较多的情况下,建议打开这个设置。

4.调整max_concurrent_checks

如果有部分service的监控状态一直不更新,建议将这个配置适度调大。参考值15

5.调整check_result_reaper_frequency

这个配置决定了处理检查结果的频率,如果这个值太大,会导致监控service的状态更新延时变大。参考值5

6.调整max_check_result_reaper_time

这个配置决定了每次处理检查结果最多可以花费的时间。这个值太大或太小都会导致监控service的状态更新延时变大。参考值5


你可能感兴趣的:(nagios优化)