一、在nagios服务端的/usr/local/nagios/etc/下创建monitorhosts文件夹
#mkdir /usr/local/nagios/etc/monitorhosts
#chown nagios.nagios /usr/local/nagios/etc/monitorhosts
编辑nagios.cfg文件,添加:
cfg_dir=/usr/local/nagios/etc/monitorhosts
并注释cfg_file=/usr/local/nagios/etc/objects/localhost.cfg
#/etc/init.d/nagios restart
二、编辑联系人文件contacts.cfg
#vi /usr/local/nagios/etc/object
添加以下行:
define contact{
contact_name IT#定义一个联系人简称
use generic-contact
alias IT#联系人具体描述
email 联系人邮箱
}
define contactgroup{ #定义联系人组
contactgroup_name IT#联系组名称
alias IT#联系组别名
members IT#联系组成员
三、nagios服务端配置文件/usr/local/nagios/etc/monitorhosts
添加主机组:members中的主机配置文件中没有主机组
define hostgroup{
hostgroup_name servers 主机组名
alias Servers 主机组名描述
members 此处添加主机名
}
添加监控项:
define service{
use generic-service
host_name 此处写主机名
service_description 此处写监控项
check_command check_nrpe! -H IP -c check_memory
max_check_attempts 3#最大失败尝试次数,为1时只报警不重新检测
check_period 24x7#检测时间段
normal_check_interval 10#常规检测时间间隔,默认60分(常规检测是指无论服务状态是否正常,检测次数达到“最大次数”时)
retry_check_interval 2#失败尝试间隔时间,默认60分(失败尝试是指服务状态不正常,检查次数达到“最大次数”时)
notifications_enabled 1#为1时发送报警邮件,为0不发送
notification_interval 10#服务不正常时通知联系人的时间间隔
notification_period 24x7#通知联系人时间段
notification_options w,u,c,r#通知联系人选项,w警告,u未知,c危急,f启动和停止,n不发送通知
contact_groups IT#联系人组
}
四、被监控端文件配置
#vi /usr/local/nagios/etc/nrpe.cfg
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/hda1
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200
command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%
#/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d