nagios总结

nagios的功能是监控服务和主机,但是他自身并不包括这部分功能的代码,所有的监控、检测功能都是有插件来完成的。

再说报警功能,如果监控系统发现问题不能报警那就没有意义了,所以报警也是nagios很重要的功能之一。但是,同样的,nagios自身也没有报警部分的代码,甚至没有插件,而是交给用户或者其他相关开源项目组去完成。

nagios安装,是指基本平台,也就是nagios软件包的安装。它是监控体系的框架,也是所有监控的基础。打开nagios官方的文档,会发现nagios基本上没有什么依赖包,只要求系统是linux或者其他nagios支持的系统。不过如果你没有安装apache(http服务),那么你就没有那么直观的界面来查看监控信息了,所以apache姑且算是一个前提条件。关于apache的安装,网上有很多,照着安装就是了。安装之后要检查一下是否可以正常工作

http://bbs.linuxtone.org/thread-2328-1-1.html

检查NRPE正确安装与否命令:

[root@cstwo ~]#/usr/local/nagios/libexec/check_nrpe -H  localhost

检查nagios配置文件语法错误:

[root@cstwo ~]#/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

Linux下Nagios的安装与配置

http://www.cnblogs.com/mchina/archive/2013/02/20/2883404.html

可知linux客户端需要的软件有:nagios-plugins、nrpe

windows客户端需要安装:NSClient++.msi文件


Nagios服务器/usr/local/nagios/etc/objects目录下放被监控主机的cfg配置文件,使用use引用templates.cfg模板中的对象属性,

[root@centos objects]#vi /usr/local/nagios/etc/objects/windows.cfg

define host{

        use             windows-server  ; Inherit default values from a template

        host_name       server  ; The name we're giving to this host

        alias           My Windows Server       ; A longer name associated with the host

        address         192.168.0.8     ; IP address of the host

        }

在相关文件添加此主机,最后在/usr/local/nagios/etc/nagios.cfg文件中添加该路径,重启nagios服务就会在WEB出现。

上面是少量监控的配置方法。


★★★★nagios服务器监控linux主机的操作

必须下载安装nrpe-2.*.tar.gz

tar xzf nrpe-2.8.1.tar.gz 

cd nrpe-2.8.1 

./configure 

make all 

make install-plugin

-------------------

tar xzf nrpe-2.8.1.tar.gz 

cd nrpe-2.8.1 

./configure 

make all 

make install-plugin 

make install-daemon 

make install-daemon-config 

为被监控远程主机自定义host和service

1、定义check_nrpe命令

在文件/usr/local/nagios/etc/objects/commands.cfg后面增加:

# 'check_nrpe' command definition

define command{

command_name check_nrpe

command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -t 30 -c $ARG1$

}

2、创建/usr/local/nagios/etc/objects/remotehost.cfg

#host定义示例部分:

define host{

use linux-server

host_name remotehost

address 192.168.0.252

}

#Service定义示例部分:

define service{

use generic-service

service_description Root Partition

check_command check_nrpe!check_disk

}

3、添加此文件到nagios.cfg全局配置文件中

vi /usr/local/nagios/etc/nagios.cfg

cfg_file=/usr/local/nagios/etc/objects/remotehost.cfg


★★★★★添加大量被监控主机方法

需要新建的文件:contactgroups.cfg  contacts.cfg  hostgroups.cfg  hosts.cfg services.cfg  timeperiods.cfg  

http://sery.blog.51cto.com/10037/20520

创建hostgroups.cfg主机组文件

◆vi /usr/local/nagios/etc/objects/hostgroups.cfg       //主机组配置文件路径

define hostgroup{

hostgroup_name       http_hosts

alias       http_hosts

members       red,centos        ;多个主机逗号分开

}

类似该文档下面继续添加。

也可以创建一个文件加入多个被监控主机的信息

◆vi /usr/local/nagios/etc/objects/hosts.cfg          //主机配置文件路径

define host{

         host_name      centos

         alias       centos

         address       192.168.0.253

         max_check_attempts       5

         #check_interval       1

         #retry_interval       1

         check_period       24x7

         contact_groups       sa_groups

         notification_interval       30

         #first_notification_delay       

         notification_period       24x7

         notification_options      d,u,r

         }

copy以上内容,替换主机名和ip即可, 如:red-192.168.0.252。新建另外一个文件名,之后在nagios.cfg文件中添加“cfg_file=/usr/local/nagios/etc/objects/{新文件名}.cfg”,别忘记chown修改此文件权限。其他类似。

◆vi /usr/local/nagios/etc/objects/services.cfg       //服务配置文件路径

define service {

        host_name        centos  

        service_description   check-host-alive

        check_period          24x7

        max_check_attempts    4

        normal_check_interval 3

        retry_check_interval  2

        contact_groups        http_hosts 

        notification_interval   10

        notification_period     24x7

        notification_options    w,u,c,r

        check_command           check-host-alive  //检查主机是否存活

        }

copy以上内容,修改主机名和ip即可

◆vi timeperiods.cfg    //监视时段配置文件路径

define timeperiod{

        timeperiod_name 24x7

        alias           24 Hours A Day, 7 Days A Week

        sunday          00:00-24:00

        monday          00:00-24:00

        tuesday         00:00-24:00

        wednesday       00:00-24:00

        thursday        00:00-24:00

        friday          00:00-24:00

        saturday        00:00-24:00

        }

◆vi contacts.cfg       //联系人配置文件路径

define contact {

        contact_name         sa    //不要有空格

        alias                system administrator

        service_notification_period    24x7

        host_notification_period       24x7

        service_notification_options   w,u,c,r

        host_notification_options       d,u,r

        service_notification_commands  service-notify-by-sms,service-

notify-by-email  //这个命令读配置文件miscommands.cfg

        host_notification_commands     host-notify-by-email,host-noti

fy-by-sms      //这个命令读配置文件miscommands.cfg

        email                          [email protected]

        pager                          13333333333 //手机号,收报警短信

        }  

替换修改其他联系人也可

◆vi contactgroups.cfg  //联系组配置文件路径

define contactgroup {

        contactgroup_name    sagroup  //不要用空格

        alias                system administrator group

        members              sa,sery  //本例有2个成员

}

把以上所有创建的文件添加在nagios.cfg全局配置文件中


Starting nagios:This account is currently not available nagios启动报错

解决方法:

修改/etc/passwd

将/sbin/nologin改成/bin/bash


★★NRPE客户端的安装

http://blog.csdn.net/jiedushi/article/details/6524375

nagios 客户端安装LINUX

./configure

make all

make install-plugin

make install-daemon

make install-daemon-config

yum install xinetd

make install-xinetd


你可能感兴趣的:(nagios,check_nrpe)