监控对于对于系统管理人员的日常运维工作来说是非常重要的,而比较知名的开源监控软件有Ganglia、Cacti、Nagios、Zabbix等等,而本次就简单的说下Nagios的安装部署,因为Nagios是基于web页面查看管理的,那可以选用lamp或者是lnmp这些比较容易实现的web系统框架来实现即可,Nagios的官网是:https://www.nagios.org/downloads/,当然下载版本建议用最新的稳定版。Nagios的监控实现是由各个插件来完成的它本身是没有监控功能的,所以Nagios使用非常灵活,而在需要监控不同的平台主机、硬件时用不同的插件,下面从网页上找的一张图能很好的说明:
从图中得知Nagios监控中的插件SNMP在不同平台的主机、硬件上都有用到,而Linux中有send-nsca和NRPE一般我们常用的是NRPE,监听的是tcp的5666端口;而在Windows主机上使用的是NSClient++,监听的是12489和5666端口,这一点很重要做为被监控的主机上一定要开放这些端口。
在安装Nagios之前需要先安装Nagios的监控主机(server端),然后再到被监控主机(clinet端)上安装相应的插件。
1、server端:
在安装之前先要检查依赖包
[root@localhost ~]# yum -y groupinstall "Development Tools" "Development Libraries"#在配置好yum源的主机上,先检查下开发包组是否安装 或 [root@localhost ~]# yum -y install httpd php php-mysql gcc glibc glibc-common gd gd-devel sendmail openssl-devel#这里是测试就没有用编译包的php和apache,一般来说建议使用编译包
在依赖关系解决后就开始正常的Nagios安装,先安装Nagios的核心引擎和web页面
[root@bogon ~]# groupadd -r nagcmd#添加nagcmd组 [root@bogon ~]# useradd -M -G nagcmd -r -s /bin/bash nagios [root@bogon ~]# passwd nagios#在这里建议设定用户密码,不要使用/sbin/nologin,不然之后的Nagios服务无法启动,主要是启动脚本中需要切换至Nagios用户去创建验证文件,当然也可以把脚本中check_config函数中的用su切换用的部分修改 [root@bogon ~]# usermod -a -G nagcmd apache#把nagcmd组附属在apache组 [root@bogon ~]# cd /usr/local/src/nagios-4.3.1 [root@bogon nagios-4.3.1]# ./configure --prefix=/usr/local/nagios --with-command-group=nagcmd --enable-event-broker [root@bogon nagios-4.3.1]# make all && make install && make install-config && make install-init && make install-commandmode && make install-exfoliation && make install-classicui [root@bogon nagios-4.3.1]# make install-commandmode && make install-config#添加相应的插件 [root@bogon nagios-4.3.1]# vim /usr/local/nagios/etc/objects/contacts.cfg#修改邮件接收人的配置文件,在此就不做过多的说明,配置文件的注释里都有,主要改的就是邮箱地址 [root@bogon nagios-4.3.1]# make install-webconf#配置web配置文件 [root@bogon nagios-4.3.1]# htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin#配置Nagios的页面密码 New password: Re-type new password: Adding password for user nagiosadmin
到此nagios的核心引擎和基本web页面就已经安装完毕,在此直接启动httpd后使用浏览器测试下
此时的Nagios是不具备任何监控功能,因为这台Nagios主机是Linux服务器,所以监控插件在这里选比较常用的nrpe,在安装nrpe之前要先安装好Nagios的插件plugins
[root@localhost nagios-4.3.1]# cd ../nagios-plugins-2.1.4 [root@localhost nagios-plugins-2.1.4]# ./configure --with-nagios-user=nagios --with-nagios-group=nagios [root@localhost nagios-plugins-2.1.4]# make && make install [root@localhost nagios-plugins-2.1.4]# chkconfig --add nagios#添加Nagios的服务 [root@localhost nagios-plugins-2.1.4]# chkconfig nagios on#Nagios开机自启动 [root@localhost nagios-plugins-2.1.4]# /etc/init.d/nagios start [root@localhost nagios-plugins-2.1.4]# getenforce#此处要注意的是要检查是否服务器上有开启selinux,如果有开启要选择关闭吧或者在selinux中添加nagios的相应文件到可以执行的标签中 Enforcing [root@localhost nagios-plugins-2.1.4]# chcon -R -t httpd_sys_content_t /usr/local/nagios/sbin/ [root@localhost nagios-plugins-2.1.4]# chcon -R -t httpd_sys_content_t /usr/local/nagios/share/
此时在server端上的Nagios的插件就已经安装完毕,此时便可以安装Nagios的nrpe插件
[root@localhost nagios-plugins-2.1.4]# cd ../nrpe-3.0.1/ [root@localhost nrpe-3.0.1]# ./configure --with-nrpe-user=nagios --with-nrpe-group=nagios --with-nagios-user=nagios --with-nagios-group=nagios --enable-command-args --enable-ssl [root@localhost nrpe-3.0.1]# make all && make install-plugin
这样在server端上的Nagios就已经安装部署完毕,此时Nagios已经可以自行监控本机。
2、clinet端:
此处的客户端为了快速简单的部署实现,在这里就用另外一台Linux服务器来搭建。同理,在Nagios的client端下也要添加相应的用户。当然,也要先安装好Nagios的插件
[root@bogon ~]# useradd -M -r -s /sbin/nologin nagios [root@bogon ~]# cd /usr/local/src/ [root@bogon src]# cd nagios-plugins-2.1.4 [root@bogon nagios-plugins-2.1.4]# ./configure --with-nagios-user=nagios --with-nagios-group=nagios [root@bogon nagios-plugins-2.1.4]# make all && make install
在插件安装完毕后开始安装nrpe
[root@bogon nagios-plugins-2.1.4]# cd ../nrpe-3.0.1/ [root@bogon nrpe-3.0.1]# ./configure --enable-ssl [root@bogon nrpe-3.0.1]# make all && make nrpe && make check_nrpe && make install && make install-plugin && make install-daemon && make install-config && make install-init
到这里Nagios的nrpe部分就安装结束了,以下做一些基本配置
[root@bogon nrpe-3.0.1]# vim /usr/local/nagios/etc/nagios/nrpe.cfg …略… allowed_hosts=192.168.218.128 #在这里的ip改成server端的Nagios的监听ip …略… command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/hda1 #此处根据磁盘的实际使用的盘符情况修改 …略… [root@bogon nrpe-3.0.1]# /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
在安装好后做一些基本的验证,这里要注意的是这些验证需要在监控server主机上做,被监控主机需要开启5666端口
[root@bogon nrpe-3.0.1]# cd /usr/local/nagios/libexec/ [root@bogon libexec]# ./check_nrpe -H 192.168.218.129#检查被监控主机的IP,这样有打印出版本号就是正常的 NRPE v3.0.1
这样Nagios的安装就完成了,而Nagios的家目录或文件的含义也很简单,如下:
目录 |
解释 |
---|---|
bin |
Nagios的二进制文件的目录 |
sbin | Nagios CGI 文件所在目录,也就是执行外部命令所需文件所在的目录 |
share | Nagios网页文件所在的目录,建议这里去找一下中文的资料便于查阅 |
libexec | Nagios 外部插件所在目录 |
var | Nagios 日志文件、lock 等文件所在的目录 |
var/archives | Nagios 日志自动归档目录 |
var/rw | 用来存放外部命令文件的目录 |
当然我这里是指定Nagios的配置文件路径在/usr/local/nagios/etc路径下,如果没有指定的话默认缺省是在Nagios的家目录下,而配置的一些文件或目录的含义也很简单,关系如下:
文件名或目录名 | 用途 |
---|---|
cgi.cfg | 控制CGI访问的配置文件 |
nagios.cfg | Nagios 主配置文件 |
resource.cfg | 变量定义文件,又称为资源文件,在些文件中定义变量,以便由其他配置文件引用,如$USER1$ |
objects | objects 是一个目录,在此目录下有很多配置文件模板,用于定义Nagios 对象 |
objects/commands.cfg | 命令定义配置文件,其中定义的命令可以被其他配置文件引用 |
objects/contacts.cfg |
定义联系人和联系人组的配置文件 |
objects/localhost.cfg | 定义监控本地主机的配置文件 |
objects/printer.cfg | 定义监控打印机的一个配置文件模板,默认没有启用此文件 |
objects/switch.cfg | 定义监控路由器的一个配置文件模板,默认没有启用此文件 |
objects/templates.cfg | 定义主机和服务的一个模板配置文件,可以在其他配置文件中引用 |
objects/timeperiods.cfg | 定义Nagios 监控时间段的配置文件 |
objects/windows.cfg | 监控Windows 主机的一个配置文件模板,默认没有启用此文件 |
在此时Nagios还是不能用的还有一些基础配置需要修改才能正常的使用,在这里为了便于管理可以把nagios.cfg的配置文件中使用cfg_file的全部注释掉全部使用cfg_dir
…略… cfg_dir=/usr/local/nagios/etc/servers cfg_dir=/usr/local/nagios/etc/objects …略…
,在server端进入sysconfigdir目录,先要根据实际情况修改一下commandss.cfg文件,添加以下内容:
[root@bogon nagios]# vim objects/commands.cfg define command{ command_name check_nrpe command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ }
在Nagios的默认配置文件下是没有Linux的配置文件所以如果是用于监控Linux主机,需要自行定义写配置文件,在此就用简单的写了一个Linux下使用的模板:
[root@bogon nagios]# vim objects/linux.cfg define host{ use linux-server host_name linuxhost alias My linux Server address 192.168.218.129 ;这里填被监控主机的IP } define service{ use generic-service host_name linuxhost service_description CHECK_USERS check_command check_nrpe!check_users } define service{ use generic-service host_name linuxhost service_description CHECK_LOAD check_command check_nrpe!check_load } define service{ use generic-service host_name linuxhost service_description CHECK_SDA1 check_command check_nrpe!check_sda1 } define service{ use generic-service host_name linuxhost service_description CHECK_ZOMBIE_PROCS check_command check_nrpe!check_zombie_procs } define service{ use generic-service host_name linuxhost service_description CHECK_TOTAL_PROCS check_command check_nrpe!check_total_procs } [root@bogon nagios]# chown nagios:nagios linux.cfg#修改下配置文件的属组
在linux.cfg配置文件修改好后还需要 在nagios.cfg添加环境变量:
[root@bogon nagios]# vim nagios.cfg …略… cfg_file=/usr/local/nagios/etc/nagios/objects/linux.cfg …略…
正在修改后可以用Nagios的配置文件验证检查
[root@bogon nagios]# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios/nagios.cfg Nagios Core 4.3.1 Copyright (c) 2009-present Nagios Core Development Team and Community Contributors Copyright (c) 1999-2009 Ethan Galstad Last Modified: 02-23-2017 License: GPL Website: https://www.nagios.org Reading configuration data... Read main config file okay... Read object config files okay... Running pre-flight check on configuration data... Checking objects... Checked 13 services. Checked 2 hosts. Checked 1 host groups. Checked 0 service groups. Checked 1 contacts. Checked 1 contact groups. Checked 25 commands. Checked 5 time periods. Checked 0 host escalations. Checked 0 service escalations. Checking for circular paths... Checked 2 hosts Checked 0 service dependencies Checked 0 host dependencies Checked 5 timeperiods Checking global event handlers... Checking obsessive compulsive processor commands... Checking misc settings... Total Warnings: 0 Total Errors: 0 Things look okay - No serious problems were detected during the pre-flight check [root@bogon nagios]# /etc/init.d/nagios restart
像这样就是没有报错的,再重启下Nagios就可以了,这样基本的Nagios的安装就完毕了,这里需要注意的是在Nagios的server端需要开启80、443端口用于Web管理页面的正常浏览,当然这也是一些基本的配置部署,如果要实现更多的功能还需要进一步的修改配置文件。