http://www.361way.com/nagios-dell-omsa/2703.html
nagios 监控DELL服务器硬件
nagios和DELL OMSA配合可以实现对dell 服务器硬件的监控 ,OMSA是Openmanage Server Administrator 的缩写 。OMSA由以下几个组件组成:
srvadmin-base: Install only base OMSA, no web server
srvadmin-webserver: Install Web Interface
srvadmin-storageservices: Install RAID Management
srvadmin-rac4: Install components to manage the Dell Remote Access Card 4
srvadmin-rac5: Install components to manage the Dell Remote Access Card 5
以上组件可以根据需要单独装,也可以通过安装srvadmin-all (Install all OMSA components)全部安装 具体参看 DELL wiki 页 。
一、OMSA的安装及使用
DELL 针对redhat/centos等使用yum源的server做的有单独的yum源安装 。具体可以通过以下命令新增OMSA源安装所有组件:
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
yum install srvadmin-all
具体请参看 最新DELL OMSA源及安装方法 。
默认安装好的组件位置位于/opt/dell/srvadmin目录 。按如下操作,启动srvadmin services:
cd /opt/dell/srvadmin/sbin/
sh srvadmin-services.sh start
只有首次安装完后,需要执行此操作,以后重启的机器时,会自动启用srvadmin服务,因为其在/etc/init.d目录下有三个服务:dsm_om_connsvcd、dsm_om_shrsvcd、dsm_sa_datamgrd 。
启动完该服务后,可以通过https://本机IP:1311 打开DELL OMSA页面,其中登陆用户名密码是系统用户和密码 。
进入查看固件版本,可能会提示“固件版本过时” ,固件版本过时会造成check_openmanage nagios 插件检测时会有类似如下的提示:
Controller 0 [PERC 6/i Integrated]: Firmware '6.0.2-0002' is out of date
所以,安装完后,最好还要保持固件是最新的,升级固件的方法是:
yum install dell_ft_install
yum install $(bootstrap_firmware)
update_firmware --yes
注:以上操作的前提是先增加dell yum 源 ,另外升级完固件需要重新服务器生效。
二、check_openmanage的安装及使用
check_openmanage只是一个perl的脚本,其使用的还是OMSA内部的命令和xsl模块。使用check_openmanage时,必须要安装 srvadmin-all,不然会报xsl not find 。check_openmanage 插件主页及说明 。
1、check_openmanage下载:
wget http://folk.uio.no/trondham/software/check_openmanage-3.7.11/check_openmanage 或
wget http://folk.uio.no/trondham/software/files/check_openmanage-3.7.11.tar.gz
注:两个文件的区别是,第一个下载的是单个perl文件,直接放到nagios的libexec目录就可以用;第二个下载的包含了windows 和 linux下用的版本,并且包含pnp4nagios模板 。
2、check_openmanage的使用
#默认用法
root@361way:[/usr/local/nagios/libexec]./check_openmanage --only fans
FANS OK - 4 fan probes checked
#带输出数据的检测,主要配合pnp4nagios出图
root@361way:[/usr/local/nagios/libexec]./check_openmanage --only fans -p
FANS OK - 4 fan probes checked|F0_System_Board_FAN_1=6750rpm;0;0 F1_System_Board_FAN_2=6600rpm;0;0 F2_System_Board_FAN_3=6450rpm;0;0 F3_System_Board_FAN_4=6750rpm;0;0
#debug 模式,输出详细信息
root@361way:[/usr/local/nagios/libexec]./check_openmanage --only fans -d
System: PowerEdge 2950 III OMSA version: 7.3.0
ServiceTag: JF91G2X Plugin version: 3.7.11
BIOS/date: 2.7.0 10/30/2010 Checking mode: local
-----------------------------------------------------------------------------
Chassis Components
=============================================================================
STATE | ID | MESSAGE TEXT
---------+------+------------------------------------------------------------
OK | 0 | Chassis fan 0 [System Board FAN 1 RPM] reading: 6675 RPM
OK | 1 | Chassis fan 1 [System Board FAN 2 RPM] reading: 6600 RPM
OK | 2 | Chassis fan 2 [System Board FAN 3 RPM] reading: 6450 RPM
OK | 3 | Chassis fan 3 [System Board FAN 4 RPM] reading: 6750 RPM
only后可以跟的检测项有:cpu、memory、storage、fans、batteries、voltage(电压)、temp、power等,像温度和转速之类的有默认告警值,可以在检测时通过-c -w 重新定义。想检测所有项可以使用:
点击查看pnp4nagios check_openmanage监控图 。
三、check_openmaage 配合nagios监控
nagios可以通过nrpe、snmp两种方式对DELL 主机进行监控,具体原理图如下:
关于nagios的配置这里就不多说,无非先定义command,然后在cfg文件中配置监控内容,配置完成后,重启进程使配置生效 。需要特别注意的是无论是nrpe还是snmp方式,被监控主机都必须安装后OMSA 程序 。