DELL服务器结合nagios硬件监控、报警

 

此次安装的 dell硬件监控所支持的dell服务器为1950、2950、R410公司服务器有限暂且测试dell这3款服务器型号,测试硬件监控系统程序为Centos 5.4\5.3\5.2 Windows 2003 操作系统。本篇文章为了方便大家监控dell的硬件如风扇转速,主板温度,硬盘状况等等硬件状况,有助于更好地管理服务器的硬件信息。
 
一、  客户端安装dell硬件监控软件:
 
1 linux操作系统:
(1) 安装OMSA( OM_6.1.0_ManNode_A00.tar.gz)所依赖包
   compat-libstdc++-33-3.2.3-61.i386.rpm
   procmail-3.22-17.1.el5.centos.i386.rpm
   procmail-3.22-17.1.el5.centos.x86_64.rpm
 
(2) 修改/etc/redhat-release,在 CentOS release 5.4 (Final)后面添加Tikanga (5.3\5.2\版本都需要在后面添加)
 
Vi /etc/redhat-release
CentOS release 5.4 (Final)Tikanga
(3) 安装对应 linux对应版本的DELL OMSA软件(OM_6.1.0_ManNode_A00.tar.gz),需新建文件夹,放入OMSA软件,在解压
 
 创建目录: Mkdir OMSA
解压 OM:Tar zxf OM_6.1.0_ManNode_A00.tar.gz -C OMSA
进入 OMSA目录:Cd OMSA
执行 setup脚本:/bin/sh setup.sh
此时会看到一个 dell协议按空格键阅读到100%自动跳转到安装界面有三次选择,
输入 y, 表示接受协议,
 输入 6,表示选择全部组件,
 输入 i, 表示安装所选择
安装时提示安装的路径,选择默认路径的就行 (/opt/dell/srvadmin)
安装完成之后会自动提示是否启动,请选择是。
 
(4) 拷贝srvadmin-services.sh
srvadmin-services.sh在解压目录下的 linux/supportscripts里,需要拷贝过去。
 cp -r 解压目录下的 linux/supportscripts /opt/dell/
手动启动,停止,重启相关命令 :
 运行 Dell OpenManage:
 srvadmin-services.sh start
 停止 openManage的命令为:
 srvadmin-services.sh stop
 开机自启动:
 srvadmin-services.sh enable
 关闭开机自启动:
 srvadmin-services.sh disable
 
(5) 重启SNMP服务
Service snmpd restart
 
到此linux客户端dell硬件监控软件安装完毕。
 
2 Windows操作系统:
 (1) 安装OM-SrvAdmin-Dell-Web-WIN-6.3.0-2075_A00.20.exe
   首先双击 OM-SrvAdmin-Dell-Web-WIN-6.3.0-2075_A00.20.exe解压到自定义目录,生成OpenManage目录双击目录进入windows目录,双击setup.exe
   Windows安装简单按照安装提示默认安装就可以,安装成功后会在桌面显示出 server Administrator   管理软件图标,此时说明安装成功双击管理软件可以显示出登陆界面账号密码为你本机的管理员账号密码,进入管理界面后,你所能看到的任何硬件都可以监控。
  (2) 重启snmp服务
   点击开始运行 cmd
   输入: services.msc
   打开服务项找到 snmpd服务重启。
 
至此windows客户端dell硬件监控软件安装完毕。
 
说明:安装dell硬件监控软件linux 和windows系统时都有后台免打扰安装,方便如公司有自动安装系统机时整合dell硬件监控软件安装。
 
Windows 免打扰安装参数:
   此时需要提取OpenManage目录下的windows目录内SystemsManagement目录使用此目录内的SysMgmt.msi进行免打扰安装
   %systemdrive%\SystemsManagement\SysMgmt.msi /passive /norestart
Linux 免打扰安装参数:
   再上面所说的执行/bin/sh setup.sh 脚本时,在后面加入-x –a2个参数
   -x 参数含义安装所有部件(包括“RAC”,如果有的话)
  别的选择通过将被忽略。
   -a 参数含义—autostart自动安装在组件已经完成后开始安装服务
 
 
 
二、  服务端安装dell硬件监控相关插件:
 (1) 安装相关 Perl-snmp软件包
   perl-Crypt-DES-2.05-3.2.el5.rf.i386.rpm
   perl-Digest-HMAC-1.01-2.2.el5.rf.noarch.rpm
   perl-Digest-SHA1-2.12-2.el5.rf.i386.rpm
   perl-Socket6-0.23-1.el5.rf.i386.rpm
perl-Net-SNMP-5.2.0-1.2.el5.rf.noarch.rpm
   安装顺序安装其他包,最后安装 perl-Net-SNMP-5.2.0-1.2.el5.rf.noarch.rpm
 
(2) 上传linux版本 check_openmanage软件
 上传 : check_openmanage-3.6.0.tar.gz
解压: tar zxf check_openmanage-3.6.0.tar.gz
进入目录拷贝: cp check_openmanage /usr/local/nagios/libexec/
 
三、  nagios 服务端添加监控设置
实例:
检测的服务器:
define host {
    use             neiwang-server
    host_name       192.168.36.231
    alias           Dell_OMSA
    address         192.168.36.231
}
 
添加的新检测命令
#Openmanage check via SNMP
define command {
    command_name    check_hardware
    command_line    /usr/local/nagios/libexec/check_openmanage -H $HOSTADDRESS$ -p -C opublic -b $ARG1$-b 为黑名单,有专门文档说明)
}
 
define command {
    command_name    check_hardware_alertlog             command_line    /home/check_openmanage/check_openmanage -H $HOSTADDRESS$ -p -C opublic --only=alertlog
}
 
检测 OMSA的service写法
# Dell OMSA status
define service {
    use                        neiwang-service
    host_name                  192.168.36.231
    service_description        check_hardware!crtl=0(屏蔽的报警项 )
    check_command              check_hardware
}
 
define service {
    use                         neiwang-service
    host_name                  192.168.36.231
    service_description                check_hareware_alertlog
    check_command              check_hardware_alertlog
}
### 
 
重启 nagios
 
到此 dell服务器硬件监控搭配安装到此结束。

最后:仅以此文向我的同事 starrabbit 致敬,因为这篇文章,是他辛苦一小时码字码出来的  starrabbit 威武 starrabbit 万岁。。。

你可能感兴趣的:(snmp,nagios,硬件监控,监控linux,监控windows)