nagios监控dell服务器硬件状态

适用于DELL 服务器的整体式硬件监控,局限性就是要OMSA有软件漏洞,乐子有点大了。


客户端配置
windows
1,安装对应windows对应版本的DELL OMSA软件(OM-SrvAdmin-Dell-Web-WIN-6.3.0-2075_A00.20.exe)
2,安装SNMP协议,设置用户名,和访问权限及IP

3,重新启动SNMP服务
Linux
1,安装OMSA依赖包
   compat-libstdc++-33-3.2.3-61.i386.rpm
   procmail-3.22-17.1.el5.centos.i386.rpm
   procmail-3.22-17.1.el5.centos.x86_64.rpm
2,修改/etc/redhat-release,在CentOS release 5.5 (Final)后面添加Tikanga
3,安装对应linux对应版本的DELL OMSA软件(OM_6.1.0_ManNode_A00.tar.gz),需新建文件夹,放入OMSA软件,在解压
   sh ./setup
   有三次选择,
   输入y, 表示接受协议,
   输入6,表示选择全部组件,
   输入i,    表示安装所选择
   安装时提示安装的路径,选择默认路径的就行(/opt/dell/srvadmin/)
   安装完成之后会自动提示是否启动,请选择是。
   srvadmin-services.sh在解压目录下的linux/supportscripts里,需要拷贝过去。
   cp -r 解压目录下的linux/supportscripts /opt/dell/
   手动启动,停止,重启相关命令
   运行Dell OpenManage:
   srvadmin-services.sh  start
   停止openManage的命令为:
   srvadmin-services.sh stop
   开机自启动:
   srvadmin-services.sh  enable
   关闭开机自启动:
   srvadmin-services.sh disable

4,检查snmp软件,如没有则安装SNMP协议,设置用户名,和访问权限

5,重启SNMP服务

服务端配置
Linux
1,安装相关Perl-snmp软件包
   perl-Crypt-DES-2.05-3.2.el5.rf.i386.rpm
   perl-Digest-HMAC-1.01-2.2.el5.rf.noarch.rpm
   perl-Digest-SHA1-2.12-2.el5.rf.i386.rpm
   perl-Net-SNMP-5.2.0-1.2.el5.rf.noarch.rpm
   perl-Socket6-0.23-1.el5.rf.i386.rpm
   安装顺序安装其他包,最后安装perl-Net-SNMP-5.2.0-1.2.el5.rf.noarch.rpm
2,上传linux版本check_openmanage软件
3,添加nagios配置文件内check_openmanage的设置

实例:
检测的服务器:
define host {
    use             server
    host_name       192.168.1.2
    alias           Dell_OMSA
    address         192.168.1.2
}

添加的新检测命令
#Openmanage check via SNMP
define command {
    command_name    check_hardware
    command_line    /home/check_openmanage/check_openmanage -H $HOSTADDRESS$ -C OMSA -b $ARG1$(-c 为snmp -b 为黑名单,有专门文档说明)
}

define command {
    command_name    check_hardware_alertlog
    command_line    /home/check_openmanage/check_openmanage -H $HOSTADDRESS$ -C OMSA --only=alertlog
}

检测OMSA的service写法
# Dell OMSA status
define service {
    use                        service
    host_name                  192.168.1.2
    service_description        check_hardware
    check_command              check_hardware!crtl=0(屏蔽的报警项,具体需要查询资料)
}

define service {
    use                         service
    host_name                  192.168.1.2
    service_description                check_hareware_alertlog
    check_command              check_hardware_alertlog
}

4,重启nagios

在某公司时都是dell服务器,领导要弄硬件监控,我先弄得ipmitool命令行工具来写脚本,后来觉得太扯淡,就查了下nagios的硬件监控相关插件,发现了这个插件,很不错,我们测试过连双电源掉电源,机箱盖打开等动作都能侦测到并报警。

参考资料:http://folk.uio.no/trondham/software/check_openmanage.html

 

你可能感兴趣的:(职场,dell,nagios,休闲,硬件监控)