最近公司上线了一批HP ProLiant DL360 Gen10的服务器,Gen10服务器官方不在支持HP代理(HP-Health、hp-anmp-agents )软件包更新,之前通过SNMP和HP代理的方式监控硬件的方法不能在G10服务器上面应用 。
关于HP Gen5-Gen9的服务器如何通过SNMP和HP代理监控服务器的硬件,请参考我之前在51CTO博客写的文章。Zabbix通过SNMP监控HP服务器硬件信息
HP Gen10 ILO5虽然提供syslog、Email和SNMPTrap的方式可以进行硬件监控,但是push过来的信息不容易理解和处理。后来通过google查阅资料发现HP gen10服务器硬件监控通过HP AMS(HP Agentless Management Service)软件包进行监控,通过该工具用户可以在OS层面通过snmp获取服务器硬件状态信息。Windows和Linux系统官网都支持该软件包。官网驱动程序下载地址
HP Gen10服务器通过AMS监控硬件对操作系统版本的要求如下。
Centos服务器:Support for HPE Gen10 platforms requires CentOS 6.9 or higher.
Ubuntu服务器:Support for HPE Gen10 platforms requires Ubuntu 16.04.3 (HWE Kernel) or higher.
下面是通过在Centos 6.9上面通过HP AMS监控HP Gen10服务器的硬件方法,amsd和ssacli工具需要到官方网站下载。
1)安装SNMP服务和HP硬件监控的驱动程序。
yum install -y net-snmp net-snmp-util
rpm -ivh amsd-1.3.0-2803.25.rhel6.x86_64.rpm
#HP管理工具 支持Centos 6-7
rpm -ivh ssacli-3.30-14.0.x86_64.rpm
2)编辑SNMP的配置文件,线上SNMP服务Zabbix监控目前只做硬件信息的采集(不做性能数据采集)。为了安全性考虑,对于Linux服务器的snmp配置,做了如下修改。
1.1 snmp community 密码由原来默认的public修改为[email protected]。
1.2 增加得了白名单功能,目前只允许监控的机器来获取snmp的信息。
1.3 通过SNMP VIEW功能只允许通过snmp获取服务器硬件信息,其它系统信息和信息性能获取不到。
[root@monitor ~]# cat /etc/snmp/snmpd.conf |egrep -v "(^#|^$)"
master agentx # This line is support gen10 sever hardware monitor
com2sec notConfigUser x.x.x.x [email protected]
com2sec notConfigUser x.x.x.x [email protected]
group notConfigGroup v1 notConfigUser
group notConfigGroup v2c notConfigUser
view hardwareview included 1.3.6.1.4.1.232.
access notConfigGroup "" any noauth exact hardwareview none none
syslocation Unknown (edit /etc/snmp/snmpd.conf)
syscontact Root (configure /etc/snmp/snmp.local.conf)
3)启动相关的服务。AMS有两种工作模式,即forward和reverse两种,两种模式对应两种服务,服务器硬件监控是通过reverse模式通过os获取硬件状态的,只需要开启smad_rev服务即可,不需要开启amsd_rev服务。
AMS (forward mode) – The standard configuration of AMS is to pass information from the OS toiLO.
SMA (reverse mode) – When SMA is enabled, information is passed from iLO to the OS.
/etc/init.d/snmpd start
/etc/init.d/smad_rev start
#如果能获取到值,说明snmp和sma相关配置和服务都正常
[root@monitor ~]# snmpwalk -v2c -c [email protected] 192.168.202.2 1.3.6.1.4.1.232.3.2.2.1.1.6
SNMPv2-SMI::enterprises.232.3.2.2.1.1.6.0 = INTEGER: 2
4)新建主机,添加snmp接口并Link HP硬件监控的模板。
5)最后检查监控主机Items,查看服务器的硬件监控的整列卡、硬盘、电源、风扇等的Items是否正常。监控模板是通过Zabbix Low-level discovery 自动创建监控项、触发器和图像。如果需要监控模板,请留言并填写邮箱地址。
服务器硬盘的监控:
服务器风扇监控:
总结:
1)SNMP协议是通用的,该模板不仅可以监控HP Linux机器,还可以监控HP Windows机器。
2)HP监控服务器硬件常用的OID,支持HP Gen5-Gen10的服务器。
HP阵列卡状态:1.3.6.1.4.1.232.3.2.2.1.1.6
物理磁盘状态:1.3.6.1.4.1.232.3.2.5.1.1.6
逻辑磁盘状态:1.3.6.1.4.1.232.3.2.3.1.1.4
HP服务器电源状态:1.3.6.1.4.1.232.6.2.9.3.1.5
HP服务器风扇的状态:1.3.6.1.4.1.232.6.2.6.7.1.9
HP部件温度:1.3.6.1.4.1.232.6.2.6.8.1.4
参考文档:
1)官方文档:https://support.hpe.com/hpsc/doc/public/display?docId=emr_na-a00026111en_us&docLocale=en_US#N101A0
2)参考资料:https://thwack.solarwinds.com/thread/115630