最近公司上线了一批HP ProLiant DL360 Gen10的服务器,Gen10服务器官方不在支持HP代理(HP-Health、hp-anmp-agents )软件包更新,之前通过SNMP和HP代理的方式监控硬件的方法不能在G10服务器上面应用 。

关于HP Gen5-Gen9的服务器如何通过SNMP和HP代理监控服务器的硬件,请参考我之前在51CTO博客写的文章。Zabbix通过SNMP监控HP服务器硬件信息

HP Gen10 ILO5虽然提供syslog、Email和SNMPTrap的方式可以进行硬件监控,但是push过来的信息不容易理解和处理。后来通过google查阅资料发现HP gen10服务器硬件监控通过HP AMS(HP Agentless Management Service)软件包进行监控,通过该工具用户可以在OS层面通过snmp获取服务器硬件状态信息。Windows和Linux系统官网都支持该软件包。官网驱动程序下载地址

HP Gen10服务器通过AMS监控硬件对操作系统版本的要求如下。

Centos服务器:Support for HPE Gen10 platforms requires CentOS 6.9 or higher.

Ubuntu服务器:Support for HPE Gen10 platforms requires Ubuntu 16.04.3 (HWE Kernel) or higher.

下面是通过在Centos 6.9上面通过HP AMS监控HP Gen10服务器的硬件方法,amsd和ssacli工具需要到官方网站下载。

1)安装SNMP服务和HP硬件监控的驱动程序。


yum install -y net-snmp net-snmp-util
rpm -ivh amsd-1.3.0-2803.25.rhel6.x86_64.rpm
#HP管理工具 支持Centos 6-7
rpm -ivh ssacli-3.30-14.0.x86_64.rpm 

2)编辑SNMP的配置文件,线上SNMP服务Zabbix监控目前只做硬件信息的采集(不做性能数据采集)。为了安全性考虑,对于Linux服务器的snmp配置,做了如下修改。

1.1 snmp community 密码由原来默认的public修改为[email protected]

1.2 增加得了白名单功能,目前只允许监控的机器来获取snmp的信息。

1.3 通过SNMP VIEW功能只允许通过snmp获取服务器硬件信息,其它系统信息和信息性能获取不到。

[root@monitor ~]# cat /etc/snmp/snmpd.conf |egrep -v "(^#|^$)"
master agentx # This line is support gen10 sever hardware monitor

com2sec notConfigUser x.x.x.x [email protected]
com2sec notConfigUser x.x.x.x [email protected]

group notConfigGroup v1 notConfigUser
group notConfigGroup v2c notConfigUser
view hardwareview included 1.3.6.1.4.1.232.
access notConfigGroup "" any noauth exact hardwareview none none
syslocation Unknown (edit /etc/snmp/snmpd.conf)
syscontact Root  (configure /etc/snmp/snmp.local.conf)

3)启动相关的服务。AMS有两种工作模式,即forward和reverse两种,两种模式对应两种服务,服务器硬件监控是通过reverse模式通过os获取硬件状态的,只需要开启smad_rev服务即可,不需要开启amsd_rev服务。


AMS (forward mode) – The standard configuration of AMS is to pass information from the OS toiLO.

SMA (reverse mode) – When SMA is enabled, information is passed from iLO to the OS.

/etc/init.d/snmpd start
/etc/init.d/smad_rev start

#如果能获取到值,说明snmp和sma相关配置和服务都正常

[root@monitor ~]# snmpwalk -v2c -c [email protected] 192.168.202.2 1.3.6.1.4.1.232.3.2.2.1.1.6  
SNMPv2-SMI::enterprises.232.3.2.2.1.1.6.0 = INTEGER: 2

4)新建主机,添加snmp接口并Link HP硬件监控的模板。
Zabbix通过SNMP监控HP Gen10服务器的硬件_第1张图片
5)最后检查监控主机Items,查看服务器的硬件监控的整列卡、硬盘、电源、风扇等的Items是否正常。监控模板是通过Zabbix Low-level discovery 自动创建监控项、触发器和图像。如果需要监控模板,请留言并填写邮箱地址。

服务器硬盘的监控:

Zabbix通过SNMP监控HP Gen10服务器的硬件_第2张图片

服务器风扇监控:

Zabbix通过SNMP监控HP Gen10服务器的硬件

总结:

1)SNMP协议是通用的,该模板不仅可以监控HP Linux机器,还可以监控HP Windows机器。

2)HP监控服务器硬件常用的OID,支持HP Gen5-Gen10的服务器。

HP阵列卡状态:1.3.6.1.4.1.232.3.2.2.1.1.6
物理磁盘状态:1.3.6.1.4.1.232.3.2.5.1.1.6
逻辑磁盘状态:1.3.6.1.4.1.232.3.2.3.1.1.4
HP服务器电源状态:1.3.6.1.4.1.232.6.2.9.3.1.5
HP服务器风扇的状态:1.3.6.1.4.1.232.6.2.6.7.1.9
HP部件温度:1.3.6.1.4.1.232.6.2.6.8.1.4

参考文档:

1)官方文档:https://support.hpe.com/hpsc/doc/public/display?docId=emr_na-a00026111en_us&docLocale=en_US#N101A0

2)参考资料:https://thwack.solarwinds.com/thread/115630