在对服务器的硬件监控上,目前业界主要基于如下两种:
1、服务器自带的工具,比如HP的hpacucli,DELL的OMSA等
2、智能平台管理接口 (IPMI,全称Intelligent Platform Management Interface)
DELL OMSA的全称为Dell Openmanage Server Administrator,它是戴尔公司基于自主研发力量开发的IT系统管理解决方案,通过与业内领先的系统管理解决方案供应商密切配合,在深入了解用户对系统管理需求的基础上,OMSA系统管理方案可以全面解决系统管理人员最关心的系统部署、系统监控和系统变更三大系统管理问题。它通过提供以下两种方式来对本地和远程的服务器进行管理和监控。
1、基于Web浏览器的集成图形用户界面(GUI)
2、操作系统的命令行界面(CLI)工具
大家可能对DELL的IDRAC更熟悉一点,OMSA其实就是 IDRAC企业版的开源社区版。这里列出IDRAC和OMSA的web界面,两者看着非常相似,功能上也是非常相似。
下面介绍如何安装使用OMSA。由于我们公司主要使用的是红帽系列的产品,因此这里列举RHEL6和CentOS6部署方式。
RHEL 6.X 平台安装 OMSA:
在RHEL6上部署OMSA,由于DELL售后那边发给我过资料,这里我就不在重复写了,贴上DELL售后的资料,非常的详尽。
最新版本的OMSA 8.1下载链接:http://downloads.dell.com/FOLDER02876154M/1/OM-SrvAdmin-Dell-Web-LX-8.1.0-1518.RHEL6.x86_64_A00.tar.gz
安装链接:http://zh.community.dell.com/techcenter/systems-management/w/wiki/561.omsalinux
CentOS 6.X 平台安装 OMSA:
CentOS 6.x系列的,其实也可以使用和RHEL6一样的方式安装,只不过需要修改脚本里面的一些东西。我们可以使用dell官方提供的yum源,直接使用yum来在CentOS上安装OMSA。
下面附上安装步骤:
1、安装dell的yum源
[root@kvm-phy04-jz ~]# wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
2、安装必要的2个包
[root@kvm-phy04-jz ~]# yum -y install OpenIPMI srvadmin-all
3、启动服务
[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/sbin/srvadmin-services.sh start
4、设置开机自启动
[root@kvm-phy04-jz ~]# /opt/dell/srvadmin/sbin/srvadmin-services.sh enable
racsvc 0:off 1:off 2:on 3:on 4:on 5:on 6:off
dataeng 0:off 1:off 2:on 3:on 4:on 5:on 6:off
dsm_om_shrsvc 0:off 1:off 2:on 3:on 4:on 5:on 6:off
dsm_om_connsvc 0:off 1:off 2:off 3:on 4:off 5:on 6:off
ipmi 0:off 1:off 2:on 3:on 4:on 5:on 6:off
5、通过web访问OMSA界面
使用浏览器访问https://ip_address:1311打开OMSA的web页面。这里注意,一定要使用https去访问,否则页面会打不开。
注意 : 这里的用户名和密码使用的是系统的用户名密码,这地方和IDRAC是不一样的。
这样子,OMSA就安装好了,web管理页面也可以使用了。
三、OMSA 使用指南
这里就介绍如何使用命令获取服务器硬件信息。
OMSA自带了一些工具来提供给我们命令行的查询和设置接口,这里主要介绍两个,一个是omreport,另一个是omconfig。omreport是用来查询服务器各种硬件状态,omconfig是用来设置硬件的一些属性的。
我在这里仅列出这两个命令的常用几个命令,更多的命令详情大家可以去如下两个网站查询:
1、http://www.sxszjzx.com/~t096/manual/sc/Dosa/CLI/report.htm
2、http://topics-cdn.dell.com/pdf/dell-opnmang-srvr-admin-v8.1_User’s%20Guide_en-us.pdf
命令指南:
/opt/dell/srvadmin/bin/omreport chassis # 显示所有主要组件的常规状态
/opt/dell/srvadmin/bin/omreport chassis memory # 显示内存信息
/opt/dell/srvadmin/sbin/omreport chassis temps # 显示系统主要组件的温度
/opt/dell/srvadmin/bin/omreport storage adisk controller=0 # 查看磁盘陈列中的硬盘状态
/opt/dell/srvadmin/bin/omreport storage pdisk controller=0 # 查看物理磁盘信息
/opt/dell/srvadmin/bin/omreport storage vdisk controller=0 # 查看虚拟硬盘的状态
/opt/dell/srvadmin/bin/omreport storage controller # 查看控制器(即RAID卡)的属性
/opt/dell/srvadmin/bin/omreport storage channel controller=0 # 查看通道的属性
/opt/dell/srvadmin/bin/omreport storage enclosure controller=0 # 查看enclosure的属性
/opt/dell/srvadmin/bin/omreport storage battery # 查看电池属性
/opt/dell/srvadmin/bin/omconfig storage controller action=setrebuildrate controller=0 rate=100 # 调整rebuild的速度
/opt/dell/srvadmin/bin/omconfig storage vdisk action=changepolicy controller=0 vdisk=0 readpolicy=ara # 修改raid的读策略
/opt/dell/srvadmin/bin/omconfig storage vdisk action=changepolicy controller=0 vdisk=0 writepolicy=fwb
1、查看所有主要组件的常规状态
root@ncnode05:~# omreport chassis
Health
Main System Chassis
SEVERITY : COMPONENT 级别,组件
Ok : Fans 风扇
Ok : Intrusion 入侵(比如开机箱盖)
Ok : Memory 内存
Ok : Power Supplies 电源供给
Ok : Power Management 电源管理
Ok : Processors 处理器
Ok : Temperatures 温度
Ok : Voltages 电压
Ok : Hardware Log 硬件日志
Ok : Batteries 电池
For further help, type the command followed by -?
2、查看内存信息
root@ncnode05:~# omreport chassis memory
Memory Information 内存信息
Health : Ok
Attributes of Memory Array(s) 内存阵列属性
Attributes of Memory Array(s)
Location : System Board or Motherboard 系统板或主板
Use : System Memory 系统内存
Installed Capacity : 262144 MB 已装容量(256G)
Maximum Capacity : 1572864 MB 最大支持容量(1536G)
Slots Available : 24 总共槽位
Slots Used : 16 已用槽位
Error Correction : Multibit ECC
Total of Memory Array(s)
Total Installed Capacity : 262144 MB
Total Installed Capacity Available to the OS : 257852 MB
Total Maximum Capacity : 1572864 MB
Details of Memory Array 1
Index : 0
Status : Ok
Connector Name : A1 插槽名称
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 1
Status : Ok
Connector Name : A2
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 2
Status : Ok
Connector Name : A3
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 3
Status : Ok
Connector Name : A4
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 4
Status : Ok
Connector Name : A5
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 5
Status : Ok
Connector Name : A6
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 6
Status : Ok
Connector Name : A7
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 7
Status : Ok
Connector Name : A8
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index :
Status : Unknown
Connector Name : A9
Type : [Not Occupied]
Size :
Index :
Status : Unknown
Connector Name : A10
Type : [Not Occupied]
Size :
Index :
Status : Unknown
Connector Name : A11
Type : [Not Occupied]
Size :
Index :
Status : Unknown
Connector Name : A12
Type : [Not Occupied]
Size :
Index : 8
Status : Ok
Connector Name : B1
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 9
Status : Ok
Connector Name : B2
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 10
Status : Ok
Connector Name : B3
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 11
Status : Ok
Connector Name : B4
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 12
Status : Ok
Connector Name : B5
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 13
Status : Ok
Connector Name : B6
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 14
Status : Ok
Connector Name : B7
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index : 15
Status : Ok
Connector Name : B8
Type : DDR4 - Synchronous Registered (Buffered)
Size : 16384 MB
Index :
Status : Unknown
Connector Name : B9
Type : [Not Occupied]
Size :
Index :
Status : Unknown
Connector Name : B10
Type : [Not Occupied]
Size :
Index :
Status : Unknown
Connector Name : B11
Type : [Not Occupied]
Size :
Index :
Status : Unknown
Connector Name : B12
Type : [Not Occupied]
Size :
3、查看系统主要组件的温度
root@ncnode05:~# omreport chassis temps
Temperature Probes Information
------------------------------------
Main System Chassis Temperatures: Ok
------------------------------------
Index : 0
Status : Ok
Probe Name : System Board Inlet Temp
Reading : 21.0 C
Minimum Warning Threshold : 3.0 C
Maximum Warning Threshold : 42.0 C
Minimum Failure Threshold : -7.0 C
Maximum Failure Threshold : 47.0 C
Index : 1
Status : Ok
Probe Name : System Board Exhaust Temp
Reading : 33.0 C
Minimum Warning Threshold : 0.0 C
Maximum Warning Threshold : 70.0 C
Minimum Failure Threshold : 0.0 C
Maximum Failure Threshold : 75.0 C
Index : 2
Status : Ok
Probe Name : CPU1 Temp
Reading : 41.0 C
Minimum Warning Threshold : 8.0 C
Maximum Warning Threshold : 82.0 C
Minimum Failure Threshold : 3.0 C
Maximum Failure Threshold : 87.0 C
Index : 3
Status : Ok
Probe Name : CPU2 Temp
Reading : 41.0 C
Minimum Warning Threshold : 8.0 C
Maximum Warning Threshold : 82.0 C
Minimum Failure Threshold : 3.0 C
Maximum Failure Threshold : 87.0 C
……