ibm硬件知识点

ServerGuide Scripting Toolkit

本文主要介绍如何利用IBM ToolCenter系列工具中的ServerGuide Scripting Toolkit,对IBM System x系列服务器进行批量的固件升级、配置RAID及部署VMware ESX4.1。文章主要包含以下几个主要内容:
  ServerGuide Scripting Toolkit和System x服务器固件的简介;
  ServerGuide Scripting Toolkit 安装与配置;
  ServerGuide Scripting Toolkit 升级固件,配置RAID及部署VMware ESX4.1的步骤。
  1. 相关知识准备
  本节主要简要介绍ServerGuide Scripting ToolKit工具及相关功能,并且根据固件的升级方式对System x服务器的固件进行大致分类。
  1.1. ServerGuide Scripting Toolkit简介
  ServerGuide Scripting Toolkit是IBM专为System x 系列服务器设计,可高度定制化的部署工具。ServerGuide Scripting Toolkit是一系列系统配置、软件安装等脚本的组合。通过这个工具,可以实现针对IBM System x系列服务器可重复的、批量的部署任务,并可实现针对IBM System x系列服务器的无人值守模式的部署。
  1.2. ServerGuide Scripting Toolkit主要功能
  ServerGuide Scripting Toolkit功能丰富,主要分为以下三大类别:
  操作系统安装前的任务
  RAID配置 —— 对IBM System x服务器的RAID卡进行RAID配置。
  固件升级 —— 对IBM System x服务器的各种固件进行升级。
  ASU设置 —— 通过ASU工具对IBM System x服务器的BIOS/UEFI和IMM等进行设置。
  光纤通道设置—— 对光纤通道卡进行设置。

    操作系统安装任务
  —— 通过操作系统的自动应答文件,实现对操作系统的无人值守安装。
  操作系统安装后的任务
  IBM System Director Agent安装 —— 对已经有操作系统的IBM System x服务器部署IBM System Director Agent。
  ServerGuide Scripting Toolkit可以通过以下三种启动方式实现对目标服务器的部署:
  基于USB存储的可启动介质
  基于ISO的可启动光盘
  基于PXE的网络可启动介质
  1.3. IBM System x系列服务器固件分类
  IBM System x服务器包含很多组件,而很多组件如RAID卡、网卡等设备都拥有各自独立的固件,所以一台完整的IBM System x服务器会包含多个固件。而不同固件的升级方式稍有不同。
  因此我们可以根据IBM System x服务器固件升级方式差别,可以大致将固件分为两类。
  不依赖与操作系统升级的固件
  这类固件升级方式相对简单,目标服务器可以没有操作系统存在,即安装系统之前既可以进行固件升级操作。当然,这类固件有些也可以在升级工具支持的操作系统下进行升级。
  以IBM System x 3650M3为例,UEFI, Diagnostics, IMM可以直接通过IMM管理界面的固件升级功能进行升级,升级操作不影响服务器正常运行。而升级后,新版本的UEFI和Diagnostics在目标服务器下次重启之后生效;IMM新版本固件,在IMM下次重启之后生效。
  依赖于操作系统升级的固件
  这类固件升级方式相对繁琐,需要先行在目标服务器上安装有受微码升级工具所支持的操作系统。同样以以IBM System x 3650M3为例,如网卡、HBA卡、硬盘等固件即属于此分类。
  由于需要升级的固件数量多,并且相当部分的固件需要在升级之前安装特定版本的操作系统,因此,整个固件升级工作工作量大且非常耗时,特别是在大规模的部署环境中。而ServerGuide Scripting Toolkit提供了一个可无人职守的、可批量部署的解决方案,大大提高了部署效率。
  注意:本文中将ServerGuide Scripting ToolKit简称作SGTK。并将SGTK所在的服务器称作SGTK服务器。

IBM服务器通过HBA卡直连存储后无法进入系统

这个问题很多见,即IBM服务器通过HBA卡直连存储后无法进入系统,手动的进行断开存储连接线能解决问题,但是治标不治本,那么如何才能彻底解决这个问题呢?今天用一台IBM 3850X5服务器做个分享给大家,希望能够帮助广大饭友,话不多说,进入正题。
具体设置分两种,一种即针对NON-UEFI的操作系统(比如Windows Server 2003),设置步骤如下:
1、开机按F1进UEFI,选System Settings按Enter键。
2、选Devices and I/O Ports按Enter键。
3、选Enable/Disable Legacy Option ROMs按Enter键。
4、在Enable/Disable Legacy Option ROMs下选择HBA安装的槽位按Enter键。
5、选Disabled按Enter键。
6、在Enable/Disable UEFI Option ROMs下选择HBA安装的槽位按Enter键。
7、选Disabled按Enter键。
8、按Esc3次回到System Configuration主目录,选Save Settings按Enter键。
9、选Boot Manager按Enter键。
10、选Add Boot Option按Enter键。
11、选Legacy Only按Enter键。
12、按Esc回到Boot Manager
13、选Change Boot Order按Enter键。
14、选择当前的启动项按Enter键。
15、选Legacy Only按+将他至于装系统的设备之上,一般来说,就是在0号硬盘之上,按Enter键。
16、选择Commit Changes,按Enter键。
17、按Esc回到Boot Manager,选择Reset System,按Enter键。

另外一种则是针对UEFI的操作系统,比如Windows Server 2008,具体设置步骤如下:

1、自检进入F1 UEFI,先检查阵列配置(逻辑盘,物理盘均为正常),然后进入Boot Manager选项,选择"Add Boot Option" 。
2、选择安装Windows2008的分区,一般有以下信息, 然后选择进入
"Ctrl(0x0)/Scsi(0x0,0x0)/HD(1,GPT,*******-****-****)
3、里面有<EFI>选项进入,然后选择<Mcirosoft>,再选择<BOOT>,接着选择"bootmgfw.efi" 。
4、在"Input the description"按Enter键输入" Windows boot manager",然后选择"Commit Changes"。
5、然后退出选择"save settings",退出UEFI。

设置完之后,重启服务器,问题解决。

知识点拓展——关于【UEFI】
新型UEFI,全称“统一的可扩展固件接口”(Unified Extensible Firmware Interface), 是一种详细描述全新类型接口的标准。这种接口用于操作系统自动从预启动的操作环境,加载到一种操作系统上,从而使开机程序化繁为简,节省时间。(备注:选摘百度百科)

如Windows Server2008是UEFI系统外,像Linux 和Windows 03等常见的都是Non-UEFI系统。

ibm_utl_sgtklnx_2.21_linux_32-64  IBM ServerGuide Scripting Toolkit, Linux Edition

本文中将ServerGuide Scripting ToolKit简称作SGTK。并将SGTK所在的服务器称作SGTK服务器。

默认地址

sys mgmt即192.168.0.100 USERID:PASSW0RD,是零不是大写字母

imm口:192.168.70.125 USERID:PASSW0RD

在系统中收集日志

DSA日志收集方法,谢谢。
Linux下收集DSA日志方法(包含BMC信息):
1.  到以下链接下载对应您操作系统版本的DSA portable程序,注意操作系统是什么版本,是多少位的(请注意:RHEL4.5之后无需加IPMI驱动、SUSE9SP3之后也无需加载IPMI驱动)
   RHEL 5:32bit——http://delivery04.dhe.ibm.com/sar/CMA/XSA/03tz7/1/ibm_utl_dsa_dsytb7x-9.40_portable_rhel5_i386.bin
          64bit——http://delivery04.dhe.ibm.com/sar/CMA/XSA/03tz9/1/ibm_utl_dsa_dsytb7x-9.40_portable_rhel5_x86-64.bin
   RHEL 6:32bit——http://delivery04.dhe.ibm.com/sar/CMA/XSA/03tza/1/ibm_utl_dsa_dsytb7x-9.40_portable_rhel6_i386.bin
          64bit——http://delivery04.dhe.ibm.com/sar/CMA/XSA/03tzq/0/ibm_utl_dsa_dsytb7x-9.40_portable_rhel6_x86-64.bin

   收集方法:
   1) 将DSA文件拷贝到本地临时目录下(比如/tmp),比如下载的DSA的文件名是ibm_utl_dsa_dsyta1n-9.40_portable_sles11_x86-64.bin;
   2) 确保DSA文件具有可执行属性,执行命令:chmod +x ibm_utl_dsa_dsyta1n-9.40_portable_sles11_x86-64.bin;
   3) 执行DSA工具(需要用ROOT用户),执行命令:./ibm_utl_dsa_dsyta1n-9.40_portable_sles11_x86-64.bin;
   4) 稍等一段时间,DSA程序会将收集到的信息保存到/var/log/IBM_SUPPORT目录下(如果有无法生成日志文件的情况建议用以ROOT用户重新收集日志)请打包发给我,谢谢!

ibm3755 m3

带远程在线支持的 IBM IMMv2

IMM是IBM服务器的新一代集成管理模块,该模块是独立于服务器系统的远程管理卡,它把原有的BMC,RSA-II, 显卡,Remote Console和远程硬盘等功能整合在一个单一的芯片上。借助它用户可以通过一个单独的ip使用web和虚拟端口方式直接启动、停止和管理远程服务器,即使主板、处理器或者内存故障导致主机无法启动,也依然可以远程管理(Remote Console)服务器,可以远程直接操作启动画面和服务器工作界面。Remote Console是收费的功能,这个功能要配合Virtual Media Key使用,一些服务器标配了Virtual Media Key ,如x3750 m4,一些没有配置需要单独采购,如X3650 M4。IMM在所有的平台上通用,微码版本也完全一致。无论是在线还是离线都可以对服务器进行配置,无需专门的驱动。并且IMM支持开放的标准 (CIM 和 WS-MAN),可以对报警和命令进行更好的集成。IMM强大的功能使得用户在世界的任何角落都能够对兄进行管理、监控和排障。并且IMM有着友好的WEB管理界面,用户从中可以清晰对系统状态进行监控,是否有故障点、用户情况、电源装填、详细日志一目了然.
BMC(Baseboard Management Controller,因为多集成于主板而得名)

光通路诊断面板

光通路诊断面板位于操作员信息面板的顶部。

要操作光通路诊断面板,请将操作员信息面板上的蓝色松开按钮滑至左侧。向前拉操作员信息面板,直至该面板的铰链脱离服务器底座。然后,向下拉操作员信息面板,以便可以查看光通路诊断面板信息。

X3850 <wbr>光通路诊断面板

提醒按钮:该按钮将前面板上的系统错误指示灯设置为提醒方式。在提醒方式中,系统错误指示灯每两秒闪烁一次,直至问题得到解决、服务器重新启动或发生新的问题。

通过将系统错误指示灯设置为提醒方式,可确认您已知道发生的前一个故障,但暂时不立即采取措施来解决问题。提醒功能由IMM 控制。

NMI 按钮:如果得到IBM 服务中心的指示,可按下该按钮以强制使微处理器产生不可屏蔽的中断。

复位按钮:按下该按钮可复位服务器并运行开机自检(POST)。您可能必须使用钢笔或拉直的回形针的针尖来按此按钮。复位按钮位于光通路诊断面板的右下角。

OVER SPEC 指示灯:当此指示灯发亮时,表明对电源的需求超过了指定的电源供应;

LOG 指示灯:当此指示灯发亮时,表明您应该查看事件日志或remote supervisor;

LINK 指示灯:当此指示灯发亮时,表示网卡出现故障;

PS 指示灯:当此指示灯发亮时,表明电源出现故障;

PCI 指示灯:当此指示灯发亮时,表明某个pci 总线发生错误;

SP 指示灯:当此指示灯发亮时,表明服务处理器遇到错误;

FAN风扇指示灯:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢,风扇发生故障还会导致over temp 指示灯发亮;

TEMP 指示灯:当此指示灯发亮时,表明系统温度超出阈值级别;

MEM 指示灯:当此指示灯发亮时,表明发生内存错误;

NMI 指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi),硬件错误已报告给操作系统。注:PCI 或MEM 指示灯也可能会点亮;

CNFG  发生配置错误;

CPU 指示灯:当此指示灯发亮时,表明某个微处理器出现故障;

VRM 指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm 出现故障;

DASD 指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障,DASD 硬盘驱动器发生故障或已卸下;

RAID RAID 控制器指出发生了故障;

BRD  微处理器板或I/O 板发生故障;

你可能感兴趣的:(IBM)