使用Dell OpenManage Server Administrator简化解决问题的过程

DellTM PowerEdgeTM  服务器中包含的Dell OpenManageTM  Server Administrator帮助管理员有效地管理他们的服务器。Server Administrator中的诊断服务方便了对Dell硬件问题的解决。本文关注的焦点是在运行Microsoft® Windows®  和Red Hat® Linux®  操作系统的Dell系统上部署诊断服务。

Dell TM OpenManage TM  Server Administrator提供了众多服务,帮助管理员在本地和远程管理和监视Dell系统:仪器,远程访问,存储管理,诊断和升级 1 。管理员使用这些诊断服务,可以更为方便地避免系统性能下降,诊断出现故障的部件上发生的问题。诊断服务使系统管理员可以完成监视系统硬件的整体健康状况。Server Administrator诊断服务的优点包括:
  • 远程访问:  管理员无需在位于被管理的系统附近就能运行测试。
  • 故障检测:  Server Administrator 诊断用来帮助确定硬件问题。
  • 预防性维护:  管理员可以在系统处于生产运行或操作系统(OS)在运行的情况下就可以检查服务器硬件的健康状况。Server Administrator诊断目前支持Microsoft® Windows®  和Red Hat® Linux®  操作系统。
  • 审核轨迹:  管理员可以在问题变得危急或导致服务器硬件故障之前就可以确定硬件问题。
本文对于如何更有效地在企业计算环境中使用Server Administrator提供了一些建议。
诊断服务可以在本地访问,也可以通过基于Web浏览器的图形用户界面(GUI)在远程访问。诊断服务还可以通过命令行接口(CLI)在本地访问,便于利用脚本功能。诊断服务仅对Windows上具有Power User或Administrator访问权限或在Linux具有root权限的用户提供。本文探讨了管理员如何使用两种界面来运行诊断。
通过GUI运行诊断
要通过GUI运行诊断,管理员可以点击Server Administrator主窗口中的Diagnostics页面,然后点击"View"。在屏幕左侧的导航树中列出了所支持的部件,诊断选择窗口中列出了可能的测试。Server Administrator中的诊断工具可以在两种模式下运行:交互模式和计划模式。
运行交互式诊断
当管理员怀疑系统中的某些硬件部件出现问题或者他们已被通知必须要诊断问题时,往往使用交互式或实时的模式。通过诊断选择屏幕,管理员可以选择"根据设备查看"或"根据测试查看"。
为测试服务器的速度减慢,管理员可以在所有的硬盘驱动器上运行测试,并检查系统中DIMM(双列直插内存模块)的状况。选择根据测试查看,然后选择"Surface Scan Test(表面扫描测试)"将会显示所有的硬盘驱动器选择界面。系统管理员这时可以选择根据设备显示和"物理内存设备"来显示当前用户准备运行测试所进行的所有选择。一旦管理员已经选择所需的设备和测试,他们就可以点击"Advanced(高级)"来选择以压力模式来运行测试可以选择的选项。
在压力模式下运行交互式诊断
诊断压力模式选项模拟了长期使用系统的场景,其中硬件的故障可能会影响系统的性能。压力模式还模仿可能会降低系统性能的长期的重复性系统使用。在压力模式下运行系统可以帮助系统管理员在问题出现之前发现问题,不会使服务器停机。拥有关键业务的组织需要极高的可用性―例如数据库,将会发现这个特点特别有用。
在高级设置窗口中定义了以下压力模式(参见 图1 )。
图
图1. 高级诊断设置
  • 在错误的时候中止:  在遇到错误的时候停止测试
  • 同时运行:   同时运行测试,而不是顺序运行。
  • 快速测试:   如果有更快速的算法的话使用更快的算法来运行特定的测试。缺省选择快速测试。如果在运行快速测试模式之后没有发现错误,而且管理员仍然相信被测试的硬件有问题,管理员可以清楚快速测试模式,再次运行相同的测试。
  • 通过的数量:   指定被选择的测试应当运行多少次。
  • 最小持续时间:  以分钟为单位指明最少要多少时间来运行所选中的测试。这一持续时间针对的是所有测试的总和,而不是针对每个测试的最小时间。
  • 最大持续时间:  以分钟为单位指明最长要多少时间来运行所选中的测试。运行时间超过这一设定值之后将终止测试。这一持续时间针对的是所有测试的总和,而不是针对每个测试的最大时间。
在管理员选择了高级选项之后,他们点击"Run Tests(运行测试)"启动测试。Server Administrator可以点击Abort(中止)按钮来停止测试,并清空测试队列。有些测试会立即结束;有些测试可能占用较长的时间,因为Server Administrator为保护系统的完整性,允许某些例程结束后在中止测试。在完成诊断测试之后,管理员可以查看结果来确定适当的活动。
图
图2. 诊断测试的进展
审查打包的诊断运行日志
诊断测试所得到的结果都在本地打包到被管理的服务器文件系统中。这些诊断运行日志可以通过Result History(结果历史)菜单项来访问,其中展示了硬件故障审核轨迹;管理员还可以查看每次诊断运行的结果。运行日志打包的缺省文件大小是2MB,大约可以容纳1,300次运行。在达到文件的最大长度限制之后,日志将循环使用。管理员可以通过Settings(设置)菜单在更改日志文件的大小。
运行计划好的诊断
管理员可以使用诊断服务内的计划功能在以后的日期和时间执行测试;例如在非高峰时间余兴预防性维护任务(参见图3)。计划功能还使管理员可以灵活地在任何时间运行测试,运行无人值守的测试,以及计划重复性的任务。管理员可以查看和比较重复测试的结果,了解趋势。
图
图3.诊断测试计划
c
因为计划器使用本地OS的功能,所以计划的执行动作的权限与被管理的系统客户的权限相同。计划任务所指定的日期和时间也是被管理的系统的时间。来自计划性的运行的结果被张贴到诊断结果历史日志中。使用诊断计划和结果日志检查,管理员可以在出现问题之前,发现系统的变化、将会出现故障的部件,或可能降低系统性能的其它趋势。
检测系统部件的变化
诊断服务还提供了检测系统清单的变化的能力。在第一次安装时,Server Administrator诊断服务捕捉系统硬件配置的映象,并将它保存为基线配置。当被管理服务器或安全端口服务器重启的时候,检测算法捕捉了硬件配置的另一个映象。Server Administrator诊断服务将新的配置与基线相比较,并在配置变更日志中显示变化(参见 图4 )。管理员必须认可这一配置上的变化才能将状态指示器从报警状态转换到正常状态。在认可后,新的配置将变为基线。
图
图4. 诊断服务硬件配置变更日志
绿色的对号图标表明硬件已经添加到指定的服务器中。 图4 表明一个新的SCSI控制器添加到系统中。红色的"X"图标表明已经从系统中删除硬件或硬件的配置不再正确,或是出现故障,导致诊断服务无法诊断它们。
如果同一个设备在硬件配置变更日志中出现两次,具有相同的时间戳,并且已经被绿色的对号和红色的"X"所标记,则表明设备硬件或OS的位置可能已经发生变化。在 图4 中,日志显示了网络接口卡(NIC)的移走已经导致硬盘驱动器被分配到不同的外设部件互连(PCI)总线位置。
硬件配置的这些变化已经被打包,可以通过配置历史菜单项来访问。管理员可以通过电子邮件来发送这些日志,将它们保存在选定的地点。Server Administrator将日志作为电子邮件的附加来发送。附件中包括目前硬件的配置映象和诊断测试执行历史日志。管理员可以使用附件的日志,在将来进行检查和打包。
通过CLI运行诊断
不希望安装安全端口服务器或使用GUI的管理员可以通过Server Administrator CLI来运行诊断。CLI使管理员可以:
  • 从命令提示中运行一个诊断命令;当管理员取消了GUI时广泛使用。这些命令都是与环境敏感的:如果部件没有在系统上,将不能提供诊断CLI命令。
  • 创建一个可在多个系统上运行的通用脚本;广泛用于预防性维护。这些命令通常在后台运行并且与环境无关。它们可以被分发,在一组服务器上运行,不会中途终止脚本。当运行测试所需的某些设备没有在系统中提供时,测试将返回一条信息串"错误!要在本机上运行X测试设备没有找到,"其中X是测试的名称。
包含有诊断命令的CLI脚本被广泛地在非高峰时间在被管理的服务器上执行,以便减轻对生产运行环境的影响。管理员可以使用Microsoft系统管理服务器、ftp或是内部的可以在一组服务器上执行脚本的机制来散发这些脚本。这样,管理员就可以在被管理系统网络中执行预防性的诊断。 2
编写诊断CLI命令
所有的诊断CLI命令都用omdiag关键字开头。使用-?选项可以查看所有诊断命令的帮助。管理员可以收入omdiag -?来查看与运行诊断命令相关的帮助信息。
与GUI相比,使用CLI 3 的主要优势包括:
  • 测试更方便:  诊断CLI更适合于运行测试。
  • 灵活性:  利用CLI可以在多次审查中运行测试,并可以设定最小和/或最长运行时间。
  • 监视过程:  CLI 不是一个交互性工具,并不象GUI一样显示进度指示器。但是,如果提供了GUI,管理员可以通过GUI来监视通过CLI执行的诊断过程的进度。
  • 降低负载:  因为CLI的负载较低,Dell推荐使用CLI来运行具有高的CPU和内存使用需求的诊断,例如硬盘驱动器和内存诊断。
  • 更多输出选项:  CLI 在本地的命令终端上生成输入。管理员可以利用行业标准文本、表格、逗号分隔的变量,或扩展标记语言(XML)格式来捕捉输出。XML格式的输出还可以写入到文件中以便以后进行分析。GUI可以通过结果历史菜单来显示结果,但是这些结果不能象对CLI的结果的处理方式一样进行捕捉。
管理Dell服务器,提供更长的稳定运行时间
Dell OpenManage Server Administrator为管理员提供了一组强大的管理功能,帮助保持系统的稳定运行。这个应用中包括的GUI和CLI界面提供灵活地监视和维护任务的方法。Server Administrator诊断服务用来帮助管理员最小化停机时间,使它们可以解决问题,发现系统利用率的趋势。因此,这个工具可以帮助管理员有效地管理他们的Dell服务器,帮助提高他们IT环境的可靠性和可用性。
 
 
http://www1.ap.dell.com/content/topics/topic.aspx/ap/topics/power/zhcn/ps2q03_nara?c=cn&l=zh&s=pub

你可能感兴趣的:(职场,休闲,日常记录)