联想服务器维护 - System X 3650 M5

IBM3650通过板载管理口IMM2&FFDC收集日志
FFDC日志收集方法
IBM Systems Director 服务工具介绍:FFDC 和 Logcollector
FFDC

FFDC 机制概述

First failure data capture(FFDC) 工具是 WebSphere 小组开发的一款可以在第一次异常发生时对其进行详细数据捕获的工具。我们将其移植进入 IBM Systems Director ,并对其功能进行了进一步的封装,从而使其能够针对 Director 这款软件中的各种异常数据进行捕获。FFDC 机制在 Director 启动时随之启动,然后监听异常数据,直至 Director 被关闭。

FFDC 事件日志

FFDC 机制在 Director 中主要用于关键性步骤中的各种异常,记录下这些异常的详细代码跟踪和调试信息。在 Director 中,很多重要步骤中都加入了 FFDC 机制的检测,当出现问题的时候,会自动产生 FFDC 的事件日志。有两种方式可以看到这些事件日志情况。

通过 Director 界面

在 Director 6.3 的界面上点击系统状态和运行状况下的事件日志,就可以看到相关的 FFDC 事件。这类事件的特点是其事件文本总被标注为“管理服务器发生软件异常”,同时会以警告级别告知该类事件的严重性。同时会提供发生此事件的源机器的主机名称。

 

点击某一个事件,则可以看到这些事件日志中包含的更为详细的信息,包括该软件异常第一次发生的时间,接收到该事件的时间,以及一些提供给 IBM 服务支持人员的更详细的信息。在 FfdcIncidentUri 这个属性中,我们提供了一个详细记录该事件日志的文件路径,可以通过提供的文本文件查看更多的关于该软件异常的信息。

 

在日志文件中

在上面介绍到,通过 Director 的界面可以看到该 FFDC 事件的信息,并可以针对每个不同的 FFDC 事件,找到对应的日志文件位置。在 Director 中,每个 FFDC 事件都会产生独立的日志文件存放在 DirectorRoot/log/ffdc/logs 目录下,DirectorRoot 是 Director 的安装目录。例如,在 Linux 或 Unix 系统中,默认会放在 /opt/ibm/director/log/ffdc/logs 目录下面。但是因为 FFDC 事件日志的文件名是一串随机的数字串,无法从中找到我们需要的日志文件。所以需要首先查找 Ffdcsummary.txt 文件,该文件中详细的描述了每个 FFDC 事件日志对应存放的文件名,以及其它很多相关的信息,比如某一个 FFDC 事件重复发生的次数,第一次和最后一次发生的时间等等。通过该文件中的对应关系,就可以找到想要寻找的事件日志文件名。

FFDC 高级功能使用

不同于之前的版本,Director 6.3 中的服务和支持管理器随着 Director 软件的安装一起被默认安装在机器上。对于已经安装 Director 6.3 的用户,可以通过设置中的服务和支持管理器设置,勾选“允许将 Systems Director 管理服务器软件质量事件数据传送给 IBM”选项,这样在联网状态下 FFDC 的事件日志会自动上传到 IBM 的数据库,便于我们的支持和服务人员进一步的分析调试。

RAS(Reliability,Availability and Serviceability)是 IBM 提出的概念,它很好的描述了作为软硬件的三个指标:稳定性、可靠性和适用性。其中软件的适用性或者服务性是指在软件发生问题以后,如何更快速更便捷的解决问题,从而提升用户体验的特性。本文主要针对 IBM Systems Director 中的适用性和服务性部分相关功能进行介绍。IBM Systems Director 是一个适用于大规模机群的管理的软件。因此,用户的使用环境是复杂多变的,在出现一些问题的时候,通过相关服务工具能够尽快、尽可能全面收集当前机器的用于诊断和调试的信息,并发送给 IBM 的技术人员的话,可以为技术人员提供相当的便利。该服务工具支持所有可以安装 Director 的平台。从 IBM Systems Director 6.2 版本开始,服务工具就已经可以使用了。

本文主要包含了以下两个工具在 Director 6.3 中的自定义配置和使用方法,针对 6.3 之前的版本,本文并不完全适用。

FFDC 事件是当 Director 产生一些问题时会生成的事件,这些事件的内容对于技术人员进行问题调试和诊断有重要的意义。

Logcollector 是针对 Director 软件专门定制的日志文件收集器,它提供了很多便捷的选项和较完整的日志诊断数据收集功能。

你可能感兴趣的:(运维)