AIX系统errpt详解

在AIX中,errpt用于报告系统软硬件相关的错误日志信息

先来看一个实际的输出,不带参数简单列出所有的错误

#errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
A2205861 1214144307 P S SYSPROC Excessive interrupt disablement time
F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 1213234807 T H ent1 ETHERNET DOWN
F3931284 1213234807 I H ent1 ETHERNET NETWORK RECOVERY MODE
EC0BCCD4 1213233607 T H ent1 ETHERNET DOWN
0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN
0873CF9F 1212141207 T S pts/1 TTYHOG OVER-RUN


使用-a参数查看详细信息

#errpt -a | more
—————————————————————————
LABEL: GOENT_RCVRY_EXIT
IDENTIFIER: F3931284

Date/Time: Thu Dec 13 23:48:47 BEIST 2007
Sequence Number: 162
Machine Id: 00099476D600
Node Id: db158
Class: H
Type: INFO
Resource Name: ent1
Resource Class: adapter
Resource Type: 14108902
Location: U787B.001.DNWA74C-P1-T9
VPD:
Product Specific.( )…….2-Port 10/100/1000 Base-TX PCI-X
Adapter
Network Address………….000D6051A0F6
ROM Level.(alterable)…….DV0210

Description
ETHERNET NETWORK RECOVERY MODE

Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
FILE NAME
line: 204 file: goent_intr.c
PCI ETHERNET STATISTICS
0001 EF66 0063 0853 0000 0001 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001
0000 0000 0000 A69D 0000 0000 002C B028 0000 0000 0000 A64B 0000 0000 0000 A597
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0001 0000 0001 0000 0001 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 BB83 08F0 0068 0C00 0000 0000 01A0 0000 0000
0000 0000 0000 0000 0000 C9E1 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000
DEVICE DRIVER INTERNAL STATE
5555 5555 0000 0000 0000 0000
SOURCE ADDRESS
0011 25C0 3BDE

其中:
LABLE:事件名称

IDENTIFIER:事件ID

Date/Time:发生的时间

Sequence Number:事件序列号

Machine ID:机器标识

Node ID:节点标识

Class:事件来源
S-软件
H-硬件
I-信息
U-未定的

Type:事件类型
PEND-设备或组件的可用性损失是急迫的。
PERF-设备或组件的性能已下降到可接受的级别以下。
PERM-出现了不可恢复的情况。如果错误类型为这个值,那么通常是最严重的错误,并且很可能意味着出现了硬件设备或者软件模块的故障。如果错误类型为 PERM 之外的其他值,通常并不表示故障,但是对这些错误进行了记录,以便可以使用诊断程序对它们进行分析。
TEMP—在出现多次不成功的尝试之后,所恢复到的状态。这种错误类型也可以用于记录信息性条目,如 DASD 设备的数据传输统计信息。
UNKN—无法确定错误的严重程度。
INFO—错误日志条目是信息性的,并且不是某个错误所产生的结果。

Resource Name:检测到错误的资源的名称。对于软件错误,这是某个软件组件或可执行程序的名称。对于硬件错误,这是某个设备或系统组件的名称。它并不表示该组件出现故障或者需要更换。相反,它用于确定合适的诊断模块以用于对错误进行分析。

Resource Class:检测到故障的资源的一般类别(例如,磁盘的设备类别)。

Resource Type:检测到故障的资源的类型。

Location Code:设备的路径。最多可能有四个字段,分别是抽屉、插槽、连接器和端口。

VPD:关键的产品数据。这个字段的内容(如果存在)可能各不相同。设备的错误日志条目通常返回有关设备制造商、序列号、工程变更级别、以及只读存储级别的信息。

Description:错误的汇总信息。

Probable Cause:一些可能的错误原因的列表。

User Causes:由用户错误所导致错误的可能原因的列表。用户所导致的错误可能包括不正确插入的磁盘、未能开启的外部设备(如调制解调器和打印机)。

Actions:对于纠正用户所导致的错误的推荐操作的描述。

Install Causes:因为不正确的安装或者配置过程所导致错误的可能原因列表。这种类型的错误包括硬件和软件不匹配、电缆的不正确安装或电缆连接变松,以及未能正确配置的系统。

Actions:对于纠正安装所导致的错误的推荐操作的描述。

Failure Causes:可能的硬件或者软件故障列表。

Actions:对于纠正故障的推荐操作的描述。对于硬件错误,这将导致运行诊断程序。

Detailed Data:针对每个错误日志条目的、唯一的故障数据,如设备检测数据。

本文主要来自《IBM AIX V5.3 系统管理(Test 222)认证指南系列,第 5 部分:问题的确定和解决(上)》,摘录于此仅供参考。

你可能感兴趣的:(AIX)