遭遇系统问题

应用系统所在的机房今天凌晨突然掉电,系统重启后,表面看起来正常,其实隐藏危机,核心的进程没有正常产生日志文件,花了好长时间查问题,也没发现故障原因。

顺便看了看AIX的系统异常日志,呵呵,有些收获:

# errpt |more
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
B4C00618   0225160006 P H ssa0           RESOURCE UNAVAILABLE
B4C00618   0225150006 P H ssa0           RESOURCE UNAVAILABLE

B4C00618   0225140006 P H ssa0           RESOURCE UNAVAILABLE
625E6B9A   0225130006 P H ssa0           ADAPTER DETECTED OPEN SERIAL LINK
B4C00618   0225130006 P H ssa0           RESOURCE UNAVAILABLE
625E6B9A   0225120006 P H ssa0           ADAPTER DETECTED OPEN SERIAL LINK
B4C00618   0225120006 P H ssa0           RESOURCE UNAVAILABLE
3DB7729E   0225120006 P H ssa0           ADAPTER PERFORMANCE DEGRADED

 T=P,有些不妙,再细看:

# errpt -a|pg
---------------------------------------------------------------------------
LABEL:          SSA_ARRAY_ERROR
IDENTIFIER:     B4C00618

Date/Time:       Sat Feb 25 17:00:00 2006
Sequence Number: 18057
Machine Id:      0056FA7E4C00
Node Id:         spms_app
Class:           H
Type:            PERM
Resource Name:   ssa0
Resource Class:  adapter
Resource Type:   ssa160
Location:        U0.1-P2-I5/Q1

Type=PERM,按照IBM技术手册的手法,这是不可能得到恢复和解决的错误,是永久的错误。看起来像是磁盘阵列中的硬盘出现了故障。

我没有smitty的相关权限,无法进一步确认了,上报错误信息给相关人员处理。

踏入编程这个行业有些时日了,越来越感觉解决系统问题已经不单单编程语言的语法,如果技艺要精进,熟练掌握编程语言的语法外,更重要的是去了解你的软件运行的环境(操作系统平台,数据库系统平台等),扩展你的技能,同时也会扩展你的视野。

你可能感兴趣的:(程序设计)