IBM DS4300阵列控制器电池的更换过程

        前几天,系统下面一应用部门电话反映,他们应用程序在使用时经常出现连接数据库失败的情况,跟以前的错误提示不同,询问软件开发,而开发不在现场,要求了解现场服务器配置情况,当时没有多想,也认为是软件开发的问题,而且还有其它应用也在用,但都正常。正好赶上值班,就登到服务器想做一下例行检查, 在检查系统错误报告(errpt  -d H -T),结束发现很多硬件的错误提示(B9735AF4   1126093407 P H dac0    SUBSYSTEM COMPONENT FAILURE),用命令(errpt -aj B9735AF4  |pg),里面解释说可能是阵列电源或风扇等问题,然后在网上找有好多说是电池的问题,仔细观察阵列后面的故障指示灯状态,在每个控制器上有并排三个故障指示灯,这个是两个控制器,其中左边一个控制器的三个指示灯左起第一个有个电池符号指示是绿色亮灯,其它二个不亮;面右边控制器的三个指示灯是左起第一个有电池符号的不亮,第二个也不亮,第三个指示黄色亮灯,因为集成商没有给阵列管理软件,自己也没尝试连过阵列,而且又是生产用设备,还是晚上值班,只有待第二天再继续处理。
        第二天上班,问了一下IBM 800,一看设备还没有过保,就直接报修,很快当地的IBM服务部门就联系我们,约定下午下班后用户使用不多的情况下,进行检查更换,IBM的服务人员按约定时间赶到, 先将连到服务器的网络断开,将双机HA停掉,数据库停掉,然后IBM的人员就连上阵列,检查电池的情况,显示一块电池 FAILURE,另一块也要过期,然后他就对阵列升级了微代码,再次检查电池情况,这时显示一块电池仍然 FAILURE,另一块已经正常,然后他就提出需要更换一块电池,这期间曾要求他将二块电池一起换掉,可他说这是公司的处理程序,经过这样处理,正常的就不能给予更换(总感觉这点IBM不太厚道),他们公司规定,我也不好难为工作人员,先更换块的电池,不影响设备正常工作就好。很快IBM工程师就取下控制器,更换好电池,然后恢复连接,再通过阵列管理软件处理,检查,显示一切正常,然后再把HA和ORCALE启来,稍等一会网络连接也恢复,在客户端测试应用程序连接正常,至此DS4300更换故障电池结束,避免了可能出现的数据访问缓慢,甚至造成数据错误的损失。
       

本文出自 “lengxf” 博客,转载请与作者联系!

你可能感兴趣的:(IBM,电池,更换,DS4300,阵列控制器)