现在的许多服务器比较先进了,一些错误可以自动检测,并提供相应的错误代码,一目了然。首先是看指示灯,如果变成橙×××(官方称为琥珀色),一般是因为室内温度过高,或者断过电。服务器的硬件参数在戴尔网站上可以查到。这次黄了的不仅仅是指示灯,还有一个硬盘灯,不停地闪阿闪。再一读主机液晶屏上的信息,和一般有些不一样。在下表中可以查到错误代码对应的信息和操作建议。
LCD显示代码 信息描述 现象分析
SYSTEM ID SYSTEM NAME 正常,显示系统信息。
E0000 OVRFLW CHECK LOG 日志满,需要清除日志。
E0119 TEMP AMBIENTTEMP BMC 环境温度,过高或者过低。
E0212 VOLT PG n 请检测电源模块是否正常。
E0212 VOLT BATT ROMB RAID 卡电池问题,需要重新充放电或者更换电池。
E0212 VOLT BATT CMOS CMOS 电池需要更换。
E0412 RPM FAN n FAN REDUNDANCY LOST 风扇问题,请根绝显示的风扇编号查看风扇情况。
E0780 PROC n PRESENCE 编号位置没有安装 CPU
E07F0 PROC n IERR CPU 安装不正确。
E07FA PROC n THERMTRIP 编号所指位置的 CPU 温度高。
E0876 PS n 编号所指位置电源问题,检查电源模块安装以及接线情况。
E08F4
 
POWER PS n
 
电源线没有接好。
E0CF5 LOG DISABLE SBE 内存单字节逻辑错误。
E0D76 BP DRIVE n 1x2 DRIVE FAIL n SCSI CONNECTOR 硬盘掉线,请先备份数据。然后进行硬盘的REBUILD。
解决的方案:
  • 确定RAID卡类型。
  • 用软件修复有两种方式:
  • 用windows下的随机软件array manager对掉线硬盘进行修复
  • LSI RAID BIOS界面下如何做硬盘修复(LSI RAID控制器通用)
因为没有安装array manager,这次就用了后一种方法。备份了文件,重启,按[ctrl+m]进入raid bios,察看磁盘状态,应该说比较幸运,所有症状都和上面这篇教程的吻合,没有更严重的问题发生。当时显示的磁盘信息可以看下面的照片,和教程里的做一个对照。接下来就是修复了。修复过程非常之慢,差不多一个小时只能走10%的进度。不知道能否在系统运行的过程中进行修复,这次没有这么做。不管怎么说,冒险是不值得提倡的。在风险很小的情况下,才考虑怎么做更有效率。