raid5因两块硬盘掉线导致的数据丢失恢复过程分享

全文链接

1. 故障描述
本案例是HP P2000的存储vmware exsi虚拟化平台,由RAID-5由10块lT硬盘组成,其中6号盘是热备盘,由于故障导致RAID-5磁盘阵列的两块盘掉线,表现为两块硬盘亮黄灯。 经用户方维护人员检测,故障硬盘应为物理故障,表现为:序列号无法读取,在SAS扩展卡上硬盘无法识别。
raid5因两块硬盘掉线导致的数据丢失恢复过程分享_第1张图片

2. 数据备份与修复
故障发生后用户方工程师与我公司联系,经过详细咨询,了解到故障比较严重,必须把RAID-5磁盘阵列带到我公司进行检测,检测RAID-5的每块成员盘是物理故障(磁头损坏或者盘片划伤)还是逻辑故障。由于情况紧急,工程师在接到原盘以后,立即着手准备检测。对能识别的好盘用连接到北亚镜像服务器上使用WinHex做扇区级镜像,同时对不能识别的坏盘进行检测。
首先将坏盘连接到外部的SAS扩展卡上,加电后通过硬盘工作声音判断硬盘电机能够起转,但是磁头没有进行寻道操作,于是尝试把硬盘PCB分离下来对HDA组件氧化部分进行清洁操作,将PCB还原后故障依旧。于是和客户沟通使用6号热备盘的好PCB替换到故障盘上进行尝试性修复,再将故障盘PCB上的ROM芯片替换到6号盘的好PCB上面后硬盘工作时起转和磁头寻道声音都正常,但是在寻道结束后,有明显的敲盘声音,于是判断有可能磁头损坏。在和用户沟通后尝试使用6号热备盘中的好磁头对故障盘进行替换操作以读取数据。在无尘室对故障盘进行开盘更换磁头操作后,将故障盘连接到专业硬盘维修工作上进行检测,发现故障盘已经不能识别,数据无法读取。
因为用户有两块故障盘,之前尝试修复的都是其中一块,再次和客户沟通尝试对另一块故障盘进行修复操作。和先前的故障盘一样,这块盘的故障依旧是磁头损坏,因为用户的HP OEM盘价格昂贵,于是尝试在网上购买ST原厂的相同型号硬盘进行磁头更换。这块硬盘的磁头更换完成后,设备能够正常识别硬盘,于是将故障盘所有扇区完整镜像到一块相同容量的备份盘中。

3.重组RAID-5步骤
【判断起始扇区】所有硬盘都镜像好后就可以重组了,用WinHex打开9块盘(热备盘不需要加进去重组),先把镜像文件解析成磁盘。可以看到这9块盘的0扇区都有“55 AA”标志,如图1所示。
raid5因两块硬盘掉线导致的数据丢失恢复过程分享_第2张图片

图1
查找结果如图2所示,0x01C2H处表示该分区的类型,这里显示“05”,代表这是一个扩展分区。因此从0扇区看这是一个不正常的MBR分区结构。
2


你可能感兴趣的:(raid5因两块硬盘掉线导致的数据丢失恢复过程分享)