服务器raid5阵列硬盘故障的解决办法

概述
        两组分别由4块600G容量的SAS硬盘组成的raid5阵列,并且两组阵列划分LUN,组成LVM结构,并格式化为EXT3文件系统。

一块硬盘意外离线,热备盘上线,顶替离线硬盘。但在热备盘上线过程中,又一块硬盘离线,导致热备盘同步失败,两组raid阵列中的一组崩溃,LVM结构不完整,文件系统无法正常使用。对两块离线硬盘进行检测,发现先离线硬盘无法识别,初步推断是硬件故障,需要进行开盘修复操作,另一块硬盘可以识别。


解决方案
1、故障盘修复
        对故障硬盘进行开盘修复操作。开盘后发现,硬盘盘片磨损严重,已无法修复,只能对阵列进行缺盘处理。
2、硬盘备份
        使用专业数据恢复软件winhex对故障raid阵列的其余成员盘进行全盘备份,并且对另一组好的raid阵列的全部成员盘进行全盘备份,备份情况如下:
图一:
服务器raid5阵列硬盘故障的解决办法_第1张图片
图二: 
服务器raid5阵列硬盘故障的解决办法_第2张图片 
3、重组raid阵列
        仔细分析硬盘底层数据,通过对EXT3文件系统结构进行解析,分别分析出两组raid阵列的盘序、条带大小、校验方向等配置信息,使用专业数据恢复软件winhex重组出两组raid阵列。经分析,两组raid阵列块大小都为64K,校验方向为做同步,对故障raid进行重组时注意进行缺盘处理。
图三:
服务器raid5阵列硬盘故障的解决办法_第3张图片
图四: 
  服务器raid5阵列硬盘故障的解决办法_第4张图片
4、重组LVM结构
        重组出两组raid阵列之后,对两组raid中的底层数据进行分析,找到LVM结构信息,对LVM结构进行分析,将两组raid中作为PV(LVM物理卷)的LUN导出,然后使用专业数据恢复软件UFS Explorer将两个PV重组,重新生成LVM逻辑卷。
图五:
服务器raid5阵列硬盘故障的解决办法_第5张图片
图六: 
  服务器raid5阵列硬盘故障的解决办法_第6张图片
5、恢复并导出数据
       LVM重组之后,对LV(逻辑卷)中的EXT3文件系统进行解析,恢复并导出其中的全部数据。以下为回复出来的数据:
图七: 
服务器raid5阵列硬盘故障的解决办法_第7张图片


你可能感兴趣的:(服务器raid5阵列硬盘故障的解决办法)