服务器数据恢复案例之RAID信息丢失数据恢复

【数据恢复故障描述】

今天为大家介绍的是服务器数据恢复案例,服务器的故障是raid信息丢失了。下面简单介绍一下本次数据恢复的服务器基础信息:某品牌DL380系列服务器,存储是由6块73GB SAS硬盘组成的RAID5磁盘阵列,服务器上层操作系统是WINDOWS 2003 SERVER,服务器内主要存储了企业的内部文件,没有数据库文件,在服务器的主机(无UPS)发生故障前曾经出现过几次意外断电的情况,由于重启后并没有出现异常,因此服务器一直在使用,直到有一次断电重启后RAID报错,提示无法找到存储设备,进入RAID管理模块后操作死机,管理员多次尝试重启服务器后还是没有办法进入系统,为了防止服务器内数据丢失,管理员联系到北京北亚数据恢复中心进行服务器数据恢复。

【数据恢复故障分析】

通常服务器出现这种情况的数据丢失多因为服务器意外断电导致RAID模块损坏(包括RAID管理信息丢失和RAID模块硬件损坏)。一般在RAID阵列创建完成后阵列的管理模块信息就固定下来不会再发生改变,但是raid阵列的模块信息依然属于可修改部分,服务器意外断电很容易造成这部分信息被篡改甚至丢失,多次断电甚至有可能导致RAID卡上的元器件损坏,从而使主机失去对多块物理硬盘进行RAID管理的中间层模块。该案例中对RAID模块的操作死机现象极有可能是由RAID卡硬件损坏引起的(后经HP售后技术人员验证得到证实),此时通过正常途径已无法将获取6块硬盘中的数据,只能依靠第三方提供数据恢复服务来解决。

【服务器数据恢复过程】

1.服务器数据恢复第一步首先对客户的服务器内所有硬盘进行严格的物理检测,用以排查硬盘是否有硬件故障。经过检查发现服务器内的所有硬盘均可以正常读取。

2.由于硬盘全部正常,因此不需要进行硬件修复,直接对服务器内的硬盘进行镜像备份即可。

3.镜像完成后,服务器数据恢复工程师开始对这组raid进行结构分析,主要是为了确定raid阵列的硬盘顺序、数据块的大小和阵列校验方式等用于重新构建raid阵列。

4.服务器数据恢复工程师利用分析出来的raid阵列信息重新虚拟重建一组raid阵列并进行逻辑校验,确保重构RAID所应用的各参数正确无误后,针对用户最为关注的数据进行完全验证;

5.最后,数据恢复工程师联系客户对恢复出来的数据进行验证,经过验证后所有数据均已经成功恢复,数据迁移成功后本次数据恢复圆满结束。

【服务器存储安全建议】

1.尽量保证机房电源供应稳定,以减少电源异常对主机及存储的冲击;

2.最好为重要的服务器及存储配置UPS,可在机房意外断电的情况下保证核心业务系统能继续维持一定时间的正常工作,从而为企业寻求应急解决方案赢得宝贵的时间;

3.对于服务年限已久的服务器应定期进行安全状况检查,并对其整体运行状态进行评估以决定是否进行硬件及系统的全面升级,同时提前制定突发数据灾难的紧急处理方案,以降低数据灾难带来的业务损失。

 

你可能感兴趣的:(数据恢复,数据恢复,服务器)