前两天一个朋友打电话过来说他的一个客户的数据丢失了,让我帮忙去看一下。
问题是这样的:
 
服务器一直开着,并且正常使用,用户突然发现数据无法正常访问,在磁盘管理中有物理硬盘但是显示无法读取。用HP的阵列管理软件能够查看阵列状态,显示正常。
 
硬件:
系统Win2003
HP的服务器(型号忘记了)用的双机热备 心跳线连接
存储使用的是MSA1000,满盘 300G 14
存储服务器之间用光纤HUB连接,采用了群集管理
存储采用了双控制器,主从关系
两台服务器也分别采用了双卡结构
 
 先检查阵列连接方式,发现线是很多,不过把冗余去掉,就是简单的 服务器-HUB-存储的连接方式,在管理软件中显示正常说明阵列应该没有太大问题,估计问题出在系统上。一般像这种服务器使用双光纤卡的应该有仲裁软件,查看系统并咨询HP工程师,确定存在这个软件。
解决过程:
重装软件无效,找另外一台机器安装系统+软件,直接连接存储成功识别。然后备份原系统数据,重装系统故障解决。
 
这个案例让我想起好久之前一个案子
问题:
系统Red hat 9,工作人员误删除将网站数据清除,EXT3文件系统
因文件量巨大,目录结构复杂,初步估计没戏,死马也当活马医。
硬件:
存储MD3000,共3T,采用双控,每个控制器又有两条光纤线
存储为3组服务器提供服务
通过光纤HUB连接
其中一组服务器为 1950
 
分析过程:
在当前系统下查看磁盘信息,的确是使用了 删除命令,水平所限 一般分析都是在windows下进行,要求客户提供台Windows服务器,还好客户有备用机,安装系统,连接存储,在磁盘管理中能够看到2个相同的磁盘但是显示无法访问,当时是第一次遇到这种问题,尝试直连盘柜,无效,后来咨询Dell客服,确认需要安装仲裁,磁盘能够正常识别。
通过工具分析,和当初判断结果一致,完整目录肯定是无法实现的,按文件类型可以恢复,但这样对用户来讲无用。
宣布失败
这次收获是学会了在较复杂的服务器方案中,如何去连接存储。