目前,信息中心FAST600磁盘阵列磁盘损坏,造成数据盘数据无法读取,对FAST600的日志分析如下:
共有四个主机组,四台主机分别是news-database-149,news-pub-147,video-139为Windows主机,news-pic-153为Linux主机。
HOST GROUP club-168
HOST GROUP news-database-149
Host: news-database
Host Port: 21:00:00:11:25:92:18:22
Alias: news-database-port
Type: Windows 2000/Server 2003 Non-Clustered
HOST GROUP news-pub-147
Host: news-pub
Host Port: 21:00:00:11:25:92:79:98
Alias: news-pub
Type: Windows 2000/Server 2003 Non-Clustered
HOST GROUP video-139
Host: video-139
Host Port: 21:00:00:11:25:92:7b:49
Alias: video
Type: Windows 2000/Server 2003 Non-Clustered
HOST GROUP news-pic-153
Host: jxnewspic
Host Port: 21:00:00:11:25:92:28:ea
Alias: jxnewspic
Type: Linux
Host Port: 21:00:00:11:25:92:28:eb
Alias: jxnewspic1
Type: Linux
数据盘映射情况是jxnewspic (199.998 GB)给主机jxnewspic, news-database(200 GB)给主机news-database,news-pub(200 GB)给主机news-pub,video(300 GB)给主机video-139。
MAPPINGS (Storage Partitioning - Enabled (4 of 8 used))-------------------
VOLUME NAME LUN CONTROLLER ACCESSIBLE BY VOLUME STATUS
Access Logical Drive 31 A,B Host Group news-database-149 Optimal
Access Logical Drive 31 A,B Host Group news-pic-153 Optimal
Access Logical Drive 31 A,B Host Group news-pub-147 Optimal
Access Logical Drive 31 A,B Host Group video-139 Optimal
jxnewspic 0 B Host jxnewspic Failed
news-database 0 B Host news-database Failed
news-pub 0 B Host news-pub Failed
video 0 A Host video-139 Failed
各个盘的容量空间和状态如下:
Number of standard logical drives: 5
See other Logical Drives sub-tabs for premium feature information.
NAME STATUS CAPACITY RAID LEVEL ARRAY
club Failed 400 GB 5 1
jxnewspic Failed 199.998 GB 5 1
news-database Failed 200 GB 5 1
news-pub Failed 200 GB 5 1
video Failed 300 GB 5 1
所有的VOLUME 的状态为失败的,这是由于ARRAY 1 (RAID 5)中有三块盘失败造成的,分别是2,3,10号槽位的硬盘失败
BASIC:
TRAY, SLOT STATUS CAPACITY CURRENT DATA RATE PRODUCT ID FIRMWARE VERSION
0, 1 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 2 Failed
0, 3 Failed 136.732 GB 2 Gbps ST3146807FC F B356
0, 4 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 5 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 6 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 7 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 8 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 9 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 10 Failed 136.732 GB 2 Gbps ST3146807FC F B356
0, 11 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 12 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 13 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
0, 14 Optimal 136.732 GB 2 Gbps ST3146807FC F B356
第14号热备盘也已经被用上了,当3号盘坏掉时。
HOT SPARE COVERAGE:
The following arrays are not protected: None - All arrays are protected
Total hot spare drives: 1
Standby: 0
In use: 1
In use drive at enclosure 0, slot 14 (Fibre, 136.732 GB)
Protects the following array: 1
Sparing for drive at enclosure 0, slot 3
解决方法一:
1、 购买三块新的2GB 146GB的IBM光纤硬盘。
2、 用一块替换3号盘,让第14号盘释放出来。
3、 如果14号盘释放出来后能够继续替换10号盘,RAID5就是可用的了,数据也可以找回来。(希望是10%左右)需要时间(3-5天)
4、 如果操作不成功,可能在RAID恢复过程中,造成RAID信息丢失,数据后续不能很好的修复。
费用可能是最低的,只是三块新硬盘的费用。(大概8000*3=2.4W RMB)客户自己更换,如果需要上门需要提供上门服务费用(上门服务费用是专门为客户服务而产生的交通食宿等费用,双方协商确定,无论数据恢复业务成功与否,均需付给上门服务费用。)
解决方法二:
1、 把最后坏的2号硬盘数据修复,修复硬盘RAID信息及数据。
2、 硬盘需要专门的设备修复,需要时间(7-15天)将坏盘邮寄给数据恢复公司。
3、 如果操作不成功,在修复2号硬盘过程中对硬盘有更大的损伤,结果将是毁坏性的,RAID信息将全部丢失。(希望是10%左右)
开盘费用(大概4W RMB 人工+设备)
解决方法三:
1、 将14块盘标号,全部克隆备份,用专业工具对RAID进行修复。(1-5天)
2、 如需上门服务需要提供上门服务费用(上门服务费用是专门为客户服务而产生的交通食宿等费用,双方协商确定,无论数据恢复业务成功与否,均需付给上门服务费用。)
3、 如果操作不成功,不收取数据修复费用。
4、 对数据恢复的最彻底,数据恢复希望也最大(80%),安全系数也最高
费用(14*5000=7W RMB)每块盘修复5000RMB