软raid出现坏道遇见的情况

环境:  

Openfiler NSA, version 2.3

硬盘*4 Software RAID10

在软RAID10上划分lvm

硬盘相关服务有samba(ext3FS) ietd smated



情况1:

无法访问samba存储, windows客户端打开samba卡死

进入服务器查看发现load average竟超过90, top检查进程 发现iowait一直处于100%

初步推测是硬盘问题, 使用smartctl检查,硬盘均为PASS,但是某硬盘Reallocated_Event_Count有数字,推测是坏道引起.

尝试了kill -9 和 mdadm --zero-superblock  和 --fail --remove 等命令,均不生效,无法杀死samba父进程

查了文档, 据说进程正处于内核态度中是无法杀死.

由此猜测可能是由于进程执行读写操作的时候卡死, 读写请求已经发送至内核, 所以无法被杀死.

无奈服务器未知是否开启热插拔. 无奈只可强行关机.更换硬盘并同步数据.


1年半, 该情况出现了2次.




不知道大家有没有遇到过相关情况.



你可能感兴趣的:(服务器,openfiler,软RAID)