一次因EMC NAS控制器故障进行MSSQL集群恢复过程

今天 SQL 数据库突然不能连接 , 去机房发现是 NAS 有一块共享磁盘不能联机 , 以下是主要处理 , 因在机房 , 不方便抓图 .
一. 故障出现
上边的图是出现问题的 MSCS 集群基本逻辑结构。
@ 两台 MSSQL 数据库,两个实例 , 运行平台是 Windows2003 Server.
@ 左边是一台交换机
@ 下边是 EMC NAS 磁盘阵列。两台 MSSQL 数据库服务器通过 iscsi 协议访问 NAS 上的共享磁盘。
@DB1 MSSQL 实例 1 数据存储磁盘, DB2 MSSQL 实例 2 数据存储磁盘。 Q 为仲裁磁盘。
问题:
两台 SQL 服务器均不能通过 Initiator 软件连接 DB1 共享磁盘,集群管理器下 DB1 显示联机失败。查看,两台 SQL 服务器,磁盘管理,均找不到 DB1 ,而 DB2 Q 没有问题。
问题出现原因:
EMC NAS 一控制器出现问题,导致磁盘 DB1 读写异常。
二. 故障处理过程
起初是认为磁盘 DB1 坏了
EMC NAS 数据修复 , 经过几天的折腾 , 没有解决 . 问题出现的原因找到 ,NAS 磁盘控制器其一已损坏 , 确认磁盘没有问题 .
更换 NAS 磁盘控制器 . 重建 DB1.
 
MSSQL 处理
@ 登录一台 MSSQL 服务器 , 进入磁盘管理 , 弹出初始化磁盘 . 这个磁盘就是新建的磁盘 . 然后是进行磁盘分区 , 要注意 , 需要按照原来的分区数量进行 . 数据库安装文件都在本机 , 因此直接导入原来备份即可 .( 今天在机房操作 , 不方便截图 ).
@ 打开群集管理器 (cluadmin), 在资源组中找到如下类似磁盘资源 . 将其删除 , 需要重建一下 . 一般会提示有依存关系 , 将相应的依存关系先取消即可 .
       @ 重起两台 SQL 服务器 , 两个实例均已恢复正常 . 

你可能感兴趣的:(数据库,MSSQL,NAS,EMC,iSCSI)