netapp故障处理

光纤Metrocluster + syncmirror环境

netapp故障处理_第1张图片

环境介绍

SyncMirror   MetroCluster 不可或缺的组成部分,它将  RAID 1 磁盘镜像保护与 NetApp RAID 4 RAID-DP 技术完美结合。发生中断事件(无论是因磁盘问题、电缆断线还是主机总线适配器  [HBA] 故障所致)时,SyncMirror 可以即时访问镜像数据,而无需操作员介入或中断客户端应用程序。

SyncMirror 在镜像数据的两个副本之间保持严格的物理隔离。每个副本都称为一个丛  (plex)。每个控制器的数据都在另一个站点有其相应的“镜像”。请参见图。

同步镜像的开销很低,这是因为在每个控制器写入时,该操作会直接(而非通过其伙伴控制器)进入那两个丛。

( 4) SyncMirror 池和丛

netapp故障处理_第2张图片

SyncMirror 在聚合一级而不是在传统的卷一级上操作。这样就减少了要管理的复制关系,从而缩短了恢复时间。

SyncMirror 获得许可并使用硬件所有权时,备用磁盘会拆分为两个:Pool0   Pool1。镜像的每个丛都使用这些分隔的池中的磁盘。

使用软件所有权时,磁盘由管理员明确分配给池。

为了最大限度提高可用性,Pool0   Pool1 磁盘需要位于分开的环路中,并分别使用不同的 HBA、电缆和磁盘架。

启用 SyncMirror 许可证之前,确保每个池的磁盘位于满足彼此故障隔离要求的相应环路中。

 

需要的组件

•运行兼容 Data ONTAP 版本的 FAS3000FAS3100FAS3200FAS6000 FAS6200 系列控制器的高可用性对(有关支持型号的信息,请参阅 NOW 网站上的《MetroCluster 兼容性表》)

•由 NetApp 提供、配有支持固件的四个Brocade 光纤通道交换机(有关支持型号的信息,请参阅 NOW 网站上的《MetroCluster 兼容性表》),每个位置一对;不同结构支持的型号可能有所不同,但每个结构内支持的型号必须相同

  Brocade 长距离链接(Extended Distance)许可证(如果超过 10 公里)

  Brocade 全光纤(Full Fabric)许可证

  用于添加更多端口的 Brocade 按需付费端口许可证 (Ports on Demand, POD)

  FC/VI 集群适配器

  syncmirror_local 许可证 

  cluster_remote 许可证 

  cluster 许可证 

  相关布线

 

 

 

 

 

 

 

 

 

故障问题

节点A(镜像)同时坏了块磁盘,现在的要求是:将这块磁盘全部替换掉,重建syncmirror镜像。

步骤

一、有三种方式登录到命令行CLI界面:

1.通过console控制台串口连接

2.远程管理口RLM/BMC Remote LAN Module / Baseboard Management Controller),远程管理口通过ssh登录,用户和密码多是naroot。或者通过system  console命令设定

3.通过以太网口

通过ssh连接,发现连接不了(有可能是ssh用户登录限制引起的,有可能是以前登录后,用户没有正常退出,占用着进程。一个用户只能在一个终端登陆。)

通过com口登录:插上串口线,在设备管理器里查看是连接的是哪个com口。

2.进入高级模式:priv  set  advanced

3.将失效的aggrofflineaggr  offline  disaster_aggr

                    aggr  offline  plex_name

4.如果坏磁盘没有显示failed,需要手动执行disk  fail  disk_name。磁盘显示failed后,将坏磁盘拔出换上新硬盘

5.删除失效的镜像: aggr  destroy  disaster_aggr

                 aggr  destroy  plex_name

6.重新配置磁盘归属:disk  remove_ownership  disk_name_1  disk_name_2 …..

                  disk  assign  disk_name_1  disk_name_2 …..  –p  1  (指定pool

  注意:其中确保每个磁盘柜留一块热备盘(热备盘不能跨pool

7.初始化所有空闲的磁盘:disk  zero  spares ,过程中通过syscongfig  -r命令查看进度

8.建立aggr镜像:aggr  mirror  aggr0  -d  disk_name_1  disk_name_2  …..

                过程中通过sysconfig  -r命令来查看resync状态,resync完成后即可。

你可能感兴趣的:(NetApp)