光纤Metrocluster + syncmirror环境
环境介绍:
SyncMirror 是 MetroCluster 不可或缺的组成部分,它将 RAID 1 磁盘镜像保护与 NetApp 的RAID 4 和 RAID-DP 技术完美结合。发生中断事件(无论是因磁盘问题、电缆断线还是主机总线适配器 [HBA] 故障所致)时,SyncMirror 可以即时访问镜像数据,而无需操作员介入或中断客户端应用程序。
SyncMirror 在镜像数据的两个副本之间保持严格的物理隔离。每个副本都称为一个丛 (plex)。每个控制器的数据都在另一个站点有其相应的“镜像”。请参见图。
同步镜像的开销很低,这是因为在每个控制器写入时,该操作会直接(而非通过其伙伴控制器)进入那两个丛。
(图 4) SyncMirror 池和丛
SyncMirror 在聚合一级而不是在传统的卷一级上操作。这样就减少了要管理的复制关系,从而缩短了恢复时间。
当 SyncMirror 获得许可并使用硬件所有权时,备用磁盘会拆分为两个:Pool0 和 Pool1。镜像的每个丛都使用这些分隔的池中的磁盘。
使用软件所有权时,磁盘由管理员明确分配给池。
为了最大限度提高可用性,Pool0 和 Pool1 磁盘需要位于分开的环路中,并分别使用不同的 HBA、电缆和磁盘架。
启用 SyncMirror 许可证之前,确保每个池的磁盘位于满足彼此故障隔离要求的相应环路中。
需要的组件:
•运行兼容 Data ONTAP 版本的 FAS3000、FAS3100、FAS3200、FAS6000 或 FAS6200 系列控制器的高可用性对(有关支持型号的信息,请参阅 NOW 网站上的《MetroCluster 兼容性表》)
•由 NetApp 提供、配有支持固件的四个Brocade 光纤通道交换机(有关支持型号的信息,请参阅 NOW 网站上的《MetroCluster 兼容性表》),每个位置一对;不同结构支持的型号可能有所不同,但每个结构内支持的型号必须相同
• Brocade 长距离链接(Extended Distance)许可证(如果超过 10 公里)
• Brocade 全光纤(Full Fabric)许可证
• 用于添加更多端口的 Brocade 按需付费端口许可证 (Ports on Demand, POD)
• FC/VI 集群适配器
• syncmirror_local 许可证
• cluster_remote 许可证
• cluster 许可证
• 相关布线
故障问题:
节点A(镜像)同时坏了几块磁盘,现在的要求是:将这几块磁盘全部替换掉,重建syncmirror镜像。
步骤:
一、有三种方式登录到命令行CLI界面:
1.通过console控制台串口连接
2.远程管理口RLM/BMC( Remote LAN Module / Baseboard Management Controller),远程管理口通过ssh登录,用户和密码多是naroot。或者通过system console命令设定
3.通过以太网口
通过ssh连接,发现连接不了(有可能是ssh用户登录限制引起的,有可能是以前登录后,用户没有正常退出,占用着进程。一个用户只能在一个终端登陆。)
通过com口登录:插上串口线,在设备管理器里查看是连接的是哪个com口。
2.进入高级模式:priv set advanced
3.将失效的aggroffline:aggr offline disaster_aggr
aggr offline plex_name
4.如果坏磁盘没有显示failed,需要手动执行disk fail disk_name。磁盘显示failed后,将坏磁盘拔出换上新硬盘
5.删除失效的镜像: aggr destroy disaster_aggr
aggr destroy plex_name
6.重新配置磁盘归属:disk remove_ownership disk_name_1 disk_name_2 …..
disk assign disk_name_1 disk_name_2 ….. –p 1 (指定pool)
注意:其中确保每个磁盘柜留一块热备盘(热备盘不能跨pool)
7.初始化所有空闲的磁盘:disk zero spares ,过程中通过syscongfig -r命令查看进度
8.建立aggr镜像:aggr mirror aggr0 -d disk_name_1 disk_name_2 …..
过程中通过sysconfig -r命令来查看resync状态,resync完成后即可。