堆叠脑裂

堆叠脑裂

          • 一、什么是堆叠脑裂
          • 二、堆叠脑裂的危害
          • 三、如何解决堆叠脑裂
          • 四、DAD是如何工作的
          • 五、DAD恢复机制:
          • 六、DAD检测方式:
            • 1、 业务口直连检测方式
            • 2、Eth-Trunk口代理检测方式
            • 3、管理网口检测方式
            • 4、堆叠端口检测方式

一、什么是堆叠脑裂

堆叠建立后,主交换机和备交换机之间定时发送心跳报文来维护堆叠系统的状态。堆叠线缆、主控板发生故障时或者其中一台交换机下电、重启都将导致两台交换机之间失去通信,导致堆叠系统分裂为两台独立的交换机,这种情况称为堆叠脑裂或者堆叠分裂。如图1所示。
图1 堆叠分裂示意图
堆叠脑裂_第1张图片

二、堆叠脑裂的危害

堆叠分裂后,若两台交换机都在正常运行,则其全局配置完全相同,会以相同的IP地址和MAC地址(堆叠系统MAC)与网络中的其他设备交互,这样就导致IP地址和MAC地址冲突,引起整个网络故障,此时可以依靠堆叠的双主检测来避免堆叠分裂后出现双主。

三、如何解决堆叠脑裂

双主检测DAD(Dual-Active Detect)是一种检测和处理堆叠分裂的协议,可以实现堆叠分裂的检测、冲突处理和故障恢复,降低堆叠分裂对业务的影响。

四、DAD是如何工作的

配置双主检测后,主交换机在检测链路上发送DAD竞争报文。堆叠分裂后,分裂成多部分的堆叠系统互发竞争报文,并将接收到的竞争报文信息与本部分竞争信息做比较,如果本部分竞争胜出,则不做处理,保持Active状态(正常工作状态),正常转发业务报文;如果本部分竞争失败,则除保留端口外的所有业务端口Error-Down转入Recovery状态(业务禁用状态),停止转发业务报文。
DAD竞争规则如下(依次从第一条开始判断,直至找到最优的交换机才停止比较):
1. (仅主控板直连方式涉及)整机业务口Error-Down状态比较,交换机上不存在以下Error-Down的优先竞争胜出:
a. 因无转发链路而导致的整机业务口Error-Down(no-stack-link)。
b. 因接口板和交换网板之间的链路故障而导致的整机业务口Error-Down(fabric-link-failure)。
以上Error-Down同时存在时,Error-Down原因是no-stack-link的交换机优先竞争胜出。
2. 堆叠优先级比较,堆叠优先级高的交换机优先竞争胜出。
3. 设备MAC地址比较,MAC地址小的交换机优先竞争胜出。

五、DAD恢复机制:

堆叠链路故障修复后,分裂成多部分的堆叠系统进行合并。处于Recovery状态的交换机将重新启动,同时将Error-Down的业务端口恢复正常,整个堆叠系统恢复。
如果在链路故障修复前,承载业务的Active状态的交换机系统也出现了故障。此时,可以先将Active状态的交换机从网络中移除,再通过命令行启用Recovery状态的交换机,接替原来的业务,然后再修复原Active状态交换机的故障及链路故障。故障修复后,重新合并堆叠系统。

六、DAD检测方式:

DAD检测方式有以下几种:

1、 业务口直连检测方式

业务口直连检测方式是指堆叠成员交换机间通过业务口连接的专用链路进行双主检测,如图2所示。
图2 业务口直连方式双主检测示意图

堆叠脑裂_第2张图片

业务口直连检测方式中DAD报文采用的是BPDU报文,因此直连检测链路还可以通过中间设备连接,如图3所示。此时,在中间设备上需要配置透传BPDU报文功能
图3 通过中间设备的业务口直连检测示意图
堆叠脑裂_第3张图片

业务口直连检测配置(配置之后该业务口出了DAD之外,不走其他流量)
system-view
[~HUAWEI] interface 10ge 1/1/0/5
[~HUAWEI-10GE1/1/0/5] dual-active detect mode direct
Warning: The interface will block common data packets, except BPDU packets. Continue? [Y/N]: y
[*HUAWEI-10GE1/1/0/5] quit
[*HUAWEI] interface 10ge 2/1/0/5
[*HUAWEI-10GE2/1/0/5] dual-active detect mode direct
Warning: The interface will block common data packets, except BPDU packets. Continue? [Y/N]: y
[*HUAWEI-10GE2/1/0/5] commit
[~HUAWEI-10GE2/1/0/5] return

2、Eth-Trunk口代理检测方式

Eth-Trunk口代理检测方式是指通过堆叠与代理设备相连的跨设备Eth-Trunk链路进行双主检测,如图4所示。在这种检测方式中,代理设备需要启动DAD代理功能。与业务口直连检测方式相比,Eth-Trunk口代理检测方式无需占用额外的接口,Eth-Trunk接口可以同时运行DAD代理检测和其它业务。

为了使DAD报文可以在Eth-trunk成员链路间互相转发,代理设备必须为支持DAD代理功能的交换机

图4 Eth-Trunk口代理方式双主检测示意图
堆叠脑裂_第4张图片
代理设备可以是一台独立运行的交换机,也可以是一个堆叠系统,即两个堆叠系统之间互为Relay代理,如图5所示。
图5 堆叠之间互为代理示意图
堆叠脑裂_第5张图片

为了防止检测干扰,两个堆叠系统必须使用不同的Domain ID,用于检测的端口和用于代理的端口也应该使用不同的Eth-trunk。

Eth-trunk口代理检测配置:
system-view
[~HUAWEI] interface eth-trunk 10
[*HUAWEI-Eth-Trunk10] trunkport 10ge 1/1/0/5
[*HUAWEI-Eth-Trunk10] trunkport 10ge 2/1/0/5
[*HUAWEI-Eth-Trunk10] dual-active detect mode relay
[*HUAWEI-Eth-Trunk10] commit
[~HUAWEI-Eth-Trunk10] return

3、管理网口检测方式

管理网口检测方式是指通过堆叠成员交换机的管理网口链路进行双主检测,如图6所示。当所有堆叠成员交换机的管理网口都连接至管理网络时,可以使用该方式进行双主检测,不需要占用额外的接口,也不需要使用代理设备。

在管理网口检测方式中,要求堆叠系统的管理网口必须配置IP地址,堆叠后只显示一个管理网口MEth0/0/0,只需要在这一个管理网口下配置IP地址即可。

图6 管理网口方式双主检测示意图
堆叠脑裂_第6张图片如图7所示,在没有管理网络的情况下,成员设备之间的管理网口相互直连也可以实现双主检测。在这种情况下,管理网口也必须配置IP地址。
图7 管理网口直连双主检测示意图

堆叠脑裂_第7张图片
管理网口检测配置
system-view
[~HUAWEI] interface meth 0/0/0/0
[~HUAWEI-MEth0/0/0/0] ip address 192.168.10.10 24
[*HUAWEI-MEth0/0/0/0] dual-active detect enable
[*HUAWEI-MEth0/0/0/0] commit
[~HUAWEI-MEth0/0/0/0] return

4、堆叠端口检测方式

堆叠端口检测方式是指通过堆叠物理成员端口之间的链路进行双主检测,如图8所示。该方式直接使用堆叠连接链路进行检测,不需要占用额外的接口。
图8 堆叠端口方式双主检测示意图(仅框式交换机支持)
堆叠脑裂_第8张图片
堆叠端口检测配置:
system-view
[~HUAWEI] interface stack-port 1/1
[~HUAWEI-Stack-Port1/1] dual-active detect mode direct
[*HUAWEI-Stack-Port1/1] quit
[*HUAWEI] interface stack-port 2/1
[*HUAWEI-Stack-Port2/1] dual-active detect mode direct
[*HUAWEI-Stack-Port2/1] commit
[~HUAWEI-Stack-Port2/1] return


参考资料:华为HedEx文档


你可能感兴趣的:(网络,云数据中心)