在本文档中,会涉及到下面几个内容:
■快速重路由FRR--fast re-route
■链路保护
■节点保护
■路径保护
■其他一些高级保护机制.
在开始以前,首先我们需要了解,为什么需要保护与恢复.
网络有些时候一部分会失效,这些失效涉及的范围很广,线路光纤松/断到路由器崩溃.
在IGP中,如果遇到网络震荡,那么OSPF或者其他路由协议会重新计算拓扑,然后再在区域中进行泛红,最后同步区域内的所有数据库。
但是MPLS TE,是具有使流量脱离IGP驱动的最短路径的能力的,它提供了快速重路由FRR或者MPLS TE 保护(simply MPLS TE protection).
在大型网络中,IGP协议需要相当 的几秒到几十秒时间进行收敛和汇聚。在整个网络稳定以前,对于客户的数据业务是处于真空阶段,如果再发生了网络震荡flaping,发生5-20秒的分组报文丢失是很正常的。
还有IGP,是一种链路状态协议,一旦链路失效以后又重新恢复,SPF会重新计算区域内的所有拓扑然后同步到每个路由器上,在这段时间,光是同步拓扑就让设备够受的,经常cpu利用率跑到搞过80%.等拓扑稳定下来才能正常转发,这个只是IGP的,而在MPLS TE中这个问题更加严重,因为在IGP稳定以后,LDP或者是RSVP才能工作,建立起来另据然后还要分发标签创建FEC等等,所花费的时间只会比IGP环境用的时间更多不会减少。
这,就是这个文档需要介绍的知识模块,如何有效的保护数据业务在MPLS TE流量工程中快速有效的进行不间断的转发.
这里或者很多人有相同的问题,如果在网络中路径不止一条到达对端,那么这样的话不算是一种保护吗?
一个链路失效,切换到另外一条链路。
可是,这里说明的是符合电信运营级别要求的切换,不间断切换。
这里开始先介绍几种主流的保护类型:
■路径保护,也称端到端保护(end-to-end protection)
■链路保护
■节点保护.
这里首先要介绍的是路径保护。
在资料中(基于MPLS TE流量工程)书中,说的cisco并不支持这种保护方式。
但是,书是几年以前的书了。我在cisco的网站上找到了相关的文档,应该cisco已经支持路径保护了。
http://www.cisco.com/en/US/docs/switches/datacenter/sw/5_x/nx-os/mpls/configuration/guide/mp_te_path_prot.html
该文档写得很详尽.我看了以后发现其实有点像显式路径,显示路径就是路径保护.
唯一的区别是,备份路径只为一条主路径服务。
从本质上来说,路径保护就是通过和现有的LSP并行建立一条额外的lsp来实现的。备份LSP除了在失效的情况下,是不会承载流量的,所以其实这种备份就是1:1方式,在你的网络中,有多少跳路径就需要多少条备份LSP,一般网络失效率远远低于50%,所以路径保护方案的扩展性比较小,而且代价太高。
下面是路径保护原理的一个实例:
这里可以看到,原始路径(主链路)是:
path: 7200a-->12008a-->12008c-->7200C.
备份路径是粗体网格的下面的路径。
假如说,主链路的预留带宽是100M.那么对于备份链路的预留带宽也是100M,当主链路在转发流量的时候(正常工作),备用链路处于不可用的状态。
所以这种备份方式不是运营商想看到的局面。
相比1:1和N:1 (N>1)的方式,相信运营商更喜欢的是N:1的备份方式。
所以路径保护,这里只介绍原理,具体配置在:
http://www.cisco.com/en/US/docs/switches/datacenter/sw/5_x/nx-os/mpls/configuration/guide/mp_te_path_prot.html
局部保护。
局部保护是在备份或者保护隧道只经过了主LSP的一段保护方式。
一定要注意是一段。
和路径保护类似,局部保护也需要提前建立一条LSP作为备份。
和路径保护相比,局部保护有几点优势---更快的收敛时间。1:N的扩展性以及消耗更少的网络资源.换句话说,一条LSP保护N条主LSP.
图中我做了一下标示。
红色是主链路,绿色,只在中间4台cisco 12000系列的设备做了局部保护。
这就是局部保护的基本概念。
这里有一些基本术语需要了解。
PLR--局部里修理点,point of Local repair.结合拓扑图中,12008a就是一个PLS.备份隧道的首端.
MP---汇聚点,Merge point.备份隧道的终结点。在图中,12008C是MP.
NHop---下一跳路由器。和PLS距离一跳得路由器。这个路由器绕过了被保护链路.图中12008c是a的下一跳.
上面是简单的原理概念。有了这些概念,下面还有一些原理是需要掌握的。
链路保护可以分为下面四个部分:
Prefailure configuration.--失效前检测
Failure detection.--失效检测
Connectivity restoration.--连通性恢复。
Post-failure signalling.--失效后的信令过程.
PS:这里链路保护和其他所有的TE应用都是一样,单向的。所以为了保护经过一条链路从A到B的LSP,需要A->B的方向的保护,要同样建立一条反向的LSP从B到A。
关于这几种保护具体的实现方法,后续文档会进行一个整理来用实验验证今天所学的所有原理.
Fast-re-route.
首先介绍一下快速冲路由的原理:
快速重路由(Fast Reroute,FRR)是一种MPLS LSP的局部保护技术,用于实现对流量工程隧道(TE TUNNEL)的保护。所谓局部保护,指保护是针对某一个节点或某一条链路进行的;若对LSP上的每个节点或每条链路都实施保护,便可实现对整个LSP的保护。通过使用FRR功能,可以实现50ms的保护的能力。FRR是MPLS流量工程的一个重要特点,从目前的使用情况来看,利用MPLS流量工程更多的是利用FRR功能。
FRR的实质可以说是“未雨先绸”,即在故障之前就建立备份的LSP,当被保护的节点或链路发生故障并被检测到后,流量从被保护LSP切换到备份LSP上,从而尽量地避免流量的丢失。
局部保护包括两种保护:
(能达到50ms级别的保护切换,都属于电信运营级别的要求,当然在路由器三层设备中,BFD,FFR都可以实现这些功能,在Metro-E二层交换机中,EIPS或者是华为的弹性分组环也可以做到这个要求。)
(1) 链路保护:对某两个路由器之间的链路进行保护。
(2) 节点保护:对某个路由器节点进行保护,节点保护是包括了链路保护的。
如上图所示,备份LSP实现了对节点R2的保护,同时也实现了对链路R1 –> R2的保护。
第一种方式为one-to-one方式,RFC4090定义的两种方式之一.
所谓ONE-TO-ONE,是指一个备份LSP“一对一”保护一个被保护TUNNEL。如下图所示。图中的红色LSP是备份LSP,在此种方式中被称为Detour LSP,它实现对主LSP(TUNNEL)的保护。Detour LSP开始于R1路由器,R1被称作本地修复点(Point of local repair),它是Detour 的起点设备(Ingress)。Detour LSP绕过了PLR(R1)的下游节点R2。Detour LSP的终点是被保护TUNNEL的Egress,它与主LSP在R3上“相遇”,并被合并到主LSP上。这种合并行为称作Merge,故R3被称作MP(Merge Point)。实际上这种合并操作并不是必要的,但若不进行合并操作,则会在MP后存在多条LSP的信令维护问题,所以合并操作还是需要的。
ONE-TO-ONE方式中的Detour LSP,它只能依附于被保护LSP而存在,若被保护LSP被删除,则所有与此TUNNEL相关的Detour LSP都要被删除。
在ONE-TO-ONE方式中,主LSP的Ingress节点提出FRR的需要,主LSP上的每个节点(包括Ingress)都要尽力而为地建立以自己为起点的Detour LSP。故这种保护方式在扩展性上存在一定的问题。
(2) FACILITY方式:
Facility方式是另外一种实现FRR的机制,如图3-14和图3-15所示,其备份实现采用一个绕过被保护节点或被保护链路的隧道(称作旁路隧道,Bypass Tunnel)。这个Bypass Tunnel是一个独立的TUNNEL,它可以独立于被保护TUNNEL而存在和被维护,实际上就是一条普通的TUNNEL,相关的PATH消息、RESV消息等的维护等都是独立的;区别于ONE-TO-ONE方式中Detour LSP的非独立性。
第一种方式为Faulty方式,RFC4090定义的两种方式之二
Facility方式是另外一种实现FRR的机制,如图3-14和图3-15所示,其备份实现采用一个绕过被保护节点或被保护链路的隧道(称作旁路隧道,Bypass Tunnel)。这个Bypass Tunnel是一个独立的TUNNEL,它可以独立于被保护TUNNEL而存在和被维护,实际上就是一条普通的TUNNEL,相关的PATH消息、RESV消息等的维护等都是独立的;区别于ONE-TO-ONE方式中Detour LSP的非独立性。
在节点保护的Facility 方式中, Bypass Tunnel的尾节点是PLR的下下一跳(Next Next HOP,NNHOP)设备,如图3-14中的R3设备所示,它绕过了PLR的下游节点(R2)。
在链路保护的Facility 方式中, Bypass Tunnel的尾节点是PLR的下一跳(Next HOP,NHOP)设备(图3-15中R2),它绕过了PLR与下游节点(R2)之间的R1->R2链路。
由于Bypass Tunnel的独立性,它可以实现对多条TUNNEL的保护,从而实现1:N的保护,这种方式在扩展性上更好。所以Faciltiy方式又可以称作“Many-To-One”方式。
当然这里最为推荐的是第二种方式。one-to-one的方式毕竟,代价太高。一个网络可用的程度只有50%而已,没有运营商原理投入这样高的成本来运维。
具体文档可以参阅下面链接:(我用的版本就是15.1(4)的版本,编译时间是Compiled Tue 14-Jun-11 23:39 by prod_rel_team)
http://www.cisco.com/en/US/docs/ios/mpls/configuration/guide/mp_te_frr_node_prot_ps10890_TSD_Products_Configuration_Guide_Chapter.html
很快我会把MPLS TE保护与恢复机制的实验版整理出来。来验证现在所学得所有原理。