MPLS ×××技术原理(全篇)
1 MPLS提出的意义
传统的IP数据转发是基于逐跳式的,每个转发数据的路由器都要根据IP包头的目的地址查找路由表来获得下一跳的出口,这是个繁琐又效率低下的工作,主要的原因是两个:
1、有些路由的查询必须对路由表进行多次查找,这就是所谓的递归搜索;
2、由于路由匹配遵循最长匹配原则,所以迫使几乎所有的路由器的交换引擎必须用软件来实现,用软件实现的交换引擎和ATM交换机上用硬件来实现的交换引擎在效率上无法相抗衡。
当今的互联网应用需求日益增多,对带宽、对时延的要求也越来越高。如何提高转发效率,各个路由器生产厂家做了大量的改进工作,如Cisco在路由器上提供CEF(Cisco Express Forwarding)功能、修改路由表搜索算法等等。但这些修补并不能完全解决目前互联网所面临的问题。
IP和ATM曾经是两个互相对立的技术,各个IP设备制造商和ATM设备制造商都曾努力想吃掉对方,想IP一统天下,或者ATM一家独秀!但是最终是这两种技术的融合,那就是MPLS(Multi-Protocol Label Switching)技术的诞生!MPLS技术结合和IP技术信令简单和ATM交换引擎高效的优点!
2 MPLS技术的实现细节
2.1 标签结构
IP设备和ATM设备厂商实现MPLS技术是在各自原来的基础上做的,对于IP设备商,它修改了原来IP包直接封装在二层链路帧中的规范,而是在二层和三层包头之间插了一个标签(Label),而ATM设备制造商利用了原来ATM交换机上的VPI/VCI的概念,在使用Label来代替了VPI/CVI,当然ATM交换机上还必修改信令控制部分,引入了路由协议,ATM交换使用了路由协议来和其他设备交换三层的路由信息。
标签的结构入下:
20比特的LABEL字段用来表示标签值,由于标签是定长的,所以对于路由器来说,可以分析定长的标签来做数据包的转发,这是标签交换的最大优点,定长的标签就意味这可以用硬件来实现数据转发,这种硬件转发方式要比必须用软件实现的路由最长匹配转发方式效率要高得多!
3比特的EXP用来实现QOS
1比特S值用来表示标签栈是否到底了,对于×××,TE等应用将在二层和三层头之间插入两个以上的标签,形成标签栈。
8比特TTL值用来防止数据在网上形成环路。
这样完整的带有标签的二层帧就成了如下形式:
在ATM信元模式下,信元的结构如下形式:
2.2 LSR设备的体系结构
通过修改,能支持标签交换的路由器为LSR(Label Switch Router),而支持MPLS功能的ATM交换机我们一般称之为ATM-LSR。
LSR设备的体系结构如下:
LSR的体系结构分为两块:
1. 控制平面(Control Plane)
该模块的功能是用来和其他LSR交换三层路由信息,以此建立路由表;和交换标签对路由的绑定信息,以此建Label Information Table(LIB)标签信息表。同时再根据路由表和LIB生成Forwarding Information Table(FIB)表和Label Forwarding Information Table(LFIB)表。控制平面也就是我们一般所说的路由引擎模块!
2.数据平面(Data Plane)
数据平面的功能主要是根据控制平面生成的FIB表和LFIB表转发IP包和标签包。
对于控制平面中所使用的路由协议,可以使用以前的任何一种,如OSPF、RIP、BGP等等,这些协议的主要功能是和其他设备交换路由信息,生成路由表。这是实现标签交换的基础。在控制平面中导入了一种新的协议—LDP,该协议的功能是用来针对本地路由表中的每个路由条目生成一个本地的标签,由此生成LIB表,再把路由条目和本地标签的绑定通告给邻居LSR,同时把邻居LSR告知的路由条目和标签帮定接收下来放到LIB表里,最后在网络路由收敛的情况下,参照路由表和LIB表的信息生成FIB表和LFIB表。具体的标签分发模式如下叙述。
2.3 标签的分配和分发
上面叙述到了,MPLS技术是IP技术和ATM技术的融合。LSR和ATM-LSR上实现标签的生成和分发是有点不同的。
2.3.1 包模式(Packet Mode)下的标签的分配和分发(IP)
对于实现包模式MPLS网络中,是下游LSR独立生成路由条目和标签的绑定,并且是主动分发出去的。
如上图,所有LSR上启动了LDP协议。以LSR-B为例,它已经通过路由协议获得网络X的路由了,一旦启动LDP协议,LSR-B立即查找路由表,如果X网络的路由是由IGP路由协议学到的,则在LIB表中为通向X网络的路由生成一个本地标签25,由于LSR-B和LSR-A、LSR-C、LSR-E形成了LDP邻居关系,所以下游LSR-B会主动给所有的邻居发送这个X=25的路由条目和标签的绑定!LSR-A、LSR-E、LSR-C会把该路由条目和标签的绑定放置到本地的LIB表中,再结合本地的路由表,在FIB表中生成有关X网络的“网络地址->出标签”条目,在LFIB中生成有关X网络的“进标签->出标签”条目。所有的LSR上都如此操作。最终的结果使整个MPLS网络内部所有LSR上达到路由表、LIB表、FIB表、LFIB表的动态平衡。
如果LSR-A接收到要去X网段的数据,由于LSR-A处在MPLS网络的边缘,必须查找FIB表,对接收到的IP包,做标签插入操作。对于LSR-B,LSR-C则纯粹是分析标签包,对包头的标签做转换,在转发标签包而已。数据到了LSR-D,该边缘LSR会去掉标签包中的标签,再对恢复的IP包做转发!如下图:
2.3.2 信元模式(Cell Mode)下的标签分配和分发(ATM)
在信元模式下,下游ATM-LSR接收到了上游ATM-LSR标签绑定请求后,下游受控分配标签,被动向上游分发标签。如下图
最上游的LSR-A向ATM-LSR-B发起对网络X的标签求情,ATM-LSR-B再向ATM-LSR-C发请求,最后请求到达LSR-D,LSR-D生成本地对X网络的标签1/37,把该标签告诉ATM-LSR-C,C做同样操作,这样一步一步到达LSR-A。最终生成一条从A->B->C->D的LSP(Label Switch Path)。这样如果A收到要到X网络的数据,A就把IP数据包分割成带有标签的信元,通过ATM接口发送到B,接下来B和C就纯粹做ATM信元的转发,到了D后再把信元组合成IP数据包,发向网络X。
在此要强调的如果要组建以ATM交换机为核心的MPLS网络,那么在ATM网络的边缘必须设置路由器,原因在于ATM交换机只转发信元,无法处理用户数据IP包。当然上面也提到要在ATM交换机上实现MPLS功能,必须在ATM交换机的信令控制部分加入路由协议,而路由信息包往往是打在IP包中的,如RIP,OSPF,BGP等路由协议。ATM交换机为了确保这些以IP包形式传递的路由信息能够在ATM交换机间传递,使用了专门的带外连接通道或者带内的管理VC。
2.4 BGP协议在MPLS网络中的特殊应用
上面提到LSR根据路由表分配标签时,只对从IGP协议获得的路由条目分配标签。原因何在?这是有特殊意义的!看下图:
整个Transit AS中启动MPLS交换。保证ISP2和LSR-Border2之间的网段发布到Transit AS内部的IGP路由协议中,对ISP1和LSR-Border2之间的网段也做同样的要求。前面提到过LSR为路由条目分配标签时,只对从IGP学来的路由分配标签,而网络1.2.3.4是被发布到Transit AS内部的IGP路由协议中了,可以肯定在Border1处是可以获得Core1告诉它有关1.2.3.4网络的标签23。LSR-Border1,LSR-Border2之间形成IBGP邻居关系,通过BGP协议,LSR-Border2把从ISP2处学来的10.0.0.0/8这条路由告诉给LSR-Border1,这条路由的下一跳地址是1.2.3.4,这样一来让LSR-Border1得知要给网络10.0.0.0/8发送数据,先把数据发送到1.2.3.4这个网络来。1.2.3.4被绑定了标签23,所以在生成FIB表时,也给10.0.0.0/8这个网段绑定一个标签23。这样,如果有数据从ISP1穿越Transit AS到达ISP2,在Border1处就会给IP包 插上23这个标签,把生成的标签包转发到Core1,Core1就只要分析标签头做标签包的转发就可以了!由于Transit AS内部核心路由器不必要运行BGP协议,这样一来,MPLS网络的核心路由器就不会知道外部用户的路由,缩小了核心路由器的路由表,提高了搜索效率。大家也看到,由于打上了标签,IP包头是不会在核心路由器被分析的,即使IP包头含有10.0.0.1这样的私有IP地址,也会因为只分析标签的原因被正常转发,这就是服务提供商提供×××服务所追求的。当然在此必须重声,LSP在整个Transit AS不能被断开,如果断开,标签包就恢复成IP包,而核心路由器是不含用户路由的,最终导致数据包的丢失。
BGP在MPLS网络中的作用为我们提供了×××服务打开了方便之门,但也应该意识到×××服务两个最基本的要求是1.用户可以独立规划IP地址;2.安全性非常重要!看下图:
以上为两个×××实例,PE1(PE=Provider Edge device)上分别接了CE1 (CE=Customer Edge device)和CE3,但是CE1和CE3上带到IP地址相同的网段10.1.2.0/8,很明显如果不对PE1路由器做修改,PE1只能认为往10.1.2.0/8的数据要么从S0出,要么从S1出,这样的话,不是CE1就是CE3就更本收不到从PE1发来的前往10.1.2.0/8网段的数据!
如果不对BGP4协议做修改,那么PE2和PE3发送给的PE1的有关10.1.1.0/8网络的路由
3 基于MPLS的×××实现
3.1 ×××的历史
×××服务是很早就提出的概念,不过以前电信提供商提供×××是在传输网上提供的覆盖型的×××服务。电信运营商给用户出租线路,用户上层使用何种的路由协议、路由怎么走等等,这些电信运营商不管。这种租用线路来搭建×××的好处是安全,但是价格昂贵,线路资源浪费严重。
后来随着IP网络的全面铺开,电信服务提供商在竞争的压力下,不得不提供更加廉价的×××服务,也就是三层×××服务。通过提供给用户一个IP平台,用户通过IP Over IP的封装格式在公网上打隧道,同时也提供了加密等等的手段
提供安全保障。这类×××用户在目前的网络上数量还是相当巨大的!但是这类×××服务因大量的加密工作、传统路由器根据IP包头的目的地址转发效率不高等等的原因不是非常令人满意。
MPLS技术的出现和BGP协议的改进,让大家看到了另一种实现×××的曙光。
3.2 MPLS/×××体系结构
3.2.1 PE路由器的改造和VRF的导入
为了让PE路由器上能区分是哪个本地接口上送来的×××用户路由,在PE路由器上创建了大量的虚拟路由器,每个虚拟路由器都有各自的路由表和转发表,这些路由表和转发表统称为VRF(××× Routing and Forwarding instances)。一个VRF定义了连到PE路由器上的×××成员。VRF中包含了IP路由表,IP转发表(也成为CEF表),使用该CEF表的接口集和路由协议参数和路由导入导出规则等等。
在VRF中定义的和×××业务有关的两个重要参数是RD(Route Distinguisher)和RT(Route Target)。RD和RT长度都是64比特。
有了虚拟路由器就能隔离不同×××用户之间的路由,也能解决不同×××之间IP地址空间重叠的问题。
3.2.2 MP-BGP协议对×××用户路由的发布
正常的BGP4协议能只传递IPv4的路由,由于不同×××用户具有地址空间重叠的问题,必须修改BGP协议。BGP最大的优点是扩展性好,可以在原来的基础上再定义新的属性,通过对BGP修改,把BGP4扩展成MP-BGP。在MP-IBGP邻居间传递×××用户路由时打上RD标记,这样×××用户传来的IPv4路由转变为×××v4路由,这样保证×××用户的路由到了对端的PE上,能够使对端PE区分开地址空间重叠但不同的×××用户路由。例子如下:
在PE1、PE2、PE3上分别配置VRF参数,其中×××1用户的RD=6500:1,RT=100:1 ,×××2用户的RD=6500:2、RT=100:2。所有VRF可以同时 导入和导出所定义的RT。
以PE2为例,PE2从接口S0上获得由CE4传来的有关10.1.1.0/8的路由,PE2把该路由放置到和S0有关的VRF所管辖的IP路由表中,并且分配该路由的本地标签,注意该标签是本地唯一的。通过路由重新发布把VRF所管辖的IP路由表中的路由重新发布到BGP表中,此时通过参考VRF表的RD、RT参数,把正常的IPv4路由变成×××v4路由,如10.1.1.0/8变成6500:1:10.1.1.0/8,同时把导出(Export)RT值和该路由的本地标签值等等的属性全部加到该路由条目中去。通过MP-IBGP会话,PE2把这条×××v4路由发送的PE1处,PE1收到了两条有关10.1.1.0/8的路由,其中一条是由PE3发来的,由于RD的不同,导致该两条路由没有可比性。MP-BGP接受到该两条路由后的后继工作是:去掉×××4路由所带的RD值,使之恢复IPv4路由原貌,并且根据各VRF配置的允许导入(Import)的RT值,把IPv4倒到各个VRF管辖的路由表和CEF表中,也就是说带有RT=100:1的10.1.1.0/8的路由倒到VRF1所管的路由表和CEF表中,带有RT=100:2的10.1.1.0/8的路由倒到VRF2所管辖的路由表和CEF表中。再通过CE和PE之间的路由协议,PE把不同的VRF管辖的路由表内容通告的各自的相联的CE中去。
目前PE和CE之间可支持的路由协议只有四种BGP、OSPF、RIP2或者静态路由。
3.2.3MPLS/×××中标签分组的转发
同过MP-BGP协议各个×××用户路由器学习到正确的路由,现在看看如何转发用户数据的。
1.CE1接收到发往10.1.1.1的IP数据包,查询路由表,把该IP数据包发送到PE1。
2.PE1从S1口上收到IP数据包后,根据S1所在的VRF,查询对应的CEF表,数据包打上标签8,注意该标签就是通过MP-BGP协议传来的。PE1继续查询全局CEF表,获知要把数据发往10.1.1.1,必须先发送到PE2,而要发送到PE2,则必须打上由P1告知的标签2。所以该IP包被打上了两个标签。
3.P1接收到标签包后,分析顶层的标签,把顶层标签换成4,继续发送的P2。
4.P2和P1一样做同样的操作,由于次末中继弹出机制,P2去掉标签4,直接把只带有一个标签的标签包发送的PE2。
5.PE2收到标签包后,分析标签头,由于该标签8是它本地产生的,而且是本地唯一的,所以PE2很容易查出带有标签8的标签包应该去掉标签,恢复IP包原貌,从S1端口发出。
6.CE2获得IP数据包后,进行路由查找,把数据发送到10.1.1.0/8网段上。
4 MPLS/×××配置实例
要提供×××服务的前提是:服务提供商的网络必须启用标签交换功能,即把以前的数据网络升级为MPLS网络。然后具体配置PE,PE上的配置按六步走:
1.定义并且配置VRF
2.定义并且配置RD
3.定义RT,并且配置导入导出策略
4.配置MP-BGP协议
5.配置PE到CE的路由协议
6.配置连接CE的接口,将该接口和前面定义的VRF联系起来。
上图中CE1、CE2、CE3组成一个×××,其中PE3和CE3之间走RIP2协议,PE2和CE2之间走BGP协议。整个As 6500中走OSPF协议。
PE3的部分配置如下:
ip cef ----启用CEF转发功能
ip vrf Red ----定义一个 VRF ,名字为Red
description For Red User ***
rd 6500:1 ----定义RD值为6500:1
route-target export 6500:1 ----定义导出策略
route-target import 6500:1 ---定义导入策略
router rip ----配置PE3到CE3的路由协议RIP2
version 2
!
address-family ipv4 vrf Red
version 2
redistribute bgp 6500 metric 1---将BGP学到的路由从新发布的RIP2中,
network 192.168.1.0 使CE3能学到同一×××中的其他路由
no auto-summary
exit-address-family
router bgp 6500 ---配置BGP协议
no synchronization
no bgp default ipv4-unicast
bgp log-neighbor-changes
neighbor 192.168.168.2 remote-as 6500 ---和PE2建立邻居关系
neighbor 192.168.168.2 update-source Loopback0
no auto-summary
!
address-family ipv4 vrf Red ----为×××用户配置IPv4地址家族,使
redistribute rip metric 1 VRF Red 所管辖的路由表中的路由从新发布到BGP协议中去。
no auto-summary
no synchronization
exit-address-family
!
address-family ***v4 ----具体配置和PE2的关系,使PE3和PE2之间能交换×××v4路由
neighbor 192.168.168.2 activate
neighbor 192.168.168.2 send-community both
no auto-summary
exit-address-family
interface Ethernet0/1 -----配置连接CE3的接口
ip vrf forwarding Red -----使该接口和前面定义的VRF Red联系起来
ip address 192.168.1.17 255.255.255.252
interface Ethernet0/0 ---配置联系到7206上接口
ip address 192.168.1.10 255.255.255.252
half-duplex
tag-switching ip ---在该接口上启用标签交换
!
PE2上的部分配置如下:
ip cef ----启用CEF转发功能
ip vrf Red ----定义一个 VRF ,名字为Red
description For Red User ***
rd 6500:1 ----定义RD值为6500:1
route-target export 6500:1 ----定义导出策略
route-target import 6500:1 ---定义导入策略
!
同时上传附件router bgp 6500 ---?配制BGP协议
no synchronization
no bgp default ipv4-unicast
bgp log-neighbor-changes
neighbor 192.168.168.4 remote-as 6500
neighbor 192.168.168.4 update-source Loopback0
neighbor 192.168.168.4 next-hop-self ----这点在PE-CE之间路由协议为BGP时,一定要配置。
no auto-summary
!
address-family ipv4 vrf Red
neighbor 10.10.40.1 remote-as 6504 --配置和CE2之间的路由协议BGP
neighbor 10.10.40.1 activate
no auto-summary
no synchronization
exit-address-family
!
address-family ***v4
ne