BGP在路由器上以下列两种方式运行,如图1所示:
l IBGP( Internal BGP)
l EBGP( External BGP)
当BGP运行于同一AS内部时,被称为IBGP;当BGP运行于不同AS之间时,称为EBGP。
l Speaker:发送BGP消息的路由器称为BGP发言者( Speaker),它接收或产生新的路由信息,并发布( Advertise)给其它BGP Speaker。当BGP Speaker收到来自其它AS的新路由时,如果该路由比当前已知路由更优、或者当前还没有该路由,它就把这条路由发布给所有其他BGP Speaker(发布该路由的BGP Speaker除外)。
l Peer:相互交换消息的BGP Speaker之间互称对等体( Peer)。
BGP的运行是通过消息驱动的,共有Open、 Update、 Notification、 Keepalive和Routerefresh5种消息类型。
l Open消息:是TCP连接建立后发送的第一个消息,用于建立BGP对等体之间的连接关系。对等体在接收到Open消息并协商成功后,将发送Keepalive消息确认并保持连接的有效性。确认后,对等体间可以进行Update、 Notification、 Keepalive和Route-refresh消息的交换。
l Update消息:用于在对等体之间交换路由信息。 Update消息可以发布多条属性相同的可达路由信息,也可以撤销多条不可达路由信息。
– 一条Update消息可以发布多条具有相同路由属性的可达路由,这些路由可共享一组路由属性。所有包含在一个给定的Update消息里的路由属性适用于该Update消息中的NLRI( Network Layer Reachability Information)字段里的所有目的地(用IP前缀表示)。
– 一条Update消息可以撤销多条不可达路由。每一个路由通过目的地(用IP前缀表示),清楚的定义了BGP Speaker之间先前通告过的路由。
– 一条Update消息可以只用于撤销路由,这样就不需要包括路径属性或者NLRI。相反,也可以只用于通告可达路由,就不需要携带撤销路由信息了。
l Notification消息:当BGP检测到错误状态时,就向对等体发出Notification消息,之后BGP连接会立即中断。
l Keepalive消息: BGP会周期性的向对等体发出Keepalive消息,用来保持连接的有效性。
l Route-refresh消息: Route-refresh消息用来请求对等体重新发送所有的可达路由信息。
在所有BGP设备使能Route-refresh能力的情况下,如果BGP的入口路由策略发生了变化,本地BGP设备会向对等体发布Route-refresh消息,收到此消息的对等体会将其路由信息重新发给本地BGP设备。这样,可以在不中断BGP连接的情况下,对BGP路由表进行动态刷新,并应用新的路由策略。
BGP有限状态机共有六种状态,分别是Idle、 Connect、 Active、 OpenSent、OpenConfirm和Established。
在BGP对等体建立的过程中,通常可见的三个状态是: Idle、 Active、 Established。l Idle状态下, BGP拒绝任何进入的连接请求,是BGP初始状态。
l Connect状态下, BGP等待TCP连接的建立完成后再决定后续操作。
l Active状态下, BGP将尝试进行TCP连接的建立,是BGP的中间状态。
l OpenSent状态下, BGP等待对等体的Open消息。
l OpenConfirm状态下, BGP等待一个Notification报文或Keepalive报文。
l Established状态下, BGP对等体间可以交换Update报文、 Route-refresh报文、Keepalive报文和Notification报文。
BGP对等体双方的状态必须都为Established, BGP邻居关系才能成立,双方通过Update报文交换路由信息。
l 因为BGP的传输层协议是TCP协议,所以在BGP对等体建立之前,对等体之间首先进行TCP连接。 BGP邻居间会通过Open消息协商相关参数,建立起BGP对等体关系。
l 建立连接后, BGP邻居之间交换整个BGP路由表。 BGP协议不会定期更新路由表,但当BGP路由发生变化时,会通过Update消息增量地更新路由表。
l BGP会发送Keepalive消息来维持邻居间的BGP连接。
l 当BGP检测到网络中的错误状态时(例如收到错误报文时), BGP会发送Notification消息进行报错, BGP连接会随即中断。
BGP路由属性是一套参数,它对特定的路由进一步的描述,使得BGP能够对路由进行过滤和选择。事实上,所有的BGP路由属性都可以分为以下4类:
l 公认必须遵循的( Well-known mandatory):所有BGP设备都可以识别,且必须存在于Update消息中。如果缺少这种属性,路由信息就会出错。
l 公认任意( Well-known discretionary):所有BGP设备都可以识别,但不要求必须存在于Update消息中,可以根据具体情况来选择。
l 可选过渡( Optional transitive):在AS之间具有可传递性的属性。 BGP设备可以不支持此属性,但它仍然会接收这类属性,并通告给其他对等体。
l 可选非过渡( Optional non-transitive):如果BGP设备不支持此属性,则相应的这类属性会被忽略,且不会通告给其他对等体。
下面介绍几种常用的BGP路由属性:
l Origin属性
Origin属性用来定义路径信息的来源,标记一条路由是怎么成为BGP路由的。它有以下3种类型:
– IGP:具有最高的优先级。通过路由始发AS的IGP得到的路由信息,比如通过network命令注入到BGP路由表的路由,其Origin属性为IGP。
– EGP:优先级次之。通过EGP得到的路由信息,其Origin属性为EGP。
– Incomplete:优先级最低。通过其他方式学习到的路由信息。比如BGP通过import-route命令引入的路由,其Origin属性为Incomplete。
l AS_Path属性
AS_Path属性按矢量顺序记录了某条路由从本地到目的地址所要经过的所有AS编号。当BGP Speaker本地通告一条路由时:
– 当BGP Speaker将这条路由通告到其他AS时,便会将本地AS号添加在AS_Path列表中,并通过Update消息通告给邻居路由器。
– 当BGP Speaker将这条路由通告到本地AS时,便会在Update消息中创建一个空的AS_Path列表。
当BGP Speaker传播从其他BGP Speaker的Update消息中学习到的路由时:
– 当BGP Speaker将这条路由通告到其他AS时,便会把本地AS编号添加在AS_Path列表的最前面(最左面)。收到此路由的BGP设备根据AS_Path属性就可以知道去目的地址所要经过的AS。离本地AS最近的相邻AS号排在前面,其他AS号按顺序依次排列。
– 当BGP Speaker将这条路由通告到本地AS时,不会改变这条路由相关的AS_Path属性。
AS_Path属性有四种形式,分别是: AS_Sequence、 AS_Set、 AS_Confed_Sequence和AS_Confed_Set。
– AS_Sequence:它是到目的地的路径上所经过的AS号的有序集合,按照顺序记录了路由经过的所有AS。
– AS_Set:它是到目的地的路径上所经过的AS号的无序集合。 AS_Set通常用在路由聚合的场景,由于路由聚合后,系统无法将聚合前的具体路由所经过的AS再排出一个有序集合的,所以只能使用AS_Set进行无序记录。 AS_Set内不管含有多少AS号,在BGP选路时都按照长度为1进行计算。
– AS_Confed_Sequence:是联盟内子AS的一个有序集合。
– AS_Confed_Set:是联盟内子AS的一个无序集合,主要用在联盟内路由聚合的场景。
AS_Confed_Sequence和AS_Confed_Set的作用是避免联盟内的AS间路由循环和进行联盟内的路由选路。
l Next_Hop属性
BGP的下一跳属性和IGP的有所不同,不一定就是邻居路由器的IP地址。通常情况下, Next_Hop属性遵循下面的规则:
– BGP Speaker在向EBGP对等体发布某条路由时,会把该路由信息的下一跳属性设置为本地与对端建立BGP邻居关系的接口地址。
– BGP Speaker将本地始发路由发布给IBGP对等体时,会把该路由信息的下一跳属性设置为本地与对端建立BGP邻居关系的接口地址。
– BGP Speaker在向IBGP对等体发布从EBGP对等体学来的路由时,并不改变该路由信息的下一跳属性。
l MED
MED( Multi-Exit-Discriminator)属性仅在相邻两个AS之间传递,收到此属性的AS一方不会再将其通告给任何其他第三方AS。
MED属性相当于IGP使用的度量值( Metrics),它用于判断流量进入AS时的最佳路由。当一个运行BGP的路由器通过不同的EBGP对等体得到目的地址相同但下一跳不同的多条路由时,在其它条件相同的情况下,将优先选择MED值较小者作为最佳路由。
l Local_Pref属性
Local_Pref属性仅在IBGP对等体之间有效,不通告给其他AS。它表明路由器的BGP优先级。
Local_Pref属性用于判断流量离开AS时的最佳路由。当BGP的路由器通过不同的IBGP对等体得到目的地址相同但下一跳不同的多条路由时,将优先选择Local_Pref属性值较高的路由。