BGP路由负载均衡故障案例

  • 网络架构介绍


    1、拓扑图:

        考虑到公司网络隐私性和更清楚的描述故障现象,对实际网络结构进行了简化。

        

wKiom1ZgBcvDBGZ5AACkUli-rbc121.png

    

    2、网络规划及数据配置简介:

        ◆ASR9K分别以互联地址与两台N7K建立IBGP邻居关系;

        ◆ASR9K下挂思科752架构,752下为CDN服务器;

        ◆服务器网关均在N7K,两台7K之间起HSRP V2,相同优先级;

        ◆规划CDN服务器流量负载均衡(BOND0)至752,N7K再通过BGP将流量均衡送至ASR9K,最               后流量从ASR9出公网。



数据配置:


ASR9K:
router bgp 65555
 nsr
 bgp router-id 1.1.1.1
 bgp graceful-restart
 bgp log neighbor changes detail
 address-family ipv4 unicast
  redistribute connected route-policy AAAAA
  redistribute static route-policy BBBBB
  redistribute ospf CCCCC
 !
  neighbor 30.207.7.42
   remote-as 65555
   update-source TenGigE0/1/0/7.3
   address-family ipv4 unicast
    route-policy Defaultroutes out
    soft-reconfiguration inbound always
   !
  !
  neighbor 30.207.7.46
   remote-as 65555
   update-source TenGigE0/2/0/7.3
   address-family ipv4 unicast
    route-policy Defaultroutes out
    soft-reconfiguration inbound always
   !
   
N7K-1:
  router bgp 65555
  router-id 2.2.2.2
  address-family ipv4 unicast
    redistribute direct route-map AA
    redistribute static route-map BB
  neighbor 30.207.7.41 remote-as 65555
    update-source Ethernet1/28.3
    address-family ipv4 unicast
      route-map ServersIP out
      next-hop-self
      soft-reconfiguration inbound
      
N7K-2: 
  router bgp 65555
  router-id 3.3.3.3
  address-family ipv4 unicast
    redistribute direct route-map yewudirect
    redistribute static route-map yewustatic
    maximum-paths ibgp 10
  neighbor 30.207.7.45 remote-as 65555
    update-source Ethernet1/28.3
    address-family ipv4 unicast
      next-hop-self
      soft-reconfiguration inbound

    

  • 故障现象:


    两台N7K往ASR9K吐流均衡,但ASR9K往两台N7K流量不均衡,回来的这些流量全都跑在图中线路1,导致线路1流量负载至90%。上cacti监控流量图:


wKioL1ZhLQ_DosLdAACvu8XR6Ok304.png    









线路1万兆链路入流量跑了9G多,触发了流量阀值产生告警。线路2没有入流量。

wKioL1ZhLQ7xl_X2AACmY0ayQ3g284.png













  • 故障处理:

    

    1、N7K的出流量均衡正常但入流量只跑了一边,说明ASR9K只从N7K-1收到回程路由,或者N7K-1收到的回程路由比从N7K-2的要高。在ASR9K上show服务器路由,果然只有一个N7K-1的下一跳。和预想的双下一跳负载均衡不符。


    2、查看N7K-2与ASR9K的BGP邻居状态正常,也能从N7K-2收到服务器地址段路由,且路由数量与N7K-1相同。


    3、查找资料翻出BGP选路原则,其中第九条显示balance traffic,如果未配置maximum-path,BGP会只选择一条最优路由,最终ASR9K选择N7K-1吐流是根据选路原则最后一条“选择邻居地址较小的路由”,N7K-1邻居地址是30.207.7.41,N7K-2是30.207.7.45,所以选择了N7K-1。


    4、在BGP配置中加入一条maximum-path ibgp 5 ,最多允许5条等价路由负载,故障解决。

wKiom1ZhMryBaVMiAACx-M7v5jI768.png

wKiom1ZhMr2SnYSxAACXKlIkjmc822.png


    N7K-1下降的流量与N7K-2上涨流量大小不符是由于还做了其他调整。


  • 知识总结:

    BGP默认情况只选择一条最优路由放入路由表,可用过maximum-path  ibgp/ebgp  [2-32] 命令实   现BGP路由负载均衡。

    

本文出自 “天道酬勤” 博客,转载请与作者联系!

你可能感兴趣的:(Cisco,路由,BGP,思科,752,maximum-path)