2019-06-22 一次失败的割接记录

今天计划把一条链路从华为NE05E割接到一台思科NCS-55A1。这条链路是410GE LACP聚合,在NE05E上配Trunk,在NCS-55A1上通过40G QSFP转410GE,QSFP和Breakout线缆之间通过MTP头互联,Breakout线缆是LC头,直接上ODF架。
本以为过程很简单,数据都是预先配好的,只要插拔电缆就行。考虑到另外还有一条备份链路,应该不会中断业务。没想到割接刚开始,客服电话就打过来,断网啦!
考虑到业务,给自己留了5分钟时间窗来找问题。只来得及找到貌似某台路由器有缺省路由环路,就不得不先把链路倒回。
查找缺省路由环路,看traceroute的路径就知道那台路由器了,上去检查一下,发现其中一台NE05E上的ISIS里多配了

 default-route-advertise match default

赶紧去掉。好了,在备份链路增加BGP local-preference,把流量调整过去,现在可以把要割接的链路连会NCS了吧?
没想到更离谱的事情发生了,端口竟然再也UP不起来了,双down。看起来是物理层问题。
尝试操作如下:
1、物理更换:换路由器端口,更换QSFP光模块,更换breakout线缆。结果:无效。
2、会是对端使用了mac地址过滤吗?应该不会,即使不允许新mac地址,也应该物理端口up,协议down。再次跟对端确认,没有做mac地址过滤。
看到日志有errdisable的记录,那试下物理端口先down掉,再up一下,嗯?还是无效。接着查。
3、查看光功率,对端说没有收到光?应该不会呀,两个站点距离很近,光模块是10km单模,1310nm,理应能收到光。看了下QSFP上的标签,恩,没错写着1310nm, 10KM。 再看下端口,得,发现问题了。端口显示光模块是850nm的,这是怎么回事呢?850nm岂非变成多模了,状态还是off的。
这让我想到了思科对光模块的兼容性支持,我用的光模块原先是国内采购和华为路由器兼容的,但是现在要用在思科设备上……
问题来了,为啥第一次连接的时候是认的呢?BGP都建立起来了。现在只能是兼容性问题了。
解决方案?
1、首先尝试使用传说中的service unsupported-transceiver 命令。
先输入

(config)#no errdisable recovery cause all

靠,没有all的选项,先把dicovery-time的这个写上吧。
再输入

(config)#service unsupported-transceiver

没有报错,但tab键也确实不出来这个选项。
重启设备之后,看到端口还显示850nm,线路没割接,不知道最终效果,只能等再次割接进行测试了。
2、更换思科光模块。 恩,订购的原厂光模块要过几天到,拿到了再测试吧。总之网络中断了一次之后,当天就不能冒再次中断的风险继续测试了。

你可能感兴趣的:(2019-06-22 一次失败的割接记录)