93交换机替换问题追溯

 
过程背景:
某客服中心,组网情况核心交换机为2台S6503,下挂平台服务器、ORACE数据库等大量核心服务器。S6503下挂N个S5352交换机做接入,连接大量坐席台。工程改造需进行核心层网络设备替换,要将现网的核心交换机S6503替换为S9306.
 
过程回溯:
1,当晚0:00按照既定方案进行网络改造操作。当将部分备机连接到S9306B后并将S9306B替换S6503B后,发现部分连接S9306B的服务器无故死机,重新启动后问题依旧。之后在S9306B上将连接该服务器的端口速率强制100M后进行观察,观察一小时左右服务器正常。
 
2,然后在S9306上将所有连接服务器的端口速率全部设置为100M,按照方案继续进行后续操作。在5点左右操作基本完成,并进行业务测试,且业务测试正常。
 
3, 在凌晨08:30业务量大时,有个别坐席反映接续较慢并出现断话现象。初步定位发现,坐席侧ping大包到平台服务器有丢包现象。在检查S9306与坐席侧互联交换机S5352配置后未发现问题。
 
4,之后检查S5352下挂的其他坐席侧交换机后发现S5352下挂所有低端交换机上行接口全部为本双工。现场修改为全双工后,问题依旧。之后了解到该S5353版本没有全双工半双工区别,问题初步定位为93与服务器之间。
5,检查S9306各端口发现部分端口有大量错包(使用命令dis int brief),进行网线替换后问题依旧。此时业务量较大,网络不稳定,出现平台切换问题。经现场数通专家及研发人员进一步定位,认为是服务器与S9306速率匹配问题,此时对所有服务器网卡修改为强制100M全双工。之后进行观察发现S9306与服务器连接的各端口错包问题解决。
6,但此时依然存在两台S9306之间VRRP切换问题。查看日志发现,S9306之间启用的VRRP太多(使用命令dis logbuffer),且绑定的端口在一块单板上,使得该单板CPU溢出,大量报文丢失造成VRRP不停切换。将VRRP转发通道数由64K修改为128K后,为题解决,网络趋于稳定。
 
问题总结:
现在华为主推S9306,好多局点都要进行设备替换。目前S9306的版本上线碰到最多的问题就是模式不匹配问题,包括其他网络设备、服务器网卡、小型机网卡之间匹配问题。建议,93上线后,可以在93上直接ping与93直连的设备IP(要ping大包,5000左右,命令:ping -s 5000 IP)观察有没有丢包。并使用display interface brief 命令观察交换机各端口有没有错包。有的话可以检查该端口下服务器网卡模式设置情况,多修改几次,观察哪种模式下正常就采用哪种模式。要相信骨感的现实,不能在凭主观经验来判断。
               
 

本文出自 “博之初体验” 博客,转载请与作者联系!

你可能感兴趣的:(职场,端口,休闲,速率,93交换机)