实战网络故障

        这个星期蛮忙的,星期二和星期三要协助安全产品的厂商测试。星期三快下班的时候,公司的整个网络出现了问题,变得非常缓慢,内部的应用基本瘫痪。没办法,又得出演消防员这个角色了
        有问题,到机房!第一时间来到了机房,在监控机上看了一下,网络使用率打到60%-80%,怪不到卡死了。后悔啊 ,没把那个监控交换机和路由器的软件挂着,看不到之前的数据,唯有使用最原始的方法判断问题所在了。先简单介绍一下公司的网络拓扑,核心交换机下有七台智能交换机,智能交换机下连接非智能的交换机,实现了多主机的接入。初步判断是主机或者是非智能交换机的问题。要快速定位故障,用了插拔法。分别把每个智能交换机到核心交换机的端口断开,一分钟内就找出了出现故障的交换机。
       故障定位了,就到处理的阶段了。把问题的交换机连上,登陆上去,先把登陆外的其他端口全部down掉。然后,查看日志,或许是因为出现了故障的原因,交换机上的日志只有登陆后down掉端口的信息,其他的都没了。怎么办? 不急,我们再来查看一下每个端口的状态,看一下每个端口的错误报告和数据包的情况。48个端口一个个看,来了,来了,其中有几个端口广播包特别多,有一个更多到“疯狂”的地步,43亿!!!要是我有这么多人民币就好了!哈哈 !先把可能有问题的端口记下来,把其他没问题的端口开启,没问题,好的!可能有问题的端口一个一个开,43亿的那个最后开。前几个都没问题,43亿的那个一上来就有问题了。立马把它down掉,然后到现场查线。顺藤摸瓜,终于找到了问题所在。一个非智能交换机上有一条线的两头都插在交换机上面的,形成环路,造成大量广播,导致网络瘫痪。把那个线拔下来,端口再up起来。没问题了!!现场的情况是非智能交换机的端口有多的,而且是挂在墙脚附近,比较低,而且网线到位了,电脑没全部到位,有多的网线,就连到桌面上放在那里,估计是那里的人看到有一根网线的水晶头掉到地上,看到交换机上有口,顺手就插上去了,好心干了坏事。
        这次故障是解决了,但是也给了我提醒,监控软件要用好,挂在那里,有问题了可以准确定位。工作上要学习的事情还多呢。努力啊!
       

你可能感兴趣的:(职场,休闲,网络故障)