交换机故障

从实际工作经验来看,交换机故障率发生最高的位置往往是端口或连接故障,特别是接入交换机的级联端口。同时,由于级联端口发生故障时,该交换机上的所有计算机与其他网络的通讯全部中断,但是,彼此之间的通讯却不受任何影响(前提是位于同一 VLAN ),因此,诊断和排除起来相对简单。

1. GBIC插槽损坏

  故障现象
某学院校园网采用 Cisco Catalyst 4006 作为核心交换机, Cisco Catalyst 3550 作为接入交换机。某天,位于某教学楼内的一个系办公室人员打来电话,告知其办公室内所有计算机均无法连接到校园网络。
  故障分析
登录到核心交换机 Cisco Catalyst 4006 ,使用“ show interface vlan vlan-id ”命令,查看了该系所处的 VLAN 工作状态发现该 VLAN 工作状态正常,处于“ up ”状态(如图 1 所示)。
1 VLAN 处于 up 状态
然后,使用“ show interface interface-id ”命令,查看了连接该教学楼交换机的端口,发现该模块虽然处于“ up ”状态,但是,协议却处于“ down ”状态(如图 2 所示),这表明 GBIC 模块工作正常,但与对端交换机端口的连接失败,未能实现彼此之间的通讯。
2 协议处于“down ”状态
试着使用“ no shutdown ”命令启用该端口未果,怀疑是 GBIC 模块或插槽损坏。于是,到核心交换机处查看端口的 LED 指示灯,发现该插槽 LED 指示灯熄灭。表明可能是链路故障,或者 GBIC 模块或插槽故障。先更换了本端的 GBIC 模块,又更换了一个空闲的 GBIC 插槽,并将其指定为 Trunk ,故障均没有解决。
  故障解决
携带 GBIC 模块到故障交换机处。先登录到故障交换机( Cisco Catalyst 3500 ),使用“ no shutdown ”命令启用该故障 GBIC 端口( Gi0/1 ),端口协议始终处于“ down ”状态无法被激活。更换 GBIC 模块之后,该端口 LED 指示灯仍然不亮,无法被激活。最后,将该 GBIC 模块拔出,插入另外一个 GBIC 插槽, LED 指示灯立即被点亮。替换为原来的 GBIC 模块, LED 指示灯仍旧为绿色,遂判断该 GBIC 插槽损坏。最后,登录到该交换机,将 Gi0/2 端口设置为 Trunk ,网络通讯恢复。
  故障点评
从实际使用经验来看, Cisco 正品 GBIC 模块正常使用期限为 4 年左右。从第 3 年开始陆续出问题(正好是传统保修期刚过的时候),到 4 年后发生故障的概率达到 20% 左右。同时,除 GBIC 模块发生故障外, GBIC 插槽的故障也在第 3 年左右开始出现。

2. GBIC模块损坏

  故障现象
局域网采用简约的二层拓朴结构,核心交换机采用 Cisco Catalyst 4006 ,接入交换机采用 Cisco Catalyst 3550 。自投入使用近 3 年来,运行一直正常。今年夏天某日下午上班后,行政楼 3 楼的计算机用户纷纷打电话到网络中心,表示自己的计算机无法连接到网络服务器,并且无法实现 Internet 连接。
  故障分析
试着 Telnet 远程登录该交换机失败。登录至核心交换机,查看连接至故障交换机的端口,发现端口处于“ up ”状态。携带笔记本电脑到故障交换机处,通过 Console 端口以超级终端方式登录,查看连接至核心交换机的 GBIC 端口,发现虽然端口处于“ up ”状态,但是,输入和输出的量却没有任何变化,如图 3 所示。
3 端口处于“up ”状态
GBIC 模块从交换机上拔下,放在风扇下吹了一会儿,再插回 GBIC 插槽,网络恢复正常。但是, 5 分钟左右网络连接再次中断。
  故障解决
至此,基本可以判断是 GBIC 模块坏掉了。更换一块新的同型号( 1000Base-LX  GBIC ,网络恢复正常。
  故障点评
由于夏天的室外温度高、湿度大,如果室内再没有安装空调,将导致机柜内的温度达到摄氏 500 以上,而 Cisco Catalyst 系列交换机要求工作在恒温、恒湿的工作环境中,交换机周围的温度不得超过 45 ° C ,湿度不得超过 85 %。交换机长期工作在高温高湿环境中时,非常容易产生故障,特别是 GBIC SFP 光纤模块,更容易因此而损坏。
其实,许多做领导的都算不清帐。 1 1000Base-LX GBIC/SFP 模块的价格相当于 2 台空调的价格,而 GBIC/SFP 模块却最容易因为室温过高而损坏。因此,作为一位负责任的网管,一定要跟主管领导讲清楚保持室内温度和湿度的重要性。

3. SFP模块质量太差

  故障现象
体育系使用 Cisco Catalyst 2960 作为接入交换机。前一段时间 SFP 模块坏掉了,更换以后,发现网络传输速率大幅下降,大数据量传输时,所使用的时间较以往更长一些。而且在 Ping 默认网关时,竟然都有丢包现象。
  故障分析
登录至核心交换机 Cisco Catalyst 4506 ,查看连接体育系交换机的端口 GigabitEthernet 3/5 ,显示有大量的错误包输入(如图 4 所示)。
4 大量错误包
简单的数据统计如下:
248770 packets input, 22095364 bytes, 0 no buffer
Received 6719 broadcasts, 0 runts, 0 giants, 0 throttles
1327086303 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored
0 input packets with dribble condition detected
683091 packets output, 252826070 bytes, 0 underruns
可见,错误包数量竟然是正常输入和输入包总量的 1420 倍。而后,又使用 Sniffer Pro 分析了该网络的流量,没有发现异常。而故障前后的硬件和配置的区别,仅在于更换了 SFP 模块。显然, SFP 模块导致故障的可能性非常大。
  故障解决
更换 Cisco 原厂的 1000Base-LX SFP 模块后,网络通讯恢复正常。
  故障点评
尽管 Cisco 原厂的 SFP/GBIC 模块很贵,而一些水货或假货的价格很便宜,但是,为了保证网络通讯质量,只能购买真品的 SFP/GBIC 模块。
判断 1000Base-LX GBIC/SFP 模块是否为 Cisco 原厂产品时,有一个非常简单但又非常实用的方法,把真货和假货放在手里分别掂量一下,真货有一种质量感,即比较重,而假货大都非常轻。另外, GBIC/SFP 模块上不干胶标签的印刷水平,也能从另一个侧面反映模块的真假。

4. 系统提示SFP端口被禁用

  故障现象
某天早晨上班后,打开 CNA Cisoc 网络助手)时发现有新的提示信息(如图 5 所示),表明文科楼( wenke_lou )的“ Gi0/1 此端口已经被禁用,因为发现链接在 Up Down 状态之间迅速波动。原因可能是交换机端口上的实际连接器硬件或驱动器或连接设备发生故障。建议,更换物理链接器、或升级交换机端口的驱动程序,或尝试更换线缆,然后再次启用端口”。
5 Gi0/1 端口已经被禁用
  故障分析
从提示信息上看,导致故障的可能性有三种,即:
Ø         连接配线架与 SFP 模块的跳线发生故障
Ø         SFP 模块发生故障
Ø         SFP 插槽发生故障。
由于光纤跳线发生故障的可能性不大,因此,可以先从 SFP 模块和 SFP 插槽开始判断。
  故障解决
先试着更换 SFP 模块,故障依旧。然后,再更换 SFP 插槽,故障解决。
  故障点评
Cisco Network Assistant 不仅可以用于监视交换机及其端口的工作状态,还可作为网络故障诊断和排除的辅助工具。
与专业的 CiscoWorks 相比, Cisco Network Assistant 安装简单,对计算机的要求也非常低,而且不必单独安装在一台专用计算机上。同时, CNA 的运行速度非常快,与 CiscoWorks 简直是天壤之别。因此,特别适合在中小型网络中管理 Cisco Catalyst 29xx 动性 /35xx /37xx /500 Express 系列交换机。
 

本文出自 “刘晓辉” 博客,谢绝转载!

你可能感兴趣的:(故障,休闲,GBIC插槽,GBIC模块,SFP模块)