在遇见下面这样情况的时候一般大家会采取何种方法去判断?
1、交换机某一端口下的用户出现丢包
2、交换机下所有用户都在丢包
3、用户反映网速缓慢
可能有人会这样说,检查一下网线、重做一下水晶头、检查一下用户计算机网卡、把交换机重启一下。没错,这几种做法都能解决上述问题,而且很有可能就是导致故障的原因。但各位觉得这样做麻烦吗?特别是在维护一个大型网络的时候,可能你要坐上半小时的车前往故障发生地。还有就是你这样做了,可能不能解决根本问题所在,只能算是“蒙”吧。
下面我们来看一下交换机端口信息能带给我们怎样的帮助?
1、判断当前端口的工作状态
2、了解当前端口流量信息
3、帮助分析判断当前状况产生的原因
下面我们来看一个无数据通信的端口所显示的信息内容
【举例】:
<Quidway> display interface ethernet0/1
Ethernet0/1 current state : UP
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 00e0-fc00-0010
The Maximum Transmit Unit is 1500
Media type is twisted pair, loopback not set
Port hardware type is 100_BASE_TX
100Mbps-speed mode, full-duplex mode
Link speed type is autonegotiation, link duplex type is autonegotiation
Flow-control is not enabled
The Maximum Frame Length is 1518
Broadcast MAX-ratio: 100%
PVID: 1
Mdi type: auto
Port link-type: access
Tagged VLAN ID : none
Untagged VLAN ID : 1
Last 300 seconds input: 0 packets/sec 0 bytes/sec
Last 300 seconds output: 0 packets/sec 0 bytes/sec
Input(total): 0 packets, 0 bytes
0 broadcasts, 0 multicasts
Input(normal): - packets, - bytes
- broadcasts, - multicasts
Input: 0 input errors, - runts, 0 giants, - throttles, 0 CRC
0 frame, - overruns, 0 aborts, 0 ignored, - parity errors
Output(total): 0 packets, 0 bytes
0 broadcasts, 0 multicasts, 0 pauses
Output(normal): - packets, - bytes
- broadcasts, - multicasts, - pauses
Output: 0 output errors, - underruns, - buffer failures
- aborts, 0 deferred, 0 collisions, 0 late collisions
- lost carrier, - no carrier
上面我们已经看到用 display interface ethernet0/1命令显示的以太网端口1的信息。我将以这些信息来例举两个故障实例的判断和分析。
1、有用户反映通信中断,另一用户反映通信时断时续。这种情况我们要看这个信息:
Ethernet0/1 current state :up
如该条信息显示为(冒号后面):down或administrator down,争对down的情况一般是物理条件下的,比如网线松脱、对端设备端口故障、对端设备故障等。如果该端口出现频烦的down提示哪可能就是你的网线水晶头接触不良引起的,这种状态就会引起用户时断时续。而administrator down只有人为操作即在端口上使用了关闭端口命令shutdown才会出现,这种情况可能是因为测试目的或其他目的由管理员施行的行为。而这两种状态都会直接导致通信中断。
Media type is twisted pair, loopback not set
这条信息显示的是端口的环回测试,在端口处于环回状态下该端口是不能通信的,默认设置是未开启的。如果如果开启了loopback就会出现通信中断。
2、简单描述吧,字打多啦,累!“丢包 中断 网速超级缓慢”Look!
Last 300 seconds input: 0 packets/sec 0 bytes/sec
Last 300 seconds output: 0 packets/sec 0 bytes/sec
Input: 0 input errors, - runts, 0 giants, - throttles, 0 CRC
0 frame, - overruns, 0 aborts, 0 ignored, - parity errors
Output: 0 output errors, - underruns, - buffer failures
- aborts, 0 deferred, 0 collisions, 0 late collisions
- lost carrier, - no carrier
Input(total): 0 packets, 0 bytes
0 broadcasts, 0 multicasts
Output(total): 0 packets, 0 bytes
0 broadcasts, 0 multicasts, 0 pauses
这几条信息显示了端口最近300秒内输入/输出的速率和报文数,以及端口输入/输出报文和错误信息的统计。哈!我最喜欢这几条信息了,他们让我简单的完成了要用复杂工具才能完成的判断,至少是初步判断。假设下面一种状况:
Last 300 seconds input: 138 packets/sec 86147 bytes/sec
Last 300 seconds output: 137 packets/sec 65465 bytes/sec
这说明了流经该端口的流量相当正常,不是我说的,数据证明一切!来看理由:一般来说一个端口上所流经的数据包的收、发数量应该是平衡的或接近平衡的,这样的网络才是健康的。就如我这显示的一样最近300秒内接收和发送的数据包分别是138 packets/sec和137 packets/sec接收和发送的大小是86147 bytes/sec和65465 bytes/sec基本上平衡。
如果出现了这样的状况:
Last 300 seconds input: 13800 packets/sec 26147 bytes/sec
Last 300 seconds output: 137 packets/sec 35465 bytes/sec
这样的数据说明该端口上接收了大量的数据包,而包的大小却非常的小“即量大个小”,这种情况明眼人应该知道该端口可能正面临一次攻击,什么攻击呢?也许是DOS吧也或许是某种病毒吧,具体是什么只有分析报文啦!但到这已经确定故障点啦。还有要注意如果这个端口是这台交换机的上行端口就会影响所有该交换机上的用户通信。另外我这只是举啦一个“量大个小”的例,像“量小个大”,收、发极不平衡特别是某一方趋近于零要引起特别注意,总之这样的情况都是异常的,这里就不详细讲啦,以后有机会再在报文分析里介绍。
举这个例是因为像这样的情况往往会增加交换机处理量,也就是加大负载,从而影响该交换机性能,最后导至的结果就是该台设备瘫痪或丢包,甚至影响上一层设备。
另外提一下“最近时间Last 300”是可以更改的,一般在处理障碍时为获得实时的更准确的信息可将其默认的300秒改得小一点,这样有助于分析判断。
下面这张表是华为设备手册上的说明,可供参考。