一、 对网络管理人员的要求
目前互联网络技术、拓扑和应用的复杂性决定了网络管理人员必须:
1、 确保网络稳定运行;
 
2、 掌握故障排除方法;
 
3 熟悉各种协议可能故障点,迅速定位排除故障。
 
对协议要求有精深的理解 如静态和OSPF相互路由引入的问题  详细描述故障现象和相关信息
1、 谁出了问题?
 
2、 是什么问题?
 
3、 问题何时发生的?
 
4 何处发生的故障?
 
充分了解所管理和维护的网络
1 网络物理拓扑
 
2、 网络使用的各种技术,包括局域网技术、广域网技术、路由协议、网络安全技术、QoS等等
 
3、 网络运行业务
 
4、 流量分布
 
5、 最近网络变化情况
 
6、 网络测试基线
 
7 及时进行故障排除的文档记录和经验总结
 
网络故障一般分类
1 连通性问题
 
2、 硬件、媒介、电源故障;
 
3、 配置错误;
 
4、 设备兼容性问题
 
5、 性能问题
 
6、 网络拥塞;
 
7、 到目的地不是最佳路由;
 
8、 供电不足;
 
9、 路由环路;
 
10 网络不稳定;
 
四、 网络故障排除基本步骤
网络设备故障诊断主要有以下命令:
ping tracert display debug
 
Ping
ping主要用于检查网络连接及主机是否可达。
命令格式:
ping [ -a X.X.X.X ] [ -c count ] [ -d ] [ -h ttl_value ] [ -i {interface-type interface-number | interface-name } ][ ip ] [ -n ] [ -p pattern ] [ -q ] [ -r ][ -s packetsize ] [ -t timeout ] [ -v ] [ ***-instance ***-instance-name ] host  
命令执行结果输出包括:
对每一ping报文的响应情况,如果超时到仍没有收到响应报文,则输出“Request time out”,否则显示响应报文中数据字节数、报文序号、TTL和响应时间等。
最后的统计信息,包括发送报文数、接收报文数、未响应报文百分比和响应时间的最小、最大和平均值。 
v rp:-c 报文个数 –超时时间 –报文大小 Win-N 报文个数 –T  持续ping  -l 报文大小
 
Tracert
tracert用于测试数据包从发送主机到目的地所经过的网关,它主要用于检查网络连接是否可达,以及分析网络什么地方发生了故障。
命令格式:tracert [-a X.X.X.X ] [ -f first_TTL ] [ -m max_TTL ] [ -p port ] [ -q nqueries ] [ -w timeout ] host  
VRP平台:     -a 指定发送UDP源地址  -f  TTL初始值  -m 指定最大TTL值  -p 目的主机端口号,    缺省33434  -q 每次发送的报文个数 –指明UDP超时时间,缺省5000
WIN平台:-d 不解析主机名   –指定最大TTL值  -w 超时时间
 
案例:使用tracert命令定位配置不当的网络点 
故障排除常用display命令
display version
display current-config 
display saved-config 
display interface 
 
display interface:显示接口信息
 
display current-config& display saved-config 
显示当前设备配置文件信息
把启动配置文件存放到路由器以外的其他设备上 
使维护人员能够迅速配置一个替代的路由器; 
将该配置文件通过E-mail形式发给技术支持人员以帮助定位配置问题。 
 
debug
获得路由器中处理的报文和帧的细节信息 
debug命令使用注意事项
不使用debug命令监控正常的网络运行 在网络使用的低峰期使用
不要轻易使用该debug命令 不要轻易使用类似debug all之类的命令 
定位操作完成后,应立即以“undo debug xx”命令终止debug命令的执行。
displaydebug命令配合使用 
  
五、 故障排除常用方法
1 分层故障排除法
 
2、 分块故障排除法
 
3、 分段故障排除法
 
4 替换法
 
分层故障排除法
按照 OSI/ISO参考模型,由下到上,逐层进行故障排除。
 
分块故障排除法
配置文件分为以下部分:
管理部分(路由器名称、口令、服务、日志等)
端口部分(地址、封装、cost、认证等)
路由协议部分(静态路由、RIPOSPFBGP、路由引入等)
策略部分(路由策略、策略路由、安全配置等)
接入部分(主控制台、Telnet登录或哑终端、拨号等)
其他应用部分(语言配置、×××配置、Qos配置等)
 
分段故障排除法
开箱即无法使用 检查接口卡或主板上的器件,查看是否器件脱落或被压变形,以及BOOTROM或内存条的插座有无插针无法弹起。检查PCI侧的插针、物理接口(包括电缆)的插针是否有弯针。当没有查到上述硬件故障后,可考虑更换或升级BOOTROM、内存条或主机版本。
 
安装后无法正常使用 线路连接问题,如线路阻抗不匹配、线序连接错误、中间传输设备故障。与其它设备有兼容性问题。接口配置问题。电源或接地不符合要求。在安装过程也要考虑模块接口电缆所支持的最大传输长度、最大速率等因素。 
 
使用过程中发生故障 电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成器件损坏。传输线受到干扰。中间传输设备故障。环境的温湿度、洁净度、静电等指标超出使用范围。