第一章 故障处理方法
一、网络的复杂性一般网络包括路由、拨号、交换、视频、WAN(ISDN、帧中继、ATM、…)、LAN、VLAN、… 二、故障处理模型
1、 界定问题(Define the Problem) 详细而精确地描述故障的症状和潜在的原因
2、 收集详细信息(Gather Facts)R>信息来源:关键用户、网络管理系统、路由器/交换机
1) 识别症状 :
2) 重现故障:校验故障依然存在
3) 调查故障频率:
4) 确定故障的范围:有三种方法建立故障范围 由外到内故障处理(Outside-In Troubleshooting):通常适用于有多个主机不能连接到一台服务器或服务器集 由内到外故障处理(Inside-Out Troubleshooting): 半分故障处理(Divide-by-Half Troubleshooting)
3、 考虑可能情形(Consider Possibilities)考虑引起故障的可能原因
4、 建立一份行动计划(Create the Action Plan)
5、 部署行动计划(Implement the Action Plan) 用于纠正网络故障原因。从最象故障源处,想出处理方法每完成一个步骤,检查故障是否解决
6、观察行动计划执行结果(Observe Results)
7、如有行动计划不能解决问题,重复上述过程(Iterate as Needed)
三、记录所做修改 在通过行动计划解决问题后,建议把记录作为故障处理的一部分,记录所有的配置修改。
第二章 网络文档一、网络基线 解决网络问题的最简单途径是把当前配置和以前的配置相比较。 基线文档由不同的网络和系统文档组成,它包括: 网络配置表 网络拓扑图 ES网络配置表 ES网络拓扑图 创建网络的注意事项: 1) 确定文档覆盖的范围;
2) 保持一致:收集网络中所有设备的相同信息;
3) 明确目标:了解文档的用途;
4) 文档易于使用和访问;
5) 及时维护更新文档。
二、网络配置表 网络配置表的通常目标是提供网络中使用的硬件和软件组成的列表,其组成有: 分级 项目 杂项信息 设备名、设备型号、CPU类型、FLASH、DRAM、接口描述、用户名口令 第1层 介质类型、速率、双工模式、接口号、连接插座或端口 第2层 MAC地址、STP状态、STP根桥、速端口信息、VLAN、Etherchannel配置、封装、中继状态、接口类型、端口安全、VTP状态、VTP模式 第3层 IP地址、IPX地址、HSRP地址、子网掩码、路由协议、ACL、隧道信息、环路接口 在多数情形下,存储这些信息的最佳方式是电子表格或数据库,电子表格用于较小的,网络数据库用于较大的网络。
三、网络拓扑图 网络拓扑图是图示网络的各组成部分之间如何在逻辑上和物理上相互连接。
1、网络拓扑图的组成 分级 项目 杂项信息 设备名、设备型号、设置间连接、接口描述 第1层 介质类型、接口号 第2层 MAC地址、VLAN、封装、中继状态、接口类型、DLCI 第3层 IP地址、子网掩码、路由协议 对于大型的网络,可以制作多个网络拓扑图,每个网络拓扑图反映一个分离的部分。
2、建立网络拓扑图 四、发现网络配置信息
1、收集路由器和第3层交换机网络配置信息 show version ;显示设备型号、Flash、DRAM、IOS版本 show ip interface brief ;显示接口简要信息(类型、状态、协议状态、IP地址) show interface e0/0 ;显示某接口详细信息(MAC、IP、MASK、…) show ip protocols ;显示IP路由协议信息 show ip interface e0/0 ;显示接口的IP协议信息(状态、IP地址、ACL、…)
2、收集交换机配置信息 交换机网络配置表包含的信息:设备名、型号、位置、Flash、DRAM、CATOS版本、管理地址、VTP域、VTP模式、端口号、端口速率、端口双工、VLAN、STP状态、速端口状态、中继状态、… show version ;显示IOS或CATOS版本、DRAM、Flash show vtp domain ;(CatOS)显示VTP域和VTP模式 show vtp status ;(IOS) show interface ;(CatOS)显示管理接口信息 show port ;(CatOS)显示每个端口的简要信息(号、VLAN、双工、…) show interface ;(IOS) show trunk ;(CatOS)显示中继信息(模式、封装、允许端口、剪裁、…) show interface trunk ;(IOS) show spantree 45 ;(CatOS)显示端口的STP模式、类型、状态、速端口、…) show spanning-tree 45 ;(IOS) 3、发现相邻CISCO设备的信息 CDP(Cisco Discovery Protocol)是CISCO的专用协议,用于识别直接相邻的CISCO设备信息,CDP工作在第2层。 Show cdp neighbor ;显示相邻CISCO设备的简要信息(ID、相邻接口、平台、…) Show cdp neighbor detail;显示相邻CISCO设备的详细信息(包含第3层信息)
五、创建网络文档的过程
1、 LOGIN ;登录到设备进入特权模式。
2、 接口发现 ;发现关于设备的所需信息
3、 Document ;在网络配置表中记录发现的信息。
4、 Diagram ;从网络配置表传输所需信息到网络拓扑图
5、 设备发现 ;判断是否有相邻设备没有记录文档。
第三章 ES文档和故障处理一、ES网络配置表 ES网络配置表是ES的硬件和软件组成的列表。ES网络配置常包括以下项目: 分级 项目 杂项信息 系统名、系统厂商/型号、CPU速率、RAM、存储器、系统功能 第1、2层 介质类型、接口速率、VLAN、MAC、网络接头 第3层 IP地址、缺省网关、子网掩码、WINS、DNS、 第7层 操作系统(版本)、基于网络的应用程序、高带宽应用程序、低延时应用程序、特定考虑
二、ES网络拓扑图 ES网络拓扑图的典型项目有:系统名、网络连接、物理位置、系统目标、VLAN、IP地址、子网掩码、操作系统、网络应用程序 | 大多数ES网络拓扑图都建立在网络拓扑图中,其中还可加入ES网络配置表数据的子集。
三、收集ES网络配置信息 通用命令:
1) ping host/ip-address ;发送和接收ICMP响应,校验网络的连通性
2) arp -a ;查看修改ES的MAC-IP映射表(同一子网)
3) telnet host/ip-address ;登录远程ES或特定TCP端口
Windows平台命令
1) ipconfig /all ;查看修改ES的IP信息(适用所有Windows平台)
2) winipcfg ;查看修改ES的IP信息(仅适用于Win9x平台)
3) tracert host/ip-address ;校验到主机的连接并显示路径上的设备IP
4) route print ;显示本设备IP路由表的内容
5) netstat ;显示当前网络连接
Unix、Linux和Mac OS系统命令
1) ifconfig -a ;查看UNIX和MAC主机的IP信息
2) traceroute host/ip ; 3) route –n ;
4) cat /etc/resolv.conf ;查看DNS服务器信息
四、通用的故障处理过程
1、通用的故障处理过程: 收集症状:收集网络、用户、ES的症状
1) 分析现存症状
2) 判断所属
3) 窄化范围
4) 判定症状
5) 记录症状
分离问题
1) Bottom-Up troubleshooting 从物理层开始向上排查,直到应用层。常用于怀疑问题发生在物理层,或在处理复杂网络问题时使用。
2) Top-Down troubleshooting 从应用层开始向下排查故障,用于怀疑问题发生在软件部分。
3) Divide-and-Conquer troubleshooting 选择OSI模型的特定层(数据链路层、网络层、传输层)开始故障处理,确定问题是在该层、还是上层或下层。适于具有丰富的经验的人员使用。 常用traceroute命令检查下4层(从物理层到应用层)。 纠正问题
2、ES故障处理命令
1) ping 连续Ping: ping –t 192.168.0.1 ;Windows系统 ping –s 192.168.0.1 ;Unix环境 记录路由: ping –r 192.168.0.1 ;Windows ping –s –nRv 192.168.0.1 ;Unix
2) Trace Route Tracert 10.0.0.1 ;Windows系统 Tracerout 10.0.0.1 ;Unix Ping记录路由器的出接口,而traceroute通常记录进入的接口。
3) Arp 显示第2层和第3层地址的映射表: Arp –a ;Windows/Unix
4) Route 显示路由表: route print ;windows系统 route –n ;Unix
5) Netstat 显示到ES的当前连接及端口: netstat –n ;Windowx & Unix
6) Ipconfig&Ifconfig 显示ES的IP配置: ipconfig /all ;windows ifconfig –a ;unix
7) Nbtstat 显示当前名称解析缓存: nbtstat –c ; 清除当前名称解析缓存: nbtstat –r ;
第四章 协议属性
一、OSI参考模型应用层 表示层 会话层 传输层 网络层 数据链路层 物理层
二、全局协议分类
1、面向连接的协议: windows size:在需要目标系统确认的传输的数据包数。 队列数据传送:对进入和发送的PDU指定序号,在目的地再按序号重排数据; 流控:确保发送的速率不超过目标接收的速率,通过为传输建立窗口尺寸实现; 错误控制:确保接收到的数据连续并无错,如有丢失或损失的PDU,则不发送ACK包。 面向连接的协议有:ATM、TCP、Novell SPX、Apple Talk ATP;
2、非连接的协议 不包括连接设置和终止,没有流控和错误控制。 非连接的协议有:UDP、Apple Talk DDP、Novell IPX;
三、第2层:数据链路层
1、Ethernet/IEEE802.3
2、Token Ring/IEEE802.5
四、PPP 五、SDLC
六、Frame Relay
七、ISDN
八、第3、4层:IP路由协议 1、IP 2、ICMP 3、TCP 4、UDP
第五章 Cisco测试命令和TCP/IP连接故障处理
一、故障处理命令
1、show命令:
1) 全局命令: show version ;显示系统硬件和软件版本、DRAM、Flash show startup-config ;显示写入NVRAM中的配置内容 show running-config ;显示当前运行的配置内容 show buffers ;详细输出buffer的名称和尺寸 show stacks ;提供路由器进程和处理器利用率信息, 用stack decode show tech-support ;显示几个show命令的输出 show access-lists ;查看访问列表配置 show memory ;用于测试内存问题
2) 接口相关命令 show queueing [fair|priority|custom] show queue e0/1 ;查看接口上队列的设置和操作 show interface e0/1 ;Cisco缺省的Ethernet封装方法是ARPA show ip interface e0/1 ;显示指定接口的TCP/IP配置信息
3) 进程相关命令 show processes cpu ;显示路由器CPU的使用率和当前的进程 show processes memory ;显示路由器当前进程的内存使用情况
4) TCP/IP协议相关命令 Show ip access-list ;显示IP访问列表(1-199) Show ip arp ;显示路由器的ARP缓存(IP、MAC、封装类型、接口) Show ip protocols ;显示运行在路由器上的IP路由协议的信息 Show ip route ;显示IP路由表中的信息 Show ip traffic ;显示IP流量统计信息
2、debug命令 DEBUG不应在CPU使用率超过50%的路由器上运行。
1) 限制debug输出 在使用DEBUG获得所需数据后,要关闭Debug 使路由器对所有消息都配置使用时间戳: Router#service timestamps debug datetime msec localtime Router#service timestamp log datetime msec localtime 缺省,error和debug信息仅发送到console,telnet到路由器上看不到debug和log的信息。想在telnet中看到debug和log信息: Router#terminal monitor Router#terminal monitor ;关闭信息输出 Router#undebug all ;关闭debug进程及所有相关信息的输出 可以应用ACL到debug以限定仅输出要求的debug信息。 如仅查看从10.0.1.1到10.1.1.1的ICMP包: Router(config)#access-list 101 permit icmp host 10.0.1.1 host 10.1.1.1 Router#debug ip packet detail 101
2) 全局debug命令:
3) 接口debug
4) 协议debug
5) IP debug debug ip packets
3、logging命令 输出error和其它信息到console、terminal、路由器内部buffer或一台syslog服务器: Router>show logging Cisco路由器有8种可能的logging级:0-7 Logging级别 名称 描述
1 Emergencies 系统不能用的信息
2 Alerts 直接行动
3 Critical 紧急情形
4 Errors 错误信息
5 Warnings 警告信息
6 Notifications 正常但重要的情形
7 Informational 信息
8 Debugging 调试 缺省地,console、monitor、buffer的logging被设置为debugging级,而trap(syslog)服务器的logging被设置为informational。
4、执行路由核心复制 core dump包含一份当前系统内存中信息的精确拷贝。捕捉包含在内存中信息的方法有: 1) 配置路由器在崩溃时执行Core Dump,存储到TFTP、FTP、RCP服务器: 对TFTP协议,只需指定TFTP服务器IP,不需要任何附加的配置: Router(config)#exception dump 192.168.1.1 ;TFTP服务器的IP地址 对FTP协议的配置: Router(config)#exception dump 192.168.1.1 ;FTP服务器的IP地址 Router(config)#ip ftp username Kevin Router(config)#ip ftp password aloha Router(config)#ip ftp source-interface e0 Router(config)#exception protocol ftp 对RCP协议的配置: Router(config)#exception protocol rcp Router(config)#exception dump 192.168.1.1 ;RCP服务器的IP地址 Router(config)#ip rcmd remote-username Kevin Router(config)#ip rcmd rcp-enable Router(config)#ip rcmd rsh-enable Router(config)#ip rcmd remote-host Kevin 192.168.1.1 kevin ; 2) 在系统没有崩溃的情况下,执行Core Dump命令。 Router#write core Core Dump仅在Cisco工程师测试和解决路由器问题时有用。
5、ping命令 ping用于测试整个网络可达性和连通性。可在用户EXEC模式和特权EXEC模式下使用。 IP的ping使用ICMP协议提供连通性和可能性信息,缺省只发送5个echo信息。 扩展Ping的选项有:源IP地址;服务类型;数据;包头选项。 Ping的响应字符集 字符 解释 字符 解释 ! Received an echo-reply message Q Source quench . Timeout M Unable to fragment U/H Destination unreachable A Administratively denied N Network unreachable ? Unknown packet-type P Protocol unreachable
6、traceroute命令 traceroute用于显示到达目标的包路径。可在用户模式和特权模式下使用。 Traceroute的响应: 字符 解释 字符 解释 Xx msec The RTT for each packet * Timeout H Host unreachable U Port unreachable N Network unreachable P Protocol unreachable A Administratively denied Q Source quench ? Unknown packet type
二、LAN连接问题 1、获得IP地址 主机可以动态或静态获得IP地址。 1) DHCP:DHCP比BootP多了地址池和租期。 2) BootP: 3) Helper Addresses:指定集中放置的DHCP服务器的IP地址 Ip helperaddress ip-address ; No ip forward-protocol udp 137 ; 4) 路由器上的DHCP服务:配置路由器为一台DHCP服务器 5) DHCP和BootP故障处理 Show dhcp server ; Show dhcp lease ; 2、ARP ARP映射第2层MAC地址到第3层地址。 Show arp ;显示路由器的ARP表 Debug arp ; 1) ARP代理:缺省Cisco路由器的ARP代理是启用的 在下列情况下,CISCO路由器将用自身的MAC地址响应ARP请求: 接收到ARP的接口上的Proxy ARP是启用的; ARP请求的地址不在本地子网; 路由器的路由表中包含ARP请求地址的子网; 3、TCP连接示例 三、IP访问列表 1、标准ACL:基于IP包的源IP地址允许或禁用 2、扩展ACL:提供源地址、目标地址、端口号、会话层协议进行过滤。 3、命名ACL:可以是标准ACL,也可以是扩展ACL。 命名ACL与编号ACL的区别:命名ACL有一个逻辑名,可以删除命名ACL中单独一行。 Ip access-list extended Example-Named-ACL Deny tcp any any eq echo Deny tcp any any eq 37 Permit udp host 172.16.10.2 any eq snmp Permit tcp any any 第六章 TCP/IP路由协议故障处理一、缺省网关当包的目的地址不在路由器的路由表中,如路由器配置了缺省网关,则转发到缺省网关,否则就丢弃。 Show ip route ;查看Cisco路由器的缺省网关 二、静态和动态路由
三、处理RIP故障 RIP是距离矢量路由协议,度量值是跳数。RIP最大跳数为15,如果到目标的跳数超过15,则为不可达。 RIP V1是有类别路由协议,RIP V2是非分类路由协议,支持CIDR、路由归纳、VLSM,使用多播(224.0.0.9)发送路由更新。 RIP相关的show命令: Show ip route rip ;仅显示RIP路由表 Show ip route ;显示所有IP路由表 Show ip interface ;显示IP接口配置 Show running-config Debug ip rip events ; 常见的RIP故障:RIP版本不一致、RIP使用UDP广播更新 四、处理IGRP故障 IGRP是Cisco专用路由协议,距离矢量协议。IGRP的度量值可以基于五个要素:带宽、延时、负载、可靠性、MTU,缺省只使用带宽和延时。 IGRP相关的show命令: Show ip route igrp ;显示IGRP路由表 Debug ip igrp events ; Debug ip igrp transactions ; 常见的IGRP故障:访问列表、不正确的配置、到相邻路由器的line down 五、处理EIGRP故障 EIGRP是链路状态协议和距离矢量混合协议,是CISCO专用路由协议。EIGRP使用多播地址224.0.0.10发送路由更新,使用DUAL算法计算路由。EIGRP的度量值可以基于带宽、延时、负载、可靠性、MTU,缺省仅使用带宽和延时。 EIGRP使用3种数据库:路由数据库、拓扑数据库、相邻路由器数据库。 EIGRP相关的show命令: Show running-config Show ip route Show ip route eigrp ;仅显示EIGRP路由 Show ip eigrp interface ;显示该接口的对等体信息 Show ip eigrp neighbors ;显示所有的EIGRP邻居及其信息 Show ip eigrp topology ;显示EIGRP拓扑结构表的内容 Show ip eigrp traffic ;显示EIGRP路由统计的归纳 Show ip eigrp events ;显示最近的EIGRP协议事件记录 EIGRP相关的debug命令: Debug ip eigrp as号 Debug ip eigrp neighbor Debug ip eigrp notifications Debug ip eigrp summary Debug ip eigrp 常见的EIGRP故障:相邻关系、缺省网关等的丢失、老版本IOS的路由、stuck in active。 处 理EIGRP故障时,先用show ip eigrp neighbors查看所有相邻路由器,然后再用show ip route gigrp查看路由器的路由表,再用show ip eigrp topology查看路由器的拓扑结构表,也可用show ip eigrp traffic查看路由更新是否被发送。 六、处理OSPF故障 OSPF是链路状态协议,维护3个数据库:相邻数据库、拓扑结构数据库、路由表。 OSPF相关的show命令: Show running-config Show ip route Show ip route ospf ;仅显示OSPF路由 Show ip ospf process-id ;显示与特定进程ID相关的信息 Show ip ospf ;显示OSPF相关信息 Show ip ospf border-routers ;显示边界路由器 Show ip ospf database ;显示OSPF的归纳数据库 Show ip ospf interface ;显示指定接口上的OSPF信息 Show ip ospf neighbor ;显示OSPF相邻信息 Show ip ospf request-list ;显示链路状态请求列表 Show ip ospf summary-address ;显示归纳路由的再发布信息 Show ip ospf virtual-links ;显示虚拟链路信息 Show ip interface ;显示接口的IP设置 OSPF相关的debug命令: Debug ip ospf adj ; Debug ip ospf events Debug ip ospf flood Debug ip ospf lsa-generation Debug ip ospf packet Debug ip ospf retransmission Debug ip ospf spf Debug ip ospf tree 常见的OSPF故障:OSPF的每个area不超过100台路由器,整个网络不超过700台路由器;通配符掩码配置不当;
七、处理BGP故障 BGP(包括IBGP和EBGP)的关键配置是邻居关系,BGP使用TCP建立相邻关系。 BGP相关的show命令: Show ip bgp ;显示BGP所学习到的路由 Show ip bgp network ;显示特定网络的BGP信息 Show ip neighbors ;显示BGP邻居信息 Show ip bgp peer-group ;显示BGP对待组信息 Show ip bgp summary ;显示所有BGP连接的归纳 Show ip route bgp ;显示BGP路由表 BGP相关的debug命令: Debug ip bgp 192.1.1.1 updates Debug ip bgp dampening Debug ip bgp events Debug ip bgp keepalives Debug ip bgp updates 典型的BGP故障: 八、再发布路由协议 九、TCP/IP症状和原因 症状 原因 本地主机不能与远程主机通讯 1) DNS工作不正常2) 没有到远程主机的路由3) 缺少缺省网关4) 管理拒绝(ACL) 某个应用程序不能正常工作 1) 管理拒绝(ACL)2) 网络没有正常配置以处理该应用程序 启动失败 1) BootP服务器没有MAC地址的实体2) 缺少IP helper-address3) ACL4) 修改NIC或MAC地址5) 重复的IP地址6) 不正常的IP配置 不能ping远程主机 1) ACL2) 没有到远程主机的路由3) 没有设置缺省网关4) 远程主机down 缺少路由 1) 没有正确配置路由协议2) 发布列表3) 被动接口4) 没有通告路由的邻居5) 路由协议版本不一致6) 邻居关系没有建立 相邻关系没有建立 1) 不正确的路由协议配置2) 不正确的IP配置3) 没有配置network或neighbor语句4) hello间隔不一致5) 不一致的area ID 高的CPU利用率 1) 不稳定的路由更新 2) 没有关闭debug 3) 进程过重 路由触发活跃模式 1) 不一致的间隔2) 硬件问题3) 不稳定的链路 十、TCP/IP症状和行动计划 问题 行动计划 DNS工作不正常 1)配置DNS主机的配置和DNS服务器,可以使用nslookup校验DNS服务器的工作 没有到远程主机的路由 1) 用ipconfig /all检查缺省网关2) 用show ip route查看是否相应路由3) 如果没有该路由,用show ip route查看是否有缺省网关4) 如有网关,检查到目标的下一跳;如无网关,修正问题 ACL 有分离的问题与ACL相关,必须分析ACL、或重写ACL并应用。 网络没有配置以处理应用程序 查看路由器配置 Booting失败 1) 查看DHCP或BootP服务器,并查看是否存在故障机的MAC实体2) 使用debug ip udp校验从主机接收的包3) 校验helper-address正确配置4) 查看ACL是否禁用包 缺 少路由 1) 在第1台路由器上用show ip route查看所学到的路由2)校验相邻路由器3)有正确的路由network和neighbor语句4) 对OSPF,校验通配符掩码5) 检查应用到接口上的distribute list6)验证邻居的IP配置7) 如果路由被再发布,验证度量值8) 验证路由被正常的再发布 没 有构成相邻关系 1) 用show ip protocol neighbors列表已构成的相邻关系2) 查看没有构成相邻关系的协议配置3)检查路由配置中的network语句4)用show ip protocol/interface查看特定的接口信息,如Hello间隔. 第七章 处理串行线路和帧中继连接故障 一、处理串行线路故障 1、HDLC封装 High-level Data Link Control(HDLC)是用于串行链路的一种封装方法,HDLC是Cisco路由器串行接口的缺省封装方法。 处理串行链路故障的第一步就是查看链路两端要使用相同的封装类型。 Show interface serial 1 ;查看接口信息 Clear counters serial number ;复位接口的计数器到0 正常情况下,接口和line都是up的。 线缆故障、载波故障和硬件故障都可导致接口down,通过校验电缆连接、更换硬件(包括电缆)、检查载波信令定位问题。 接口up,line down:CSU/DSU故障、路由器接口问题、CSU/DSU或载波的时间不一致、没有从远端路由器接收到keepalive信令、载波问题。应验证本地接口和远端接口的配置。 接口重启的原因: 数秒内排队的包没有被发送; 硬件问题(路由器接口、线缆、CSU/DSU); 时钟信令不一致 环路接口 接口关闭 线协议down且接口定期重启 show controllers serial 0 ;显示接口状态、是否连有线缆、时钟速率 show buffers ;查看系统buffer池,接口buffer设置 debug serial interface ;显示HDLC或Frame Relay通信信息 2、CSU/DSU环路测试 有四种类型的环路测试: 在本地CSU/DSU上测试本地环路; 在远端CSU/DSU上测试本地环路; 从本地NIU到远端CSU/DSU测试远端环路; 从远端NIU到本地CSU/DSU测试远端环路; 用PPP封装的串行链路上,PPP用协商Magic Number检测环回网络。 3、串行线中总结: 1) 症状和问题: 症状或情形 问题 Interface is administratively down;line protocol is down 1) 接口被从命令行关闭2) 不允许重复的IP地址,两个使用相同IP地址的接口将down Interface is down;line protocol is down 1) 不合格的线缆2) 没有本地提供商的信令3) 硬件故障(接口或CSU/DSU、线缆)4) 时钟 Interface is up;line protocol is down 1) 未配置的接口:本地或远程2) 本地提供商问题3) Keepalive序号没有增加4) 硬件故障(本地或远端接口、CSU/DSU)5) 线路杂音6) 时钟不一致7) 第2层(如LMI) Interface is up;line protocol is up(looped) 链路在某处环路 Incrementing carrier transition counter 1) 来自本地提供商的信号不稳定2) 线缆故障3) 硬件故障 Incrementing interface resets 1) 线缆故障,导致CD信号丢失2) 硬件故障3) 线路拥塞 Input drops,errors,CRC,and framing errors 1) 线路速率超过接口能力2) 本地提供商问题3) 线路杂音4) 线缆故障5) 不合格线缆6) 硬件故障 Output drops 接口传输能力超过线路速率 2) 问题和行动 问题 解决行动方案 本地提供商问题 1) 检查CSU/DSU的CD信号和其它信号,看链路是否在发送和接收信息2) 如果没有CD信号或有其它问题,联系本地提供商处理故障 不合格或故障的线缆 1) 使用符合设备要求的线缆2) 使用breakout盒检查3) 交换故障线缆 未配置的接口 1) 使用show running-config校验接口配置2) 确认链路两端使用相同的封装类型 Keepalive问题 1) 验证keepalive被发送2) 配置了keepalive发送,debug keepalive3) 验证序号在增加4) 如果序号不增加,运行环路测试5) CSU/DSU环路,序号仍不增,则硬件故障 硬件故障 1)更换硬件 接口在环路模式 1) 检查接口配置2) 如果在接口配置有环路,移除3) 如果接口配置被清除,清除CSU/DSU环路模式4) 如CSU/DSU不在环路模式,可能是提供商置环 接口administratively down 1) 检查是否有重复的IP地址2) 进行接口配置模式,执行no shutdown 线路速率大于接口能力 1) 使用hold-queue减少进入的队列尺寸2) 增加输出的队列尺寸 接口速率大于线路速率 1) 减少广播流量2) 增加输出的队列3) 如有需要,使用队列算法
二、处理帧中继故障 DLCI用于在帧中继中标识虚拟链路,DLCI仅仅是本地信令,DLCI与第3层IP地址相映射。 处理帧中继的步骤: 1) 检查物理层,线缆或接口问题; 2) 检查接口封装; 3) 检查LMI类型; 4) 校验DLCI到IP的映射; 5) 校验Frame Delay的PVC; 6) 校验Frame Delay的LMI; 7) 校验Frame Delay映射; 8) 校验环路测试; 1、帧中继的show命令 show interface show frame-relay lmi ;显示LMI相关信息(LMI类型、更新、状态) show frame-relay pvc ;输出PVC信息、每条DLCI的LMI状态、…) show frame-relay map ;提供DLCI号信息和所有FR接口的封装 2、帧中继的debug命令 debug frame-relay lmi ;显示LMI交换信息 debug frame-relay events ;显示协议和应用程序使用DLCI的细节 3、帧中继总纳 1) 症状和问题 症状或情形 相关问题 Frame Realy link is down 1) 线缆故障2) 硬件故障3) 本地服务商问题4) LMI类型不一致5) Keepalive没有被发送6) 封装类型不一致7) DLCI不一致 从Frame Delay网络不能ping远端主机 1) DLCI指定了错误的接口2) 封装类型不一致3) ACL问题4) 接口配置错误 2) 问题和行动 问题 解决行动方案 线缆故障 1) 检查线缆并测试接头2) 更换线缆 硬件故障 1) 执行环路测试,以分离硬件2) 将线缆连接到路由器的另一同样配置的接口,如OK,则需更换硬件 本地服务提供商问题 1) 如环路测试使LMI状态up,但不能连接远端着站点,联系本地载波2) 包含载波问题,就好象FR配置错误,如DLCI不一致或封装不一致。 LMI类型不一致 1) 校验路由器的LMI类型与PVC上的每个设备都一致2) 如使用公共提供商网络,不能访问LMI,与提供商联系 Keepalive问题 1) 使用show interface查看是否keepalive被禁用,或校验keepalive被正常配置2) 如果keepalive设置错误,进入配置模式并在接口上指定keepalive间隔 封 装类型 1) 校验两端路由器的封装方式相同,如有非Cisco路由器,必须用IETF。用show frame-relay命令显示封装信息2)用encapsulation frame-relay ietf更换封装方式,与可用frame-relay map设置某个PVC的封装。 DLCI不一致 1) 用show running-config和show frame-relay pvc显示指派给某接口的DLCI号2) 如DLCI号配置正常,联系供应商校验FR交换机是否了相同的DLCI ACL问题 1) 使用show ip interface显示应用到接口上的ACL2) 分析ACL,如有需要,删除或修改它. 第八章 处理ISDN故障 一、ISDN基本原理 二、常见ISDN故障 ISDN问题分成3类:配置不当的路由器、物理线缆和ISDN协议、配置不当的交换机。 1、配置不当的路由器 配置不当由于不同原因:typographical错误、从服务供应商提供的错误信息、本路由器配置不正确 1) SPID(Service Profile Identifiers):如SPID和LDN配置错误,将有ISDN连接问题。SPID仅用于北美,只有服务供应商要求时才设置。 2) CHAP:CHAP认证在使用PPP封装的接口上使用。两端路由器的CHAP配置一定要相同。在PPP中,用户名和口令是大小写敏感的。 3) Dialer Map实体:Dialer map关联高层地址到相关的电话号码。每种协议需要一条dialer map语句。 4) 访问列表:ACL可用于ISDN连接以阻止某类型流量触发连接。 5) PPP: 2、物理层连接 1) BRI:在现有电话线上提供数字服务。 2) ISDN BRI信道:2B+D(2*64+16+48=192kbps);ISDN BRI的物理帧为48bits,链路每秒发送4000帧。 3) 本地环路:客户和CO之间的链路,连接ISDN设备到ISDN交换机。 4) 物理层:参考点(R、S、T、U);设备(LT/ET、NT1、NT2、TE1、TE2、TA) 三、配置不当的电话交换机 在新安装ISDN时,必须考虑服务供应商ISDN交换机配置错误的可能性。 1、第2层故障处理: ISDN第2层故障处理的目标:q.921协议和PPP。 1) q.921:ISDN的第2层在q.921中定义。Q.921信令在D信道上用LAPD协议传输。处理q.921故障最常用命令是debug isdn q921,问题常与TEI(terminal endpoint identifier)、SAPI(service access point identifier)和SABME(set asynchronous balanced mode extended)有关。 TEI=127表示广播;TEI=64-126保留用于动态分配。 SAPI=0表示当前第3层信令;63表示用于TEI值分配的管理SAPI;64为呼叫控制。 2) PPP:PPP使用LCP设置和维护链路;NCP配置和维护网络层协议。 2、第3层故障处理: ISDN第3层也叫q.931,使用debug isdn q931命令可查看call setup、connect、release、cancel、status、disconnect和、user information。 ISDN第3层连接在本地路由器(TE)和远端ISDN交换机(ET)之间。 ISDN呼叫建立的过程: 1) SETUP:在本地TE和远端ET之间发送信息 2) CALL_PROC:呼叫处理信令 3) ALERT: 4) CONNECT 5) CONNECT_ACK: 3、交换机类型: 配置ISDN时,必须用isdn switch-type命令指定本地环路的交换机。 四、ISDN故障处理命令 1、ping:在DDR中,ping命令触发一个呼叫,在第2个B信道up前,路由器已完成了ping。 2、clear interface bri n:重置接口上不同的计数器并中止接口上的连接。 3、show interface bri n:显示关于ISDN BRI D信道的信息 4、show interface bri n 1 2:显示ISDN BRI的B信道信息。 5、show controller bri:显示接口硬件控制器信息和U接口,供Cisco的TAC处理故障。 6、show isdn status:显示ISDN接口状态和各层详细信息。 7、show dialer:显示关于DDR连接的信息,包括拨号、成功的连接、IDLE时间、呼叫数。 8、show ppp multilink: 五、调试ISDN 1、debug bri:提供有关BRI B信道的信息,包括带宽信息 2、debug isdn q921:获取关于接口D信道的信息,D信息用于在交换机和本地ISDN设备间传输信令。 3、debug dialer:呼叫连接的原因和连接的状态。 4、debug isdn q931:监视发生在第3层的事件。 Cause ID显示呼叫被拒绝的原因; CallRef ID发送和返回的信息,用于分析路由器和交换机之间不同呼叫的特定会话。 5、debug ppp negotiation:提供建立PPP会话的实时信息,可察看CHAP和PAP验证 6、debug ppp packet:报告实时PPP包流,包括包的类型和所用的B信道 第九章 交换以太网故障处理 一、Switch、Bridge、Hub 广播域:由Router控制 冲突域:由Switch或Bridge控制 Switch和Hub比较: 类型 Switch Hub Unicasts 仅发送到目标 发送到所有端口 Broadcasts 发送同VLAN中的所有端口 发送到所有端口 Aggregate bandwidth 等于每个端口的带宽×端口数 等于介质速率 Full/half-duplex 可全双工连接 仅半双工 Support for mixed media:Token Ring,Ethernet,FDDI… 依靠switch,可在不同帧类型和物理介质之间传输 仅支持同一介质 混合介质的支持 依赖于桥配置 处理帧 硬件(ASIC) 软件或 端口数量 从4到超过100 通常16个以下 帧类型转换 依靠桥配置 | 二、Catalyst故障处理工具 1、Catalyst命令行接口: 命令行接口有Native模式和Hybrid模式。本机模式配置第3层和第2层在一起;混合模式在不同CLI下配置第3层和第2层,常为基于set的CLI。
2、混合模式下的CLI: 1) show system:关于switch的高级总结信息,包括供电状态、uptime和管理设置
2) show port:显示指定端口或一个模块上所有端口的信息(VLAN、速率、双工、状态、类型、…)
3) show log:报告重要事件,包括所有模块的重启、trap、供电失败、…。
4) show logging buffer:等同于路由器的show log命令,根据logging级别,报告端口up或down、STP、…
5) show interface:报告管理模块上IP配置和SC0接口上VLAN信息。(sl0、sc0)
6) show cdp:显示相邻CISCO设备信息 7) show config:等同于show running-config命令,显示交换机除MSFC等外所有模块上所有设置,仅显示非默认设置。Show config all显示所有设置。 8) show test:仅显示switch管理模块状态,包括接口卡、供电、内存等。 9) show mac:显示大量计数,包括每端口帧流量、发出和进入的帧的总数量、丢弃、… 10)show vtp domain: 11)show cam:显示与端口相关联的MAC地址 12)重复的MAC地址 13)show spantree:显示每个VLAN的SPT进程状态 14)show version:显示硬件和软件版本号,包括内存、系统UP时间统计等 3、RMON(Remote Monitoring) RMON 基于RMONProbe,从电路(物理介质)上采集数据信息。Router和Switch并不支持所有级别的RMON信息,更多的监控可以用SPAN (Switched Port Analyzer交换端口分析,也叫Port Mirroring端口监控)实现。 4、指示灯: 管理引擎上包含有负载LED,可以提示交换机的当前负载。在启动过程中,LED将闪烁;正常情况下,LED常绿;橙色LED提示有问题;红色LED提示有故障。
三、用STP控制环路 STP算法在802.1D中定义,用于在多交换机时控制重复路径,避免网络环路。 Cisco使用Port fast和Uplink fast时,要防止产生网络环路。
四、VLAN VLAN有基于端口的静态VLAN和基于MAC的动态VLAN 1、ISL:Cisco专用协议,用于连接两台设备以支持多个VLAN。 ISL只能在支持ISL的产品上使用 ISL必须是点对点的 ISL仅用于100Mb全双工 ISL要求路由器的IOS和内存升级; ISL可以支持Token Ring; ISL添加30Bit到原始帧; ISL在帧的末尾包含CRC。 2、802.1Q:用于连接非Cisco中继到Cisco设备。 3、VTP:VTP使用多播通知VTP域中所有其它交换机关于域中VLAN的信息。 VTP服务器: VTP客户机 透明VTP:
五、线缆问题物理层标准: 线缆 10Mb 100Mb 3类线距离 100m 不可用 5类距离 100m 100m 多模光纤距离 2000m 2000m 单模光纤距离 高达100km 高达100km 1、线缆问题:1) 万用表(Multimeters)和电缆测试器(Cable Testers) 万用表(Multimeters)和伏欧表(Volt-ohm)用于验证电缆连通性,只能用于测试铜线或其它基于电信号的电缆,不能用于测试光纤。 电缆测试器(Cable Testers)既可测试电缆也可测试光缆,提供给用户更多的被测试电缆的信息,如:连通性、断路、短路、距离过长、噪音、MAC信息、线路负载、…。 2) 时域反射器(TDRs)和光时域反射器(OTDRs) TDR是更复杂的电缆测试器,可用于定位电 2、交叉线 交叉线用于两台主机直接相连、连接两台网络设备。 以太网使用1、2、3、6四芯(白橙、橙、白绿、绿),而T1电路使用RJ-45的1、2、3、5四芯
六、交换机连接故障处理 发生在交换机上常见的故障有速率和双工设置
1、SPAN(交换端口分析器): 也叫Port Mirroring(端口监视器)交换机拷贝所有被发送到工作站接口的包到另一接口,这个接口没有被指定VLAN。 Set span enable ;配置SPAN 使用SPAN既监视接收的、发送的或所有的包。
2、多层交换特性卡(MSFC)和Catalyst路由:MSFC是一个在子板的Cisco路由器,安装在管理模块上,提供VLAN间路由。 在CLI下访问MSFC:session
3、路由器和交换机间VLAN: 路由器提供VLAN间的通信。
1) 广播管理: 路由器不转发广播,交换机控制广播仅转发到是源端口所VLAN成员的端口。
2) 策略控制:交换机没有策略,而路由器提供连接VLAN的安全和策略控制
3) VLAN交换:经过路由器转发一个包到同VLAN的不同接口
4) VLAN传输:使用不同VLAN协议的两VLAN间或VLAN协议传输到非VLAN第2层协议。
5) 路由:在不同VLAN或非VLAN网络间通信
6) 路由器上VLAN故障处理: show vlans show arp show interface show cdp neighbor debug vlan packet debug spantree
7) show vlans:在路由器上执行,显示路由器VLAN配置的细节,包括:VLAN名、接口、IP地址、VLAN封装协议、接口协议。
8) debug vlan packet:判定在中继上发送到路由器的数据的VLAN。
3、VLAN设计和故障处理 VLAN设计时注意事项:
1) 网络直径要少于8台交换机;
2) VLAN必须在某个限制内进行编号;
七、混合/本地模式命令转换
混合模式 本机模式 解释 Clear vlan No vlan 从配置中删除VLAN Set cam agingtime Mac-address-table aging-time 设置保留MAC地址的超时值 Set port dulex Duplex 在特定端口上配置双工 Set port name Description 设置端口名 Set port speed speed 设置端口速率 Se tspan Monitor session 设置SPAN端口 Set spantree Spanning-tree 设置STP信息 Set vlan Switchport access vlan 分配某端口到给定VLAN Show cam dynamic Show mac-address-table dynamic 显示MAC到端口关系 Show port Show interface 显示端口信息 Show span Show monitor 显示SPAN端口 Show test Show diagnostic 显示启动测试结果 Show version Show version 显示交换机IOS版本信息 Show vlan Show vlan 显示VLAN信息 Show vtp domain Show vtp status 显示VTP信息
第十章 分离并纠正物理层和数据链路层故障
1、识别物理层问题的症状 物理层组件包括:接口/端口、模块、线缆、中继器、网卡、转换器等。 物理层问题将导致链路上数据完全或间断的丢失,应用程序失败,数据传输速率低。 设备的端口和特定部件的LED在正常工作时稳定,故障时LED状态将关闭、闪烁或其它颜色。 物理层问题的常见症状:
2、识别数据链路层问题的症状 数据链路层问题包括:不正常的帧类型(不相符的封装)、重复的MAC地址、换换鹊?层设备的不当行为。 第2层和第3层测试工具(CDP、PING)可以帮助检验并校验数据链路层问题。
3、用于分离物理层和数据链路层问题的命令和应用程序:
1) ES命令: Ping host|ip-address ; Arp –a ; Netstat –rn ; Ipconfig /all ; Tracert ; Winipcfg ; Ifconfig –a ; Traceroute ;
2) Cisco IOS命令 Ping ; Traceroute ; Debug ; Show version ; Show ip interface brief ; Show interface e 1 ; Show cdp neighbor detail ; Show controllers ; Debug ppp|isdn|serial|asynch|frame-relay Show arp ; Debug arp|lapb|stun ;
4、纠正发生在物理层和数据链路层的命令和应用程序 arp –d ; interface ; no shutdown ; encapsulation ; clock rate ; controller ; duplex full|half|auto speed 10|100|auto 1) 纠正T1|E1问题的命令 channel-group channel-no timeslots timeslot-list speed 56|64 clock source line|internal framing sf|esf;framing crc4|no-crc4 linecode ami|b8zs;linecode ami|hdb3 pri-group timeslote range
第十一章 分离并纠正网络层问题
1、网络层问题的症状
2、分离网络层问题的ES命令
1) 通用命令: ping arp –a netstat
2) WINDOWS Route print Ipconfig /all Tracert Winipcfg
3) UNIX&MAC Ifconfig –a Traceroute Route –n
3、分离网络层问题的Cisco IOS命令
1) 通用: ping trace debug show running-config
2) ARP Show ip arp Debug arp
3) 路由表 show ip route debug ip routing
4) IP接口 Show ip interface brief
5) BGP Show ip bgp Show ip bgp summary Show ip bgp neighbors Debug ip bgp
6) IP流量 Show ip traffic Debug ip icmp Debug ip packet
7) IP访问列表 Show ip access-list