PING 丢包 故障解决思路

ping 丢包现象的发生非常普遍,但是广大网友对为何ping 丢包却不是非常清楚,看了下面的文章,相信您会有收获!

故障现象:公司有一台型号为清华同方TP200的 WEB服务器,操作系统安装顺利,IIS服务也配置无误,可是在访问此台服务器网站却时断时续。

分析解决:首先使用Ping命令测试,发现不定时的有数据包丢失的现象,初步认为是物理层的原因。重做网线的RJ45头后,故障依旧,换根网线也不行。怀疑是网卡接口或者交换机端口的问题。经查看网卡驱动无误,网卡接口也没有任何异常。再查看交换机端口,发现与服务器连接的交换机端口工作指示灯在绿与黄之间闪烁,这说明端口工作不正常。使用超级终端登录交换机,查看此端口的参数,发现此端口是工作在100Mbyte/s全双工模式,回到服务器前查看本地连接状态,网卡是工作在10Mbyte/s全双工模式。交换机的端口与网卡的传输速率和双工模式不一致。将网卡工作模式改为100Mbyte/s全双工模式后测试,一切正常,故障解决。

注:笔者单位使用的是CISCO3500XL系列交换机



如果你是小区宽带那种直接连接网卡的网络,丢包需要从下边查找原因 
1-计算机网卡是否损坏 
2-RJ45头是否损坏,是否线路错误 
3-网线是否折伤 
4-附近邻居是否同样出现问题,如果是说明问题出在上一级交换机与出口之间,如果别人正常,说明问题出在你的计算机到最近的交换机之间

如果是ADSL使用电话线路 
首先看看ADSL的衰减情况 
USB的能直接看出来,LAN口的需要登陆到MODEM上看,并且LAN口的需要检计算机到MODEM之间是否丢包,具体MODEM的IP请看说明书

说到投诉意义不大,问题是客观存在的,并且大过年的,虽然你不高兴,但是别人多人不高兴了,你看好不好,问题能处理了是关键 
 



从家里测试宽带网连接的丢包是一项非常困难的工作。丢包可以发生在从你的计算机到你在互联网上正在连接的目的地之间的线路上的任何一个地方。引起丢包的原因包括:网络阻塞、路由器或者交换机超过工作负荷、信号往返时间缓慢以及服务提供商或者托管你访问的网站的公司使用的通信优先等级。
  
  没有主动测量实际重复传输的TCP流量(对于家庭宽带网连接来说,这类产品太昂贵了),很难确定是否真的发生了重复传输。你指出的机制ping和跟踪路由对于帮助家庭用户确定互联网上哪里的速度慢是最有用的工具。Ping测量你的计算机和你要连接的IP地址之间的信号往返时间。跟踪路由是测量路由器在你的计算机和你正在跟踪的路由的IP地址之间的通道的反应时间。
  
  使用Ping
  
  使用Ping测量丢包的最佳方法是向一个IP地址发送大量的Ping命令,然后检查没有应答的那些Ping命令。如果你快速地发出了50次Ping命令,
  
  你可以检查没有没有应答的次数,并把没有应答的次数作为丢包。没有应答的次数超过5%可能就值得担心了。
  
  在一台Windows计算机上,在命令提示符后面输入如下命令就可以完成这个任务:
  
  Ping -n 50(IP地址或者域名,如www.website.com)这个命令中的“-n”开关告诉发送ping命令的次数,“50”是发送的次数。
  
  然后,你将得到一个测试总结。这个总结将包括丢失的数量和百分比:
  
  199.181.132.250地址Ping的统计结果:
  
  包: 发送 = 6, 接收 = 6, 丢失 = 0 (0%)
  
  大约往返时间以毫秒(ms)显示:
  
  最小 = 26ms, 最大 = 29ms, 平均 = 27ms
  
  如果你看到平均往返时间较高(超过100ms),这也会降低你的网络下载速度。
  
  设法消除某些引起丢包的网络某些部分的故障的一种方法是在通道的各个部分进行ping测试。我首先开始进行测试的地方是本地的“缺省网关”。这是你所有的数据传输到网络上经过的第一个路由器。如果在这一部分的丢包率很高,那么问题就在你的服务提供商的网络上。
  
  在Windows命令提示符后面输入“ipconfig”命令你就可以发现你的缺省路由器的IP地址。这个结果显示如下:
  
  以太网接口本地区域连接:
  
  具体连接的DNS后缀:domainname.com
  
  IP地址. . . . . . : 192.168.2.189
  
  子网掩码 . . . . . : 255.255.252.0
  
  缺省网关 . . . : 10.10.0.1
  
  你在这里要查看的是缺省网关的IP地址。在上述例子中就10.10.0.1。
  
  使用跟踪路由
  
  在Windows命令提示符后面使用跟踪路由命令就可以实施跟踪路由。在Windows XPZH中这个命令是:tracert (IP地址或者主机名)
  
  虽然结果不能向你显示丢包,但是,可以向你显示在路径中路由器反应速度减慢的情况。
  
  这个输出结果将显示所有的路由器的反应时间。下面是一个例子:
  
  5 ms 2 ms 3 ms malibu.domain.com [10.10.0.1]
  
  10 ms 6 ms 7 ms 10.60.0.6
  
  9 ms 7 ms 7 ms 10.20.0.1
  
  6 ms 7 ms 7 ms x130.cd9e68.sj.concentric.net [205.158.104.130]
  
  7 ms 7 ms 8 ms ge9-0.dcr2.dc-fremont-ca.us.xo.net [205.158.60.169]
  
  7 ms 7 ms 7 ms ge2-0.dcr1.dc-fremont-ca.us.xo.net [65.106.2.205]
  
  10 ms 7 ms 8 ms p5-1-0-2.rar2.sanjose-ca.us.xo.net [65.106.2.153]
  
  10 ms 9 ms 11 ms p1-0.ir1.paloalto-ca.us.xo.net [65.106.5.178]
  
  9 ms 10 ms 15 ms 206.111.12.114.ptr.us.xo.net [206.111.12.114]
  
  9 ms 10 ms 10 ms svl-core-03.inet.qwest.net [205.171.205.29]
  
  29 ms 28 ms 29 ms stl-core-02.inet.qwest.net [205.171.5.85]
  
  30 ms 29 ms 29 ms sea-edge-03.inet.qwest.net [205.171.26.42]
  
  * * * Request timed out.
  
  * * * Request timed out.
  
  28 ms 28 ms 29 ms sam.abcnews.go.com [199.181.132.250]
  
  如果你看到在路径中跟踪路由往返时间有超过100ms(十分之一秒)的,这就可能引起网络上传输的时间减慢。
  
  从上述例子中,你可以看到数据在很多不同的网络(XO, Qwest, ABC)上传输。这是互联网美妙的一部分。不利的方面是一个用户无法解决反应时间减慢的问题。最佳的出发点就是确认你和你的服务提供商之间没有出现丢包。
 



两个idc机房托管的服务器之间通讯不畅,经查,两个机房间的丢包率在8%左右。这样的丢包率很容易引起tcp连接失败,由于网络在线业务异常重要,不得有片刻的停机时间。刻不容缓,马上处理。

一、先判断丢包发生在那里。从办公室的计算机分别ping 两个机房的服务器、然后是网关,通过观察输出进行比较,发现问题在望京机房。在用路由跟踪的方式测试,结论也是一样。

二、去现场排查。检查网段类服务器之间,服务器与交换机之间,以及交换机之间的网络通讯情况,发ping 包,没有丢包,但从网内ping 外部任何地址,都有丢包现象出现,路由跟踪有时不成功。这些情况可以表明网段内的通讯是完全正常的。接下来要做的事情就是测试网关的状态。网关是一个cisco 6509交换机,是网通自己管理,我方的交换机通过一条双绞线与cisco 6509相连,它是所有服务器的外联接口。通过技术手段,已经知道上联交换机的上联端口是Fa0/41。
1、从网段内的某些服务器ping网关,发现丢包。
2、从外网的某台计算机ping 这个网关,没有丢包发生。
3、从外网的某些计算机执行到这个网关的路由跟踪,情况正常。
4、用外网远程的交换机ping 小包,情况正常。
5、从网段内的交换机ping 小包,发现丢包。
有上面的测试结果可以得出结论:是我方的交换机与网通交换机(我方服务器的网关)间的链路有故障。由于我们的网络服务不能中断,网通机房的人建议晚间访问量少的时候重新做一条线或重压网线两端的水晶头。前几天我方为扩容在机架上施工,因此有可能把线缆碰了。已经是中午了,肚子尽管饿了,但还是有点不甘心,再捣鼓一下看能不能找出点什么来。于是我搬来梯子,爬上去看接近天花板的交换机的指示灯状态。居然有一个端口指示灯黄绿交替一闪一闪的,仔细一看,是某个交换机的41号端口,而且网线上标明这条线是整个网段的上联线,即与网关相连的那条线,和先前测试出来的端口是一致的。可能问题就是在这个交换机上了,赶快连上console线,登录上这个交换机,用命令 # show int f0/41 查看41号端口的输出,嘿嘿!居然变成半双工了,再查看其他一些端口的双工情况,均是自适应,再去问IDC 机房的人,确认网关哪个连接端口的双工配置,网关的端口为全双工。好,马上进入配置模式,# config t , int f0/41 ,# duplex full 就把交换机的41号端口设置成全双工了,马上生效,保存配置;然后再爬梯子看41号端口指示灯的状态,变成绿色,这基本表明故障已经排除了。现在,开始从内外来测试丢包的情况了,经测试一切恢复正常。

原因分析:端口速率不匹配是引起丢包的最直接的原因。而引起端口速率变成半双工的原因可能是网络闪断引起的,比如网关那端的端口速率变化,而我方交换机的端口是自适应的,因此在协商后就变成半双工了。



关于ping IP 老是丢包的问题

通常有以下几种原因:

1.由于服务器的IIS中运行了非法或者没有独立进程池的原因,找到这个站点,给他一个独立的进程池.

2.如果服务器上捆绑了一个主机头为空的站点的话,容易造成这个问题,最好把这个主机为空的站点给删除了,或者把这个站点的进程池给独立起来,就可以解决问题.

3.由于对服务器的带宽和流量限制的太低问题,一般有一些机房的IDC服务商为了获得更多的托管的用户,十分的苛刻的限制用户托管的服务器,造成流出去的十分少,请求的多,就造成丢包问题.

4.由于交换机的交换口的问题:首先使用Ping命令测试,发现不定时的有数据包丢失的现象,初步认为是物理层的原因。重做网线的RJ45头后,故障依旧,换根网线也不行。怀疑是网卡接口或者交换机端口的问题。经查看网卡驱动无误,网卡接口也没有任何异常。再查看交换机端口,发现与服务器连接的交换机端口工作指示灯在绿与黄之间闪烁,这说明端口工作不正常。使用超级终端登录交换机,查看此端口的参数,发现此端口是工作在100Mbyte/s全双工模式,回到服务器前查看本地连接状态,网卡是工作在10Mbyte/s全双工模式。交换机的端口与网卡的传输速率和双工模式不一致。将网卡工作模式改为100Mbyte/s全双工模式后测试,一切正常,故障解决。

5.由于被DDOS或者洪水猛兽攻击造成的大量丢包,这个时候没有什么好说的,赶快加上硬件防火墙吧


总结:一般排除故障的方法是:

  1. 带宽有没有占满
  2. 换个交换机端口试试
  3. 换个网线试试
  4. 网卡及主板驱动是不是没装(一般不会是这个问题)
  5. 交换机上设置是100M的还是10M的,与机器设置成一样的
  6. 还不成换交换机

你可能感兴趣的:(Network,服务器,测试,路由器,工作,网络,cisco)