关于单位办公网络稳定性和健壮性故障的分析和处理以及思考

2017061614:23——14:45;16:00——16:18(补充ARP攻击与路由内部出错两种网络环境的特点)

关于2017.6.16周五今日网络健壮性问题的处理

 思维节点:(1)首先在核心网络设备端为连接边缘网络设备的线路贴标签,(2)排查是否是ARP攻击,(3)根据细节(有线连接核心路由器无法进入路由器的管理界面,无线连接却可以进入其管理界面),认为是核心路由出错所致,重置之,报错解除。(重置,指代的是将设备恢复出厂,重新配置,有别于重启)

 备注:(1)此次网络质量差的表现在于延时很高,一般在几百毫秒至少且接连丢包,<1>.网络质量良好情况下,PC端ping测核心路由IP即网关IP,“时间<=1ms”(时间大约在3ms左右,最佳为1ms);PC端ping测外网服务器域名或IP,如百度,“时间<=10”(时间大约在6-8ms或者10ms左右,一般的一般也是10ms左右,较佳的一般在5-9ms)<2>网络质量差的时候,ping测内网网关或者外网服务器,“时间”一般会在几十毫秒之上,甚至几百毫秒之上。并且接连出现丢包情况。(2)可以对比核心路由器TP_Link的配置(如其中WAN口设置、LAN口设置、DHCP服务,三处功能模块),来近似地配置飞鱼星(配置其作为核心路由器的候补设备),比如由核心路由器中DHCP服务功能界面中的配置,应该认识到飞鱼星的基础设置-->DHCP服务器功能界面中应该是不需要配置其中的默认网关、DNS服务器的。

 

处理步骤:(1)梳理拓扑结构、线路,在核心网络设备端为边缘网络设备线路贴标签(08:39——10:00)(2)排查ARP攻击的可能性(10:00——11:01)(3)由有线连接核心路由无法访问管理员界面(无线连接核心路由器则可以访问管理员界面)而推测此次故障乃因为核心路由器出错所致。重置核心路由器Router(TP-link),网络恢复。(11:02)(4)而后发现Router(TP-link)没有设置无线密码而准备进入管理界面,而发现先前的管理员密码不正确,只好再次重置Router,自此而后共接连重置了不下三次,都因为配置管理员密码之后,再次进入管理员界面的时候验证身份出错(其实并非密码不正确,也许此时Router(TP-Link)中的数据仍是错乱的),只好暂时弃用TP-link;(5)再而后暂时断电TP-link,试着使用飞鱼星作为核心路由器,无奈飞鱼星能连接互联网,但是边缘网络设备不晓得如何关联飞鱼星使用;(6)再而后,重新启用TP-link作为核心路由器,只是这次配置TP-link的时候没有互联网入户网线连接WAN口,而是在无网络连接的条件下做好Router管理员账户密码设置、PPPoE账户配置、无线连接密码配置,而后再连接网线联网,网络正常,管理员账户认证正常。(后三步12:30——14:00,此外,发现飞鱼星网络设备可以适当研究一下了。)

 小结:(1)关于经历过的ARP攻击与此次核心路由器(指代的是互联网入户网线连接的路由器)内部数据或软件错误之间的区别:前者ARP攻击的网络环境中,PC无线连接边缘网络设备即无线AP进行无线联网时很不稳定(延时高、连续丢包),而有线连接到这些无线AP网口进行有线联网则几乎不受影响,排查过程中将ARP攻击源断开网络连接则网络稳定性立即、明显改善(延时缩短、几乎不丢包)。后者核心网络设备路由器(或者边缘网络路由、边缘AP设备)内部周期报错(或因高负荷所致)的网络环境中,PC不论有线还是无线连接网络设备,网络都很不稳定(延时高、连续丢包),将该设备重置,则网络质量明显改善。(2)关于网络质量的制约因素,主要的有网络连接方式(有线优于无线)、用户端与网络设备之间的距离。实例:当初单位刚由十条迁移到这里的时候,因为寻不到连接到各个办公室的线路,所以房间中的边缘网络设备(无线AP)与核心路由器的连接多数是无线桥接模式,有的甚至是从AP(此AP是有线连接核心路由器的)的再度桥接(确切关联忘记了,总之就是网络设备之间多数是无线方式连接),而用户端与无线AP之间又是无线方式联网,所以当时的网络环境很不稳定,用户增多时更为明显;此外,为排查当时问题所在,分析过程中发现纵使网络设备附近网络很好但是随着距离的拉开,延时变长、丢包率增大。于是受到启发,重点为主地重新建立了边缘网络设备到核心网络设备的有线拓扑,问题终而得到解决。

 网络质量较好时候的ping测效果,如下图:

  关于单位办公网络稳定性和健壮性故障的分析和处理以及思考_第1张图片

  关于单位办公网络稳定性和健壮性故障的分析和处理以及思考_第2张图片

你可能感兴趣的:(运维文档)