节点机房网络故障排查

企业网络故障多是集中在接入层,对于规模较大的企业,会有多个节点机房,而这些节点机房往往是容易出现故障的地方。这是由于节点机房跟 IT 办公室的距离较远,管理维护人员遇到问题先从中心机房找起,最后才排查到节点机房,我们在日常工作中遇到多是网络连接异常,导致无法上网,获得 IP 地址,连不上公共盘。
 
这些问题出现时,我们先去判断是个别问题,还是所有问题,或是集中在某一区域,从而来缩小范围,用户不知道出现问题的原因,我们要通过跟用户沟通来获取更多的信息,究竟是怎么一回事?用户会反馈,我们这个办公室好几个人都遇到同样的问题,那么可以说是用户所处的节点机房出问题。我们要赶到节点机房去找原因。事实上,企业都会划分 VLAN ,将不同的部门划分为不通的 VLAN ,这样相互之间不会影响,即使出现问题也仅仅是少部分人的问题,不致于导致整个企业网络故障。不过,我们遇到一次交换机环路,从而导致企业的 DHCP 服务器出现问题,这台 DHCP 服务器是在虚机上的,当时某个节点在办公室使用小 SWITCH ,把一根网线的两头都插上去,这个问题直接影响到企业好多人使用,原因是节点的 2950 可以传播 DHCP 。等到网络恢复正常之后,有人报告他所处在的办公室都不能登邮箱,去节点机房发现 2950 有一个端口指示变成橙色,应该跟这个端口接的 D-LINK 有关,把所有端口亮灯的跳线拔出,从而将有问题的隔离,等到 2950 恢复正常之后,再逐个插上,过程中间留上 3 秒,从而找到问题端口在配线架的位置,然后根据网络端口图找到对应位置,发现原因所在,解决问题。在企业中使用 SWITCH 要特别注意环路,遇到网络端口不足,或是会议室临时增加的,我们一定要做好登记,严格控制 SWITCH 在用户端的使用,出现环路是很严重的。
 
同样,如果某台电脑感染病毒,类似“机器狗”的 ARP 病毒,也会产生严重的问题,导致同一 VLAN 的计算机无法访问网络资源,我们尝试 PING 网关失败,从中心机房开始找起,对有可能有问题的节点机房连接依次断开,检查是那个机房的断开后网络 OK ,从而将问题缩小化,然后再拿笔记本去节点机房测试,发现能够获得 192.168 的地址,如果节点机房和中心机房断开的话,是无法获得 IP 地址,只能是 169 的,由此可以是 ARP 病毒导致,观察具体哪个端口灯闪亮频率高,观察断开之后的网络状态,最后发现这台电脑系统异常,原因是病毒导致。
 
网络设备老化也是问题产生的原因。节点机房也有空调制冷,但是环境比较差,灰尘比较多,对设备的影响比较明显,导致设备时好时坏,一次节点机房连不通,由于是使用“光猫”连接,发现上面的 6 个指示灯有 1 个不亮,断电重启之后恢复正常,过了一会又不亮,测试结果是设备老化导致,更换之后没有问题。我们的经验是看设备的指示灯,正常工作状态是深绿闪亮,出现问题指示灯的颜色会变浅,闪亮频率降低,对于使用 3 年以上的网络交换机,出现端口故障是很正常的,有时换个端口就 OK ,但最好是换设备,我们不能让设备“带病工作”,说不定哪天就 OVER ,造成更大的损失。 D-LINK 的交换机在企业使用的较多,我们对于 3 年以上的、流量大要定期检查,曾经遇到交换机灯的颜色是浅绿,用户的 IP 地址都是 169 的,典型的跟 2950 之间不通,从 2950 上找跟各个交换机的跳线,最后发现是这台交换机的问题,更换之后恢复正常。由于交换机出现问题很隐蔽,我们要从 2950 上找起,对于指示灯异常的我们就要先观察后判断,这样才能真正解决问题。
 
还有就是不同网段的设备是不能使用同一台 D-LINK 交换机,企业中会有共享的网络设备,比如:网络打印机、门禁考勤机等,这些设备为了方便管理,通常是使用保留的一段 IP 地址,在节点机房就要直接连在 2950 的端口上, 2950 会跟路由器之间用 TRUNK ,这样网络设备才能使用,使用端口划分 VLAN ,在到 D-LINK 交换机上接入设备,这是企业经常使用的方法。我们还要注意的是,网络设备尽量使用固定 IP 地址,可以减少维护的复杂性,在企业中对网络设备和计算机是不能同样对待,有的网络设备也有 DHCP 分配 IP 地址的功能,企业网络管理中尽可能避免出现的。节点机房的日常维护很重要,我们要确保门窗安全,外人无法进入,空调制冷、 UPS 的正常运行,空调的冷凝水排放, UPS 的待机时间,还有使用防雷插座,我们每周都要巡查一次,时间安排可以放在周五,赶在周末前确保正常工作状态。

你可能感兴趣的:(职场,休闲,排查,网络故障,节点机房)