企业网络故障多是集中在接入层,对于规模较大的企业,会有多个节点机房,而这些节点机房往往是容易出现故障的地方。这是由于节点机房跟IT办公室的距离较远,管理维护人员遇到问题先从中心机房找起,最后才排查到节点机房,我们在日常工作中遇到多是网络连接异常,导致无法上网,获得IP地址,连不上公共盘。
 
这些问题出现时,我们先去判断是个别问题,还是所有问题,或是集中在某一区域,从而来缩小范围,用户不知道出现问题的原因,我们要通过跟用户沟通来获取更多的信息,究竟是怎么一回事?用户会反馈,我们这个办公室好几个人都遇到同样的问题,那么可以说是用户所处的节点机房出问题。我们要赶到节点机房去找原因。事实上,企业都会划分VLAN,将不同的部门划分为不通的VLAN,这样相互之间不会影响,即使出现问题也仅仅是少部分人的问题,不致于导致整个企业网络故障。不过,我们遇到一次交换机环路,从而导致企业的DHCP服务器出现问题,这台DHCP服务器是在虚机上的,当时某个节点在办公室使用小SWITCH,把一根网线的两头都插上去,这个问题直接影响到企业好多人使用,原因是节点的2950可以传播DHCP。等到网络恢复正常之后,有人报告他所处在的办公室都不能登邮箱,去节点机房发现2950有一个端口指示变成橙色,应该跟这个端口接的D-LINK有关,把所有端口亮灯的跳线拔出,从而将有问题的隔离,等到2950恢复正常之后,再逐个插上,过程中间留上3秒,从而找到问题端口在配线架的位置,然后根据网络端口图找到对应位置,发现原因所在,解决问题。在企业中使用SWITCH要特别注意环路,遇到网络端口不足,或是会议室临时增加的,我们一定要做好登记,严格控制SWITCH在用户端的使用,出现环路是很严重的。
 
同样,如果某台电脑感染病毒,类似“机器狗”的ARP病毒,也会产生严重的问题,导致同一VLAN的计算机无法访问网络资源,我们尝试PING网关失败,从中心机房开始找起,对有可能有问题的节点机房连接依次断开,检查是那个机房的断开后网络OK,从而将问题缩小化,然后再拿笔记本去节点机房测试,发现能够获得192.168的地址,如果节点机房和中心机房断开的话,是无法获得IP地址,只能是169的,由此可以是ARP病毒导致,观察具体哪个端口灯闪亮频率高,观察断开之后的网络状态,最后发现这台电脑系统异常,原因是病毒导致。
 
网络设备老化也是问题产生的原因。节点机房也有空调制冷,但是环境比较差,灰尘比较多,对设备的影响比较明显,导致设备时好时坏,一次节点机房连不通,由于是使用“光猫”连接,发现上面的6个指示灯有1个不亮,断电重启之后恢复正常,过了一会又不亮,测试结果是设备老化导致,更换之后没有问题。我们的经验是看设备的指示灯,正常工作状态是深绿闪亮,出现问题指示灯的颜色会变浅,闪亮频率降低,对于使用3年以上的网络交换机,出现端口故障是很正常的,有时换个端口就OK,但最好是换设备,我们不能让设备“带病工作”,说不定哪天就OVER,造成更大的损失。D-LINK的交换机在企业使用的较多,我们对于3年以上的、流量大要定期检查,曾经遇到交换机灯的颜色是浅绿,用户的IP地址都是169的,典型的跟2950之间不通,从2950上找跟各个交换机的跳线,最后发现是这台交换机的问题,更换之后恢复正常。由于交换机出现问题很隐蔽,我们要从2950上找起,对于指示灯异常的我们就要先观察后判断,这样才能真正解决问题。
 
还有就是不同网段的设备是不能使用同一台D-LINK交换机,企业中会有共享的网络设备,比如:网络打印机、门禁考勤机等,这些设备为了方便管理,通常是使用保留的一段IP地址,在节点机房就要直接连在2950的端口上,2950会跟路由器之间用TRUNK,这样网络设备才能使用,使用端口划分VLAN,在到D-LINK交换机上接入设备,这是企业经常使用的方法。我们还要注意的是,网络设备尽量使用固定IP地址,可以减少维护的复杂性,在企业中对网络设备和计算机是不能同样对待,有的网络设备也有DHCP分配IP地址的功能,企业网络管理中尽可能避免出现的。节点机房的日常维护很重要,我们要确保门窗安全,外人无法进入,空调制冷、UPS的正常运行,空调的冷凝水排放,UPS的待机时间,还有使用防雷插座,我们每周都要巡查一次,时间安排可以放在周五,赶在周末前确保正常工作状态。