网络设备频繁重启故障排查

 IT运维狗该文章来自运维某大佬,供大家学习。

在运维过程中,有时会出现设备频繁重启现象。导致这种故障的原因一般有以下几种:

一、温度过高问题。

设备所在周边环境温度过高,当设备温度达到预设值,会有保护机制,进行重启降低温度。常见温度过高原因有弱电井环境恶劣、设备风扇异常、机房空调制冷不足、设备之间密度过大。温度过高还会导致设备性能下降,缩短使用寿命。

      检测方法:可使用手摸法检测,看设备是不是发烫,查看设备的排风口风扇是不是不转,手放排风口,感应有无风被排出。

       解决方法:如果还在保修期,则返厂保修;如果已过保,临时的办法使用外置风扇对着设备排风口吹,或者打开外壳,用风扇吹;再根据设备风扇的尺寸,及时购买新的设备风扇进行更换。若是设备之间密度过大,则适当调整之间空隙。

二、电源供电不稳

 电源供电不稳也是设备重启的一个原因。设备的电源要求有一个范围,当电源电压浮动超过这个范围时,就会造成设备重启。这种情况也可能时电源接触不良造成。


        检测方法:1、建议直接测试电压是否在额定范围内,坏了及时更换。 2、观看面板上的POWER指示灯是绿色的,就表示是正常的;如果该指示灯灭了或不停闪烁,则说明设备的供电异常。如果是模块式电源,登录设备查看电源模块的运行情况。

        解决方法:1、电源适配器如果还在保修期,则返厂保修;如果已过保,则建议另购买一个电源模块。2、如果是电源供电不稳,建议增加一个前置稳压器。3、若接触不良,则重新拔插电源接口。

三、环路原因

一旦网络中存在环路,就会产生大量的广播风暴,大量的数据流会占用所有带宽,导致设备“死机”,重启过后一会设备又会“死机”。

        检测方法:当设备存在环路,设备的灯会狂闪,一眼就可以识别。

        解决方法:拔掉设备上所有网线,然后一根根插,插网线的速度稍微慢点,当插到哪根网线,设备灯又狂闪,说明哪根网线有问题,然后去找这根网线的另一头接什么设备,顺藤摸瓜,一会就可以解决。

四、设备硬件问题。

 设备可正常启动,但是当运行到某一功能时,由于硬件损坏导致操作无法进行导致重启。常见有比如电容鼓包,元件老化等。

        检测方法:如果设备没有发烫,网络中又没有环路,基本可以判断是设备硬件故障。为了更确切些,拔掉设备上所有网线,设备上只接路由器和一台电脑,如果一会设备又断网了,那就可以断定是设备有故障。

        解决办法:硬件故障我们个人是无法维修的,如果设备还在保修期,那就及时去保修;如果过保了,那只能去第三方维修店维修或更换新的设备。

你可能感兴趣的:(网络设备频繁重启故障排查)