Dell R510,R610/710服务器网卡问题(自动关闭)

转自:http://hi.baidu.com/moonelf9989/blog/item/5df24e38143cb030b9998f7f.html

感谢南极兄弟,呵呵。

Dell R610/R710 RHEL/CENTOS 5 32/64 网卡驱动升级

2012.04.26 17:30

Centos 5.X 版本中的Broadcom NetXtreme II BCM 5709网卡驱动有BUG,导致网卡在有负载时候喜欢中断,ifconfig查看会发现(我们这边没有发现以下错误,我们的错误是:

Apr 26 12:40:02 image kernel: bnx2: eth1 NIC Copper Link is Down

Apr 26 12:40:05 image kernel: bnx2: eth1 NIC Copper Link is Up, 100 Mbps full duplex):

RX packets:10487593 errors:4756121 dropped:0 overruns:0 frame:4756121
TX packets:10829687 errors:0 dropped:0 overruns:0 carrier:0

重启网卡后恢复正常,一定时间后,故障依然。

解决方法:  升级网卡驱动

查看网卡型号:/sbin/lspci |grep Ethernet

01:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)

先看当前网卡驱动版本:

/sbin/modinfo bnx2

filename:       /lib/modules/2.6.18-194.el5/kernel/drivers/net/bnx2.ko

version:        2.0.2

然后下载更新驱动:

http://www.broadcom.com/support/ethernet_nic/netxtremeii.php

下载对应系统的网卡驱动linux-7.0.36.zip

mkdir /usr/local/src/network

cd /usr/local/src/network/

http://zh-cn.broadcom.com/support/license.php?file=NXII/linux-7.0.36.zip

unzip linux_7.0.36.zip

cd Server/Linux/Driver/

rpm -ivh netxtreme2-7.0.36-1.src.rpm

cd /usr/src/redhat/

rpmbuild -bb SPECS/netxtreme2.spec

rpm -ivh RPMS/x86_64/netxtreme2-7.0.36-1.x86_64.rpm

好了,驱动都安装上了,然后有2个方法让新驱动起效,一是重启服务器。如果不便重启的话,以下是第二种:

但过程会导致网络断开,而且没有人工干预,会无法连上。所以如果你并不在本地操作,或者你的服务器与您相隔甚远,建议三思后行。

rmmod bnx2 #卸载现有驱动[注意!!!会导致网络中断]

modprobe bnx2  #[重新加载驱动]

但是,如果你非逼不得已。可以用以下小方法:

把以上2个命令写成一个 sh 脚本

vim lan_dr_up.sh

rmmod bnx2

modprobe bnx2

:wq

然后赐予可执行权限

chmod +x lan_dr_up.sh

 ./lan_dr_up.sh &  [留意,在执行命令后方带有&符号,意思是让该命令在后台执行就算ssh控制端掉线了,服务器还能自主把新的网卡驱动重新加载。](Deven:我们就是采用这种方式,但是奇怪了,我们这样执行ssh并没有中断,只是ping的时候有3s丢包)

好了,下边我们再次查看网卡驱动的版本号

/sbin/modinfo bnx2

filename:       /lib/modules/2.6.18-194.el5/updates/bnx2.ko

version:        2.1.12b

故障暂时解决,还要观察一段时间

如果想要还原只需要rpm -e netxtreme2 即可。

 转自:http://space.itpub.net/8183550/viewspace-694885 

Dell R610/710服务器网卡在使用过程中可能会中断,导致GP,hadoop不正常工作,或者无法连接master或NAMENODE,需要手工重启网卡。导致这种问题的原因是dell服务器使用的Broadcom NetXtreme II BCM 5709在centos(或REDHAT)操作系统上的驱动存在问题,导致网卡工作时,ACPI(节电服务)以为网卡闲着,关掉网卡。
       所以可以尝试采用两种方式解决该问题,第一,升级网卡驱动。网卡驱动的下载地址http://www.broadcom.com/support/ethernet_nic/downloaddrivers.php
      第二种方式是尝试关闭ACPI节电服务。 

 

你可能感兴趣的:(DELL服务器网卡自动关闭)