转自:http://hi.baidu.com/moonelf9989/blog/item/5df24e38143cb030b9998f7f.html
感谢南极兄弟,呵呵。
Dell R610/R710 RHEL/CENTOS 5 32/64 网卡驱动升级
2012.04.26 17:30
Centos 5.X 版本中的Broadcom NetXtreme II BCM 5709网卡驱动有BUG,导致网卡在有负载时候喜欢中断,ifconfig查看会发现(我们这边没有发现以下错误,我们的错误是: Apr 26 12:40:02 image kernel: bnx2: eth1 NIC Copper Link is Down Apr 26 12:40:05 image kernel: bnx2: eth1 NIC Copper Link is Up, 100 Mbps full duplex): RX packets:10487593 errors:4756121 dropped:0 overruns:0 frame:4756121 重启网卡后恢复正常,一定时间后,故障依然。 解决方法: 升级网卡驱动 查看网卡型号:/sbin/lspci |grep Ethernet 01:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20) 先看当前网卡驱动版本: /sbin/modinfo bnx2 filename: /lib/modules/2.6.18-194.el5/kernel/drivers/net/bnx2.ko version: 2.0.2 然后下载更新驱动: http://www.broadcom.com/support/ethernet_nic/netxtremeii.php 下载对应系统的网卡驱动linux-7.0.36.zip mkdir /usr/local/src/network cd /usr/local/src/network/ http://zh-cn.broadcom.com/support/license.php?file=NXII/linux-7.0.36.zip unzip linux_7.0.36.zip cd Server/Linux/Driver/ rpm -ivh netxtreme2-7.0.36-1.src.rpm cd /usr/src/redhat/ rpmbuild -bb SPECS/netxtreme2.spec rpm -ivh RPMS/x86_64/netxtreme2-7.0.36-1.x86_64.rpm
好了,驱动都安装上了,然后有2个方法让新驱动起效,一是重启服务器。如果不便重启的话,以下是第二种: 但过程会导致网络断开,而且没有人工干预,会无法连上。所以如果你并不在本地操作,或者你的服务器与您相隔甚远,建议三思后行。 rmmod bnx2 #卸载现有驱动[注意!!!会导致网络中断] modprobe bnx2 #[重新加载驱动] 但是,如果你非逼不得已。可以用以下小方法: 把以上2个命令写成一个 sh 脚本 vim lan_dr_up.sh rmmod bnx2 modprobe bnx2 :wq 然后赐予可执行权限 chmod +x lan_dr_up.sh ./lan_dr_up.sh & [留意,在执行命令后方带有&符号,意思是让该命令在后台执行就算ssh控制端掉线了,服务器还能自主把新的网卡驱动重新加载。](Deven:我们就是采用这种方式,但是奇怪了,我们这样执行ssh并没有中断,只是ping的时候有3s丢包) 好了,下边我们再次查看网卡驱动的版本号 /sbin/modinfo bnx2 filename: /lib/modules/2.6.18-194.el5/updates/bnx2.ko version: 2.1.12b
故障暂时解决,还要观察一段时间
如果想要还原只需要rpm -e netxtreme2 即可。 |
转自:http://space.itpub.net/8183550/viewspace-694885
Dell R610/710服务器网卡在使用过程中可能会中断,导致GP,hadoop不正常工作,或者无法连接master或NAMENODE,需要手工重启网卡。导致这种问题的原因是dell服务器使用的Broadcom NetXtreme II BCM 5709在centos(或REDHAT)操作系统上的驱动存在问题,导致网卡工作时,ACPI(节电服务)以为网卡闲着,关掉网卡。
所以可以尝试采用两种方式解决该问题,第一,升级网卡驱动。网卡驱动的下载地址http://www.broadcom.com/support/ethernet_nic/downloaddrivers.php
第二种方式是尝试关闭ACPI节电服务。