openstack运维中发现有一个计算节点的存储网卡不停的down,摘取部分系统日志如下:

Aug 29 06:25:59 compute8 kernel: ixgbe 0000:86:00.0 enp134s0f0: NIC Link is Down
Aug 29 06:26:00 compute8 kernel: ixgbe 0000:86:00.0 enp134s0f0: NIC Link is Up 10 Gbps, Flow Control: RX/TX
Aug 29 06:26:00 compute8 kernel: ixgbe 0000:86:00.0 enp134s0f0: NIC Link is Down
Aug 29 06:26:00 compute8 kernel: ixgbe 0000:86:00.0 enp134s0f0: NIC Link is Up 10 Gbps, Flow Control: RX/TX

查询flow controll资料:https://communities.intel.com/community/tech/wired/blog/2012/01/13/go-with-the-flow-control

大意是 flow control 作用是在网卡之间控制流量的,当一方网卡收到的流量大于可以自身可以承受的流量时会告知对端并 tx_flow_control_xoff 计数增加,对端收到通知时 rx_flow_control_xoff 计数增加。

出现这种问题原因猜想有可能是网卡硬件问题。