本篇给大家讲网卡中断如何提高虚拟机性能。
KVM的网卡软中断技术介绍
(1)硬中断

由与系统相连的外设(比如网卡、硬盘)自动产生的。主要是用来通知操作系统外设状态的变化。比如当网卡收到数据包的时候,就会发出一个中断。我们通常所说的中断指的是硬中断(hardirq)。

(2)软中断

为了满足实时系统的要求,中断处理应该是越快越好。linux为了实现这个特点,当中断发生的时候,硬中断处理那些短时间就可以完成的工作,而将那些处理事件比较长的工作,放到中断之后来完成,也就是软中断(softirq)来完成。

(3)聊聊RSS,RPS ,RFS

receive side steering,RSS利用网卡的多队列特性,将每个核分别跟网卡的一个首发队列绑定,以达到网卡硬中断和软中断均衡的负载在各个CPU上。他要求网卡必须要支持多队列特性。

RPS是receive package steering,类似rss机制,通过直接转发包到各个cpu进程上,在软件级实现中断,有助于防止单个网络接口卡的硬件队列成为网络流量的瓶颈。

receive flow steering,RFS需要依赖于RPS,他跟RPS不同的是不再简单的依据packet来做hash,而是根据flow的特性,即application在哪个核上来运行去做hash,从而使得有更好的数据局部性。
玩转KVM: 了解网卡软中断RPS_第1张图片
在这之前,软中断只能在硬中断所在CPU上处理,使用RPS后,网卡软中断就可以分发到其他的CPU上去做处理了。

但是,我们知道,任何一个优化特性都不是普遍适用的,都有他特定的场景来应用。

很多人对此可能会有疑惑,那很多优化功能不是都已经作为默认配置了么,如果不是普遍适用的,干嘛还要作为默认配置呢?

其实很简单,一个优化特性可以作为默认配置,依据我的理解,只需要满足下面这些特征即可:

1.对某些场景可以显著提升性能

2.对大部分场景无害

3.对某一部分场景可能会损伤性能

4.所以Linux的很多配置都是可以灵活配置供选择的
KVM的网卡软中断实战
如果要设置RPS, RFS,则要满足以下条件:

1、虚拟机需要多线程

2、虚拟网卡需要支持多队列

系统默认是不开RPS

0(不开启rps功能)
玩转KVM: 了解网卡软中断RPS_第2张图片
one cpu per queue(每队列绑定到1个CPU核上)
玩转KVM: 了解网卡软中断RPS_第3张图片
all cpus per queue(每队列绑定到所有cpu核上)
玩转KVM: 了解网卡软中断RPS_第4张图片
总结
在极端情况下RPS可以获得非常好的性能,可惜实际情况下反而对整机整体负载有所妨害,主要是进程调度导致的(1)cpu缓存丢失导致,所以在应用负载已经非常高的情况下开启RPS是没意义的做法(开启RFS会稍微好转但是作用也不大)。

下图所示为不开启RPS的情况。可见左侧cpu存在较高的%sys负载,是因为网卡队列都绑定在左侧的几个cpu上。
玩转KVM: 了解网卡软中断RPS_第5张图片
下图所示为同时开启RPS的情况。可见%sys较为均衡,同时(2)整机负载略有上升。这是因为:收到网卡中断的CPU会向其他CPU发IPI中断,这体现在CPU的%irq上需要处理packet的cpu会收到NET_RX_SOFTIRQ软中断,这体现再CPU的%soft上。请注意,RPS并不会减少第一个CPU的软中断次数,但是会额外给其他的CPU增加软中断。他减少的是第一个CPU的软中断的执行时间,即软中断里不再需要那么多的时间去走协议栈做包解析,把这个时间给均摊到其他的CPU上去了。
玩转KVM: 了解网卡软中断RPS_第6张图片
所以优化还是要按实际情况来考虑的哦。
附录:
玩转KVM: 了解网卡软中断RPS_第7张图片
文章来自公众号:睿江云计算
玩转KVM: 了解网卡软中断RPS_第8张图片