Xen Credit调度算法

Credit调度算法的基本原理


Credit 调度算法是自 Xen3.0 版本以来使用的缺省的调度算法,其为一种按比例公平共享的非抢占式调度算法 Credit 调度算法为每一个 Guest 操作系统设置二元组 (weight cap) 各个Guest操作系统之间weight的比例决定它们各自占用CPU时间片的比例;而cap决定一个Guest操作系统用CPU时间的上限值 比如 cap=50 ,表示 Guest 操作系统只能最多只能占用半个物理 CPU 的所有时间, cap=100 ,表示 Guest 操作系统只能最多只能占用一个物理 CPU 的所有时间。

Credit 调度算法将各个虚拟 CPU 分为两个队列 under队列和over队列,它只调度Under队列中的虚拟CPU 最开始所有的虚拟CPU都在under队列,每个domain的初始Credit为其对应的weight;每当虚拟CPU被调度时,这个虚拟CPU对应的domainCredit就被减小,当发现虚拟CPU对应的domainCredit为负数时,这个虚拟CPU就被放入over队列;当所有的虚拟CPU都在over队列中时,Credit调度算法按比例为所有的domainCredit加上最初为domain设置的weight值,并把对应的虚拟CPU入至under队列;周而复始。 系统每次调度处于队首且优先级为 under VCPU 运行。当一个处理器空闲时或该处理器的就绪 VCPU 队列中无 under 优先级的 VCPU 时,它将查看其它处理器以找到一个可运行的 VCPU 到本处理器上运行。
 

目前,对 Credit 算法的研究主要集中在该算法对系统性能影响方面。其中, Ludmila Cherkasova 对该算法在 Xen 虚拟机管理器中上应用时的磁盘读写速度,网络吞吐量和 CPU 分配精度的影响进行了分析; Diego Ongaro 分析了 Credit 算法对 Xen 上虚拟机 I/O 性能的影响。

 

Credit调度算法的优缺点


Credit 调度算法的最大优点在于,它可以全局管理多个物理 CPU ,从而将 CPU 时间公平高效地分配给各个虚拟 CPU 。它可以用 SMP 的方式将各个物理 CPU 分配给务个虚拟 CPU ,实现负载平衡:它可以通过调节 Guest 操作系统的 cap 参数很好的实现 Non-Working-Conserving(NWC) 调度模式,使得管理员可以很容易地控制物理 CPU 的分配情况。
 
Credit 调度算法的缺点在于不能保证实时性,响应速度要求较高的应用中,事件响应延迟与其所处的队列位置密切相关,响应延迟 普遍较长且波动明显。该算法的全局负载平衡策略过于简单,仍易导致处理器因进程未就绪而空闲的情况。由于全局分配而产生的 CPU 分配错误率比较高,使得管理更加复杂。



Each VM is assigned a weight and a cap. If the cap is 0, then
the VM can receive any extra CPU (WC-mode). A non-zero cap
(expressed as a percentage) limits the amount of CPU a VM receives
(NWC-mode). The Credit scheduler uses 30 ms time slices for CPU
allocation. A VM (VCPU) receives 30 ms before being preempted
to run another VM. Once every 30 ms, the priorities (credits) of all
runnable VMs are recalculated. The scheduler monitors resource
usage every 10 ms. To some degree, Credit’s computation of credits
resembles virtual time computation in BVT. However, BVT has a
context switch allowance C for defining a different size of the basic
time slice (time quantum), and an additional low-latency support (via
warp) for real-time applications.
In summary, Credit has the following features:
? non-preemptive, WC and NWC modes;
? global load balancing on multiprocessors.
In the next section, we present results of a performance study comparing
these schedulers and their features in more detail.

Domain有两种状态,UNDER和OVER。OVER表示虚拟机的credit值已用完,UNDER表示credit值还有剩余。在进行调度时,调度器只关心虚拟机所处的状态,而不会进一步关心其剩余的credit值,处于UNDER状态的虚拟机优先于OVER状态的虚拟机被调度,只有当UNDER状态的虚拟机都无法运行时才会调度到OVER状态的虚拟机,所以,只有当处理器空闲时才允许破坏credit的公平性调度策略。处于相同状态的虚拟机按照先进先出的方式运行,当处于队列首部的虚拟机被调度到时,在其credit值足够的情况下,允许其运行三个调度时长,即30ms。系统每隔10ms触发一次调度中断,当前正在运行的虚拟机会被减掉100个credit,当所有虚拟机的credit值总和变为负值时,为所有虚拟机重新分配credit:

1.每个物理CPU下面都有一个虚拟CPU的运行队列

2.每个运行队列中的VCPU都有一个credit值

3. credit表示VCPU的priority的价值

4.CPU调度的是最先入队的处于under状态下的VCPU

5.每10msec 为一个时间片,相应一次中断。如果被调度的VCPU的credit处于OVER状态那么它将不再被继续调度,重新计算credit值,调度后面的处于under状态下的第一个VCPU

6.如果进行了3个时间片也就是30msec时,原先的VCPU还是没有处于OVER状态,那么这个VCPU也将不被继续调度,credit值的重计算,同5后面的步骤

7.代码中的计算公式VCPU的credit = credit –CSCHED_CREDITS_PER_TICK (100)+30msec/n(VCPU的数)

8.处于OVER状态的VCPU credit的值不被增加。

你可能感兴趣的:(xen)