缓存替换算法笔记 ——2Q

参考资料

  1. 2Q: A Low Overhead High Performance Buffer Management Replacement Algorithm

算法描述

2Q: two queue(s) algorithm

应用最广泛的缓存替换算法应该是LRU了,其实现简单有效。但正是因为其简单,对于某些访问场景来说表现并不出色。LRU用新访问页替换冷页,但新换入的页在之后可能再也不会访问到,不仅如此它还会在内存中停留很长时间才会淘汰出去。之后LRU-K算法被提出,跟踪倒数第K次内存页引用的时间,以确保冷页能够尽快淘汰出去。

在O'Neil-Weikum 的论文提出了LRU/2算法,即K=2情况下的LRU-K,相对于LRU的提升在于采用了更加积极一些的置换策略,从而将冷页换出,换出的操作涉及到优先队列的操作。 相对于其他缓存替换算法来说,LRU/2 虽然是自适应的,但还是有两个参数需要关注优化。首先是 Correlated Reference Period(关联引用间隔),即缓存在被访问后在内存中停留的时间。在LRU/2中 同一进程连续的访问(correlated accesses)可以在buffer中获得该页,但如果是多个进程连续访问这一page的情况,该页并不会获得更高的优先级。 第二个参数 Retained Information Period,指在缓存被淘汰后其访问记录还会被保留多久。作者建议设置为200秒,但更高的值也不会有太坏的影响。

2Q与LRU/2对于LRU的改进在某种程度上存在互补性,2Q并不是通过直接将冷页从主缓存中剔出,而是通过将热页换入的形式来实现。与LRU/2算法类似,2Q以该页的第二次被访问时间来计算。简单来说,在某一页第一次被访问的时候,2Q将其放入一个特殊的缓冲区,称为A1 queue,其实现就是一个FIFO队列,如果该页在A1 queue的生存周期内被再次访问,则可能是热页,将其置入Am queue,其实就是一个LRU。如果在A1 queue的生存期内没有再次被访问到,则将其换出。

实现

if p is on the Am queue
then
    put p on the front of Am queue
    /* Am is managed as an LRU queue */
else if p is on the A1 queue
then
    remove p from the A1 queue
    put p on the front of Am queue
else /* first access we know about concerning p */
    /* find a free page slot for p */
    if there are free page slots available
    then
        put p in a free page slot
    else if A1's size is above a (tunable) threshold
        delete from the tail of A1
        put p in the freed page slot
    else
        delete from the tail of Am
        put p in the freed page slot
endif
    put p on the front of the A1 queue
endif

测试后发现这种解决方案对于平 均分布的访问请求表现良好,但在实际应用场景中性能不佳。在现实应用中, 访问的区域性变化很大,例如有些页会在短时间内频繁访问,之后很长时间没 有访问了。改进后的2Q将 A1 队列分成 A1in 和 A1out。第一 次访问会进入 A1in,但之后直接进入 A1out,在 A1out 中被引用的页则进入 Am。

// if there is space, we give it to X
// if there is no space, we free a page slot to
// make room for page X
reclaimfor(page X)
begin
    if there are free page slots then
        put X into a page slot
    else if(|A1in| > Kin)
        page out the tail of A1in; call it Y
        add identifier of Y to the head of A1out
        if (|A1out| > Kout)
            remove identifer of Z from
            the tail of A1out
        endif
        put X into the reclaimed page slot
    else
        page out the tail of Am, call it Y
        // do not put it A1out; it hasn't been
        // accessed for a while
put X into the reclaimed page slot
    endif
end
On accessing a page X:
begin
    if X is in Am then
        move X to the head of Am
    else if (X is in A1out) then
        reclaimfor(X) //这块感觉有点问题,X的空间应该已经在进入A1in的时候准备好了?
        add X to the head of Am
    else if (X is in A1in) // do nothing 
    else //Xisinnoqueue
        reclaimfor(X)
        add X to he head of A1in
    endif
end

理论基础

在 2Q 算法中,A1 队列作为过滤器存在,数据只有在进入 A1out 队列后再 次被访问才能进入 Am 队列。假设 miss(与 A0 算法比较后认为是判断失误的部 分) 的几率是 m,且 A1out 队列空间为 f。因为 A1out 队列经常是满的 (miss 率远大于 A1out 的命中率),因此忽略命中的情况下对A1out的影响。这样一来,数据在进入 A1out 队列后经过 f/m 次的访问如果被访问到则会进入 Am 队列,我们将这个概率称作  paccept 。 假设对象 i 被访问的几率是 pi,该对象在第 k 次访问后由 A1out 进入 Am 队 列的几率是  pi(1pi)k1 ,由此得出:

paccept=k=1f/mpi(1pi)k1=1(1pi)f/m

paccept 的概率随着pi的增大而趋近于1,随着 pi 的减小而趋近与零,因此A1out起到了过滤冷页的作用。我们可以将A1out 过滤器的cutoff hotness定义为访问概率, pcutoff , 在 paccept=1/2 的情况下,  paccept 的derivative很大, 被访问概率为 pcutoff 的对象在经过三次而不是两次访问后将被换入Am队列。因此,对于以下方程:

1(1pi)f/m=1/2

得出其概率。在f和m已知的情况下,我们可以推算出 paccept 的概率为50%的对象的访问率,

pcutoff=1(1/2)m/fmln(2)/f

(估算是通过泰勒级数展开,在 m/f0.1 的情况下误差小于4%)

从上式中可以看到A1out过滤器能够自调整,当miss率高的时候, pcuttoff 也会相对较高,因此只会将最热的那些对象换入,miss率低时则中度热对象则有足够的几率换入。

接下来,假设p_i和m已知,可以得到在 paccept 的条件下的 f=fcrit :

fcrit=mln(2)/ln(1pi)mln(2)/pi

估算成立的条件是是  ln(1pi)pi .如果已知Am队列中的访问频率下限,就可以得出f,但是在这里无法预先得知访问概率(否则就直接使用A0算法了)。为了粗略的估算,让我们找出  f=fapprox 的值,可以有%50的概率将平均热度的对象放入Am队列,如果miss率是m且Am的size是B,buffer中一个对象的平均访问概率是 (1m)/B ,用 fcrit 替换 f ,我们可以得到

fapprox=ln(2)mB1m

由于以上公式要求预估miss率,实际意义有限。但是它说明了A1out的size与buffer size的比例应该是固定的B。模拟实验表明在m的值在10%到90%之间时,这个比例应该是1/2,对于m更小的系统A1out队列的size也应该更小。

Am的size一般是数据全集的一小部分,设D为数据全集,并且  B=rD ,得出

pcutoff=2mln(2)/(rD)

冷数据的平均访问几率是  m/(1r)D 。假设  X=m/D ,我们可以得出冷数据的平均访问几率是 11rX ,因此:

pcutoff=2ln(2)rX

因为r很小, 2ln(2)r11r ,在  f=B/2 的情况下只要 r 足够小便可以过滤掉冷数据。不仅如此  fapprox/B=1/2 得出 m=1/(1+2ln(2))0.419 。只要m不大, fapprox 的值波动不会很大(如果m很大那也没什么办法了),可以得出该算法的性能对于 f 的设置并不敏感, f=B/2 的设置基本上总是不错的。

PS:文中所述的A0算法应该指 Belady's Algorithm

你可能感兴趣的:(缓存替换算法笔记 ——2Q)