LRU Cache

文章目录

  • 1. 什么是LRU Cache
  • 2. LRU Cache的实现
  • 3. LRU Cache的OJ
    • 题目分析
    • AC代码

1. 什么是LRU Cache

LRU是Least Recently Used的缩写,意思是最近最少使用,它是一种Cache替换算法
什么是Cache?
狭义的Cache指的是位于CPU和主存间的快速RAM, 通常它不像系统主存那样使用DRAM技术,而使用昂贵但较快速的SRAM技术。 广义上的Cache指的是位于速度相差较大的两种硬件之间, 用于协调两者数据传输速度差异的结构。除了CPU与主存之间有Cache, 内存与硬盘之间也有Cache,乃至在硬盘与网络之间也有某种意义上的Cache── 称为Internet临时文件夹或网络内容缓存等。
LRU Cache_第1张图片
而Cache的容量有限,那如果cache满了怎么办?
当Cache的容量用完后,而又有新的内容需要添加进来时, 就需要挑选并舍弃原有的部分内容,从而腾出空间来放新内容。
那应该选取那一部分的内容和新内容进行替换呢?这就涉及到cache的替换算法,而LRU Cache就是cache替换算法中的一种!
LRU Cache 的替换原则就是将最近最少使用的内容替换掉。其实,LRU译成最久未使用会更形象, 因为该算法每次替换掉的就是一段时间内最久没有使用过的内容。

2. LRU Cache的实现

那要实现一个LRU Cache其实并不难,方法和思路有很多;但是想要实现一个高效(所有操作都是O(1) )的LRU Cache是有难度的

实现LRU Cache的方法和思路很多,但是要保持高效实现O(1)的put和get,那么使用双向链表和哈希表的搭配是最高效和经典的。
使用双向链表是因为双向链表可以实现任意位置O(1)的插入和删除,使用哈希表是因为哈希表的增删查改也是O(1)。
LRU Cache_第2张图片

那具体到底应该应该怎么做呢?

下面我们借助LeetCode上的一道OJ来给大家进行一个详细的讲解。

3. LRU Cache的OJ

题目链接: link

我们来看一下题目:
LRU Cache_第3张图片
LRU Cache_第4张图片
大家可以自己先看一下题目,我们看到题目中要求函数 get 和 put 必须以 O(1) 的平均时间复杂度运行。

那我们来分析一下要如何实现

题目分析

题目要求我们实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。
这个 LRUCache 类的要求是这样的:

LRU Cache_第5张图片

那我们要如何实现呢?

其实分析完题目我们很容易能想到用哈希表,那当然C++里面我们就用unordered_map去搞,那这样的话get函数(其实就是查找嘛)就能达到O(1);然后put呢,put也是要查找嘛,找到就更新,找不到就插入。那这样就也是O(1)。
但是呢我们真正还要考虑还有——如果插入操作导致关键字数量超过 capacity ,我们此时就要进行LRU替换,则应该 逐出 最久未使用的关键字。
那我们要如何实现LRU的替换呢?满的话应该逐出谁啊?如何找到最久未被使用的那个呢?

,那上面也提到了,使用双向链表和哈希表的搭配是最高效和经典的:

LRU Cache_第6张图片
我们再搞一个list(list底层就是带头双向循环链表),让它里面也存储数据(相当于数据存储两份),然后我们可以默认认为尾部的那个元素就是最近最少用(最久未被使用)的(按头部实现也可)
然后如果有新插入的元素或者被访问(get一个已有的值)的元素我就把它移到链表头部。
这样我们需要替换的时候,那么链表尾部的那个就是最久未被使用的那个。

但是呢?

LRU Cache_第7张图片
如果我们就这样设计的话,还存在一个问题。
就是更新的时候其实复杂度是O(N)
为什么呢?
更新的情况就是调用put先在哈希表里面查找到key是已存在的,那然后我们要修改,哈希表里面我找到这个就可以直接修改。
但是,在list里面我们是不是也要修改啊,因为我们替换的时候找最久未被使用的那个值就是要从list里面找呢。
但是要修改list的话我们知不知道当前要修改的这个元素是list里面的哪一个元素?
是不知道的,所以还得遍历list去找。找到之后更新一下,然后把它移到头部去,更新顺序。
那这里遍历查找的话不就是O(N)了嘛。

那这个问题我们如何解决一下呢?

如何做到在哈希表里面找到这个key之后,就直接能获取到他在list中的位置,而不需要去遍历查找呢?

那这里有一个非常巧的设计是这样来解决的:

还是list和unordered_map搭配。
list里面呢还是存key-value的键值对pair。然后哈希表里面key还是要存的,但是不再像上面写的那样直接存key对应的数据value,而是存这个key对应的元素在list里面的对应的迭代器。(那这样真正的数据就只存在list里面)
LRU Cache_第8张图片
那这样的话如果更新的话,首先我们在哈希表里面找到key,然后通过它里面存的该元素在list中的迭代器,就可以直接修改list里面存放的数据。
然后再把它放到链表头部(两种方法,后面会提到)。
当然list>::iterator这个类型比较长,我们也可以typedef一下
LRU Cache_第9张图片

那下面我们来尝试写一下代码:

AC代码

那首先我们应该还要再增加一个成员变量:

即cache的容量capactity,因为有时候我们还需要判断cache满不满。
LRU Cache_第10张图片

然后我们来逐一实现一下它的3个成员函数:

LRU Cache_第11张图片

首先是它的构造函数LRUCache:

那这个很简单,就是初始化一下capacity就行了。
剩下两个成员变量是自定义类型,有默认构造。
在这里插入图片描述

那然后是get函数:

get呢也很简单,就是通过key判断在不在嘛。
如果在的话,就返回key对应的值;如果不在,返回-1。
那我们就可以直接调用unordered_map的find函数,根据find的返回结果判断,如果找到了,我们要返回什么呢?
LRU Cache_第12张图片
,首先这里的ret是啥啊,这里find返回的是迭代器,找到的话返回的就是key对应的这个元素的迭代器。
那我们要返回这个key对应的那个有效的值,那真正的数据是存在list里面的。
我们通过谁可以找到list里面存储的这个key对应的元素呢?
,现在unordered_map里面的value存的是list里面这个key对应元素的迭代器(有点绕了这里)。
LRU Cache_第13张图片
所以ret->second就是list里面这个元素的迭代器,但是我们想要拿到的是这个元素的key对应的值,即ret->second->second,这里要取两次second。
LRU Cache_第14张图片

,那这样就完了嘛?

还没有。
如果get的时候成功找到了这个数据,那相当于访问了它,那cache里面存储数据的顺序是不是就要调整了。是不是要把这个刚被访问的元素放到链表头部啊。

那如何在list里面调整这个顺序呢?我们上面提到有两种方式:

首先第一种方法我们可以先把这个元素删除掉,然后在头插到头部。
但是这样的话记得还要更新一下unordered_map里面存的对应的那个迭代器,因为删完之后这个迭代器就失效了。之前的文章我们模拟实现过list,我们知道list的迭代器其实就是对结点指针的封装嘛,这个结点删除的话它这个结点指针指向的空间就释放了。
所以这种方法好像有点麻烦。
那我就可以考虑用另外一种——直接调用list的splice 接口转移结点。
那splice 这个函数其实我们之前也有提到过
LRU Cache_第15张图片
它可以把一个链表的一部分转移到另一个链表(当然也可以是同一个链表直接进行转移)
所以我们就可以直接调用splice将这个结点转移到list的头部。
LRU Cache_第16张图片

那最后就剩下put:

那put的话呢无非就两种操作
如果关键字 key 已经存在,则变更其数据值 value ;如果不存在,则向缓存中插入该组 key-value 。
当然插入的时候需要判断:
如果插入操作导致关键字数量超过 capacity ,则应该 逐出 最久未使用的关键字,然后插入新值。
另外不论是插入还是更新,都应该把插入或更新的值放到链表头部。

那我们来写一下代码:

LRU Cache_第17张图片
,那到这里就完事了。

我们来提交一下:

LRU Cache_第18张图片
没有问题!

完整代码:

class LRUCache {
public:
    LRUCache(int capacity)
        :_capacity(capacity)
    {}
    
    int get(int key) {
        auto ret=_hashmap.find(key);
        if(ret!=_hashmap.end())
        {
            LtIter it=ret->second;
            //将it对应的结点转移到链表头部
            _LRUList.splice(_LRUList.begin(),_LRUList,it);
            return it->second;
        }
        return -1;
    }
    
    void put(int key, int value) {
        auto ret=_hashmap.find(key);
        //如果找到,更新值
        if(ret!=_hashmap.end())
        {
            LtIter it=ret->second;
            it->second=value;

            //将it对应的结点转移到链表头部
            _LRUList.splice(_LRUList.begin(),_LRUList,it);
        }
        else//找不到,插入
        {
            //如果满了需要先删除最久未使用的值
            if(_capacity==_hashmap.size())
            {
                pair<int,int> back=_LRUList.back();
                _hashmap.erase(back.first);
                _LRUList.pop_back();
            }
            //插入
            _LRUList.push_front(make_pair(key,value));
            _hashmap[key]=_LRUList.begin();
        }
    }
private:
    typedef list<pair<int,int>>::iterator LtIter;

    //hash做到查找更新/插入是O(1)
    unordered_map<int, LtIter> _hashmap;

    //LRU 默认链表尾部的是最久未被使用的
    list<pair<int, int>> _LRUList;

    size_t _capacity;
};

那我们这篇文章就到这里…

你可能感兴趣的:(C++入门到起飞,高阶数据结构(C++),LRU,cache,c++,数据结构,哈希表,链表)