请你为 最不经常使用(LFU)缓存算法设计并实现数据结构。
实现 LFUCache 类:
LFUCache(int capacity) - 用数据结构的容量 capacity 初始化对象
int get(int key) - 如果键 key 存在于缓存中,则获取键的值,否则返回 -1 。
void put(int key, int value) - 如果键 key 已存在,则变更其值;如果键不存在,请插入键值对。当缓存达到其容量 capacity 时,则应该在插入新项之前,移除最不经常使用的项。在此问题中,当存在平局(即两个或更多个键具有相同使用频率)时,应该去除 最近最久未使用 的键。
为了确定最不常使用的键,可以为缓存中的每个键维护一个 使用计数器 。使用计数最小的键是最久未使用的键。
当一个键首次插入到缓存中时,它的使用计数器被设置为 1 (由于 put 操作)。对缓存中的键执行 get 或 put 操作,使用计数器的值将会递增。
函数 get 和 put 必须以 O(1) 的平均时间复杂度运行。
输入:
["LFUCache", "put", "put", "get", "put", "get", "get", "put", "get", "get", "get"]
[[2], [1, 1], [2, 2], [1], [3, 3], [2], [3], [4, 4], [1], [3], [4]]
输出:
[null, null, null, 1, null, -1, 3, null, -1, 3, 4]
解释:
// cnt(x) = 键 x 的使用计数
// cache=[] 将显示最后一次使用的顺序(最左边的元素是最近的)
LFUCache lfu = new LFUCache(2);
lfu.put(1, 1); // cache=[1,_], cnt(1)=1
lfu.put(2, 2); // cache=[2,1], cnt(2)=1, cnt(1)=1
lfu.get(1); // 返回 1
// cache=[1,2], cnt(2)=1, cnt(1)=2
lfu.put(3, 3); // 去除键 2 ,因为 cnt(2)=1 ,使用计数最小
// cache=[3,1], cnt(3)=1, cnt(1)=2
lfu.get(2); // 返回 -1(未找到)
lfu.get(3); // 返回 3
// cache=[3,1], cnt(3)=2, cnt(1)=2
lfu.put(4, 4); // 去除键 1 ,1 和 3 的 cnt 相同,但 1 最久未使用
// cache=[4,3], cnt(4)=1, cnt(3)=2
lfu.get(1); // 返回 -1(未找到)
lfu.get(3); // 返回 3
// cache=[3,4], cnt(4)=1, cnt(3)=3
lfu.get(4); // 返回 4
// cache=[3,4], cnt(4)=2, cnt(3)=3
LFU难度大于LRU,LRU使用链表较好实现,但是LFU算法相当于是淘汰访问频次最低的数据,如果访问频次最低的数据有多条,需要淘汰最旧的数据。
①get(key)方法会去缓存中查询键key,如果key已存在,则返回key对应的val值,不存在则返回-1。
②put(key,value)方法插入或修改缓存。如果key已经存在,则将它对应的值改为value;如果key不存在,则插入键值对
③当缓存达到容量capacity时,则应该在插入新的键值对之前,删除使用频次最低的键值对。如果频次最低的键值对有多个,则删除最旧的那一个。
解决办法:
①使用一个HashMap存储key到val的映射
②使用一个HashMap存储key到freq的映射
③核心:
1.肯定需要freq到key的映射,用来找到freq最小的key
2.freq最小的key,那需要快速得到当前所有key中最小的freq - > 用一个变量minFreq来记录最小的freq。
3.可能多个key拥有相同的freq,所以freq对key是一对多的关系,一个freq对应一个key的列表。
4.希望freq对应的key的列表是按照时序存储的,便于快速查找并删除最旧的key
5.希望快速删除key列表中的任何一个key,如果频次为freq的某个key被访问,那么它的频次freq+1,就该从freq对应的key列表删除,加入到freq+1对应的key的列表中。
3,4,5可以用HashMap
这个结构,其实就是我实现LRU的时候,哈希表+双向链表。
这里我将①②用的哈希表合并成一个了,用HashMap
class LFUCache {
int capacity;
//这个哈希表存
HashMap keyToValAndFreq;
//LinkedHashSet具有set集合不重复的特点,同时具有可预测的迭代顺序,也就是我们插入的顺序。
//这个哈希表存freq -> keys的映射
HashMap> freqToKeys;
int minFreq;
public LFUCache(int capacity) {
keyToValAndFreq = new HashMap<>();
freqToKeys = new HashMap<>();
this.minFreq = 0;
this.capacity = capacity;
}
//从keyToValAndFreq获取key对应的val,同时给freq+1
//移动该key从freq的链表->freq+1的链表
public int get(int key) {
if(keyToValAndFreq.containsKey(key)){
int[] tmp = keyToValAndFreq.get(key);
//修改frep值
int freq = tmp[1];
tmp[1] = freq + 1;
//写回
keyToValAndFreq.put(key,tmp);
//将key从freq移动到freq+1对应的映射链表
LinkedHashSet keyList1 = freqToKeys.get(freq);
keyList1.remove(key);
if(keyList1.isEmpty()){
freqToKeys.remove(freq);
//如果最小的频次列表为空了
if(freq == this.minFreq){
this.minFreq++;
}
}
LinkedHashSet keyList2 = freqToKeys.getOrDefault(freq + 1,new LinkedHashSet());
keyList2.add(key);
freqToKeys.put(freq + 1,keyList2);
return tmp[0];
}
return -1;
}
public void put(int key, int value) {
if(capacity <= 0) return;
if(keyToValAndFreq.containsKey(key)){
int[] tmp = keyToValAndFreq.get(key);
//修改frep值
int freq = tmp[1];
tmp[1] = freq + 1;
tmp[0] = value;
//写回
keyToValAndFreq.put(key,tmp);
//将key从freq移动到freq+1对应的映射链表
LinkedHashSet keyList1 = freqToKeys.get(freq);
keyList1.remove(key);
if(keyList1.isEmpty()){
freqToKeys.remove(freq);
if(freq == this.minFreq){
this.minFreq++;
}
}
LinkedHashSet keyList2 = freqToKeys.getOrDefault(freq + 1,new LinkedHashSet());
keyList2.add(key);
freqToKeys.put(freq + 1,keyList2);
}else{
if(keyToValAndFreq.size() >= capacity){
//找到使用频率最小的
LinkedHashSet keyList = freqToKeys.get(this.minFreq);
int tmpKey = keyList.iterator().next();
keyList.remove(tmpKey);
if(keyList.isEmpty()){
freqToKeys.remove(this.minFreq);
}
keyToValAndFreq.remove(tmpKey);
}
//加入新的
int[] tmp = new int[2];
tmp[0] = value;
tmp[1] = 1;
keyToValAndFreq.put(key,tmp);
LinkedHashSet keyList_1 = freqToKeys.getOrDefault(1,new LinkedHashSet());
keyList_1.add(key);
freqToKeys.put(1,keyList_1);
this.minFreq = 1;
}
}
}
/**
* Your LFUCache object will be instantiated and called as such:
* LFUCache obj = new LFUCache(capacity);
* int param_1 = obj.get(key);
* obj.put(key,value);
*/
然后其实get和set代码有重复的,比如可以将key从freq移动到freq+1对应的映射链表上封装起来,然后调用,会使代码好看一点。