收益如下:
成本如下:
缓存的使用场景基本包含如下两种:
缓存中的数据都是有生命周期的,需要在指定时间后被删除或更新,这样可以保证缓存空间在一个可控的范围。但是缓存中的数据会和数据源中的真实数据有一段时间窗口的不一致,需要利用某些策略进行更新。
建议:
使用缓存时,例如对于一条数据库中的数据,究竟是缓存全部属性还是只缓存部分重要属性呢?下面从通用性、空间占用、代码维护三个角度进行说明:
缓存穿透是指查询一个根本不存在的数据,缓存层和存储层都不命中,通常处于容错的考虑,如果从存储层查不到数据则不写入缓存层。
缓存穿透将导致不存在的数据每次请求都要到存储层去查询,失去了缓存保护后端存储的意义。
缓存穿透问题可能会导致后端存储负载加大,由于很多后端存储不具备高并发性,甚至可能造成后端存储宕掉。通常可以在程序中分别统计总调用数、缓存层命中数、存储层命中数,如果发现大量存储层空命中,可能就是出现了缓存穿透问题。
造成缓存穿透的基本原因有两个。第一,自身业务代码或者数据出现问题,第二,一些恶意攻击、爬虫等造成大量空命中。下面我们来看一下如何解决缓存穿透问题。
当数据库接收到不存在的数据请求时,我们可以将这个空对象回写到缓存层中,之后再访问这个数据就会走缓存了,我们可以通过设置一个较短的过期时间来清除这些数据,避免大量占用内存。
下面给出缓存空对象的实现代码:
String get(String key) {
// 从缓存中获取数据
String cacheValue = cache.get(key);
// 缓存为空
if (StringUtils.isBlank(cacheValue)) {
// 从存储中获取
String storageValue = storage.get(key);
cache.set(key, storageValue);
// 如果存储数据为空,需要设置一个过期时间(300秒)
if (storageValue == null) {
cache.expire(key, 60 * 5);
}
return storageValue;
} else {
// 缓存为空
return cacheValue;
}
}
如上图所示,在访问缓存层和存储层之前,将存在的key用布隆过滤器提前保存起来,做一层拦截。将非法的一定不存在的请求拦截掉,过滤掉非法请求。
方案对比:
解决缓存穿透 | 适用场景 | 维护成本 |
---|---|---|
缓存空对象 | 数据命中不高,数据频繁变化实时性高 | 代码维护简单,需要过多的存储空间,数据不一致 |
布隆过滤器 | 数据命中不高,数据相对固定实时性低 | 代码维护复杂,缓存空间占用少 |
缓存雪崩:由于缓存层承载着大量请求,有效的保护了存储层,但是如果缓存层由于某些原因不能提供服务,于是所有的请求都会到达存储层,存储层的调用量会暴增,造成存储层也会级联宕机的情况。
预防和解决缓存雪崩问题,可以从以下三个方面进行着手。
1)保证缓存层服务高可用性:可以从 Redis Sentinel 和 Redis Cluster 都实现了高可用。
2)依赖隔离组件为后端限流并降级:无论是缓存层还是存储层都会有出错的概率,可以将他们视同为资源。作为并发量较大的系统,加入有一个资源不可用,可能会造成线程全部阻塞在这个资源上,造成整个系统不可用。这种情况我们可以采用服务降级,可以通过使用 Hystrix 实现。
3)提前演练
开发人员使用”缓存+过期时间“的策略既可以加速数据读写,又保证数据的定时更新,这种模式基本满足绝大部分需求。但是有两个问题如果同时出现,可能就会对应用造成致命的危害:
在缓存失效的瞬间,有大量线程来重建缓存(如下图所示),造成后端负载加大,甚至可能会让应用奔溃。
要解决这个问题也不是很复杂,但是不能为了解决这个问题给系统带来更多的麻烦,所以需要制定如下目标:
此方法只允许一个线程重建缓存,其他线程等待重建缓存的线程执行完,重新从缓存获取数据即可,整个过程如下图所示。
下面代码使用Redis的setnx命令实现上述功能:
String get(String key) {
// 从Redis中获取数据
String value = redis.get(key);
// 如果value为空,则开始重构缓存
if(value == null) {
// 只允许一个线程重构缓存,使用nx,并设置过期时间ex
String mutexKey = "mutext:key:" + key;
if(redis.set(mutexKey, "1", "ex 180", "nx")) {
// 从数据源获取数据
value = db.get(key);
// 回写Redis,并设置过期时间
redis.setex(key, timeout, value);
// 删除key_mutex
redis.delete(mutex_key);
}
// 其他线程休息50毫秒后重试
else {
Thread.sleep(50);
get(key);
}
}
return value;
}
“永远不过期”包含两层意思:
整个过程如下图所示。
从实战看,此方法有效地杜绝了热点key产生的问题,但唯一不足的就是重构缓存期间,会出现数据不一致的情况,这取决于应用方是否容忍这种不一致。下面代码使用Redis进行模拟:
String get(final String key) {
V v = redis.get(key);
String value = v.getValue();
// 逻辑过期时间
long logicTimeout = v.getLogicTimeout();
// 如果逻辑过期时间小于当前时间,开始后台构建
if(v.logicTimeout <= System.currentTimeMillis()) {
String mutexKey = "mutex:key:" + key;
if(redis.set(mutexKey, "1", "ex 180", "nx")) {
// 重构缓存
threadPool.execute(new Runnable(){
public void run() {
String dbValue = db.get(key);
redis.set(key, dbvalue, newLogicTimeout);
redis.delete(mutexKey);
}
});
}
}
return value;
}
作为一个并发量较大的应用,在使用缓存时有三个目标:
下面将按照这三个维度对上述两种解决方案进行分析。
两种解决方法对比:
解决方案 | 优点 | 缺点 |
---|---|---|
简单分布式锁 | 思路简单,保证一致性 | 代码复杂度增大,存在死锁的风险,存在线程池阻塞的风险 |
“永远不过期” | 基本杜绝热点 key 问题 | 不保证一致性,逻辑过期时间增加代码维护成本和内存成本 |