目录
概要
缓存穿透
什么是缓存穿透
缓存穿透解决办法
如何回答缓存穿透问题
缓存击穿
什么是缓存击穿
缓存击穿解决办法
如何回答缓存击穿问题
缓存雪崩
什么是缓存雪崩
缓存雪崩解决办法
如何回答缓存雪崩问题
问题:我看你做的项目中,都用到了Redis, 你在最近的项目中哪些场景使用了redis呢?
一般回答:
缓存 缓存三兄弟(穿透、击穿、雪崩)、双写一致、持久化、数据过期策略、数据淘汰策略
分布式锁 setnx、redisson
消息队列、延迟队列 何种数据类型
这一章节我简单描述一下缓存三兄弟的回答,写的可能不太好,大家仅供参考,谢谢。
缓存穿透:查询一个不存在的数据,mysql查询不到数据也不会直接写入缓存,就会导致每次请求都查数据库。如图:
如果有大量的无效key的数据请求进来,很有可能导致DB压力过大,导致服务宕机等问题。
解决方案一:缓存空数据,查询返回的数据为空,仍把这个空结果进行缓存。
优点:简单
缺点:消耗内存,可能会发生不一致的问题
解决方案二:布隆过滤器
bitmap(位图):相当于是一个以(bit)位为单位的数组,数组中每个单元只能存储二进制数0或1
布隆过滤器作用:布隆过滤器可以用于检索一个元素是否在一个集合中。
误判率:数组越小误判率就越大,数组越大误判率就越小,但是同时带来了更多的内存消耗。
优点:内存占用较少,没有多余key
缺点:实现复杂,存在误判
嗯~~,我想一想,缓存穿透是指查询一个一定不存在的数据,如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到DB去查询,可能导致DB挂掉。这种情况大概率遭到了攻击。
解决方案的话,我们通常会用布隆过滤器来解决它。
扩展:什么是布隆过滤器?
布隆过滤器主要是用于检索一个元素是否在一个集合中。我们当时使用的是redisson实现的布隆过滤器。
它的底层主要是先去初始化一个比较大数组,里面存放的二进制0或1。在一开始都是0,当一个key来了之后经过3次hash计算,模于数组长度找到数据的下标然后把数组中原来的0改为1,这样的话,三个数组的位置就能标明一个key的存在。查找的过程也是一样的。
当然是有缺点的,布隆过滤器有可能会产生一定的误判,我们一般可以设置这个误判率,大概不会超过5%,其实这个误判是必然存在的,要不就得增加数组的长度,其实已经算是很划分了,5%以内的误判率一般的项目也能接受,不至于高并发下压倒数据库。
缓存击穿:给某一个key设置了过期时间,当key过期的时候,恰好这时间点对这个key有大量的并发请求过来,这些并发请求可能会瞬间把DB压垮。
解决方案一:互斥锁 (数据强一致性、性能差)如下图
描述:线程一、二同时查询缓存、都未命中,线程一首先获取到互斥锁(这里是分布式锁,以后会写),那么线程二就只有休眠一会儿,当线程一查询数据库成功并重构建了缓存数据,线程一释放锁,线程二重试着就可以缓存命中了。
解决方案二:逻辑过期(数据高可用性、性能高)如下图
描述:在redis的key里不设置过期时间,而是逻辑过期。首先线程1在查询缓存时发现该缓存的逻辑时间已过期,并且获取互斥锁成功,那么线程1将开启一个新线程用来查询DB,在此之前先返回过期数据给用户,然后线程3查询缓存时获取不到互斥锁,它将直接返回过期数据。等待线程写入缓存并重置过期时间,释放互斥锁,至此数据也就在缓存中存在了。
缓存击穿的意思是对于设置了过期时间的key,缓存在某个时间点过期的时候,恰好这时间点对这个Key有大量的并发请求过来,这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把DB压垮。
解决方案有两种方式:
第一可以使用互斥锁:当缓存失效时,不立即去loaddb,先使用如Redis的setnx去设置一个互斥锁,当操作成功返回时再进行loaddb的操作并回设缓存,否则重试get缓存的方法
第二种方案可以设置当前key逻辑过期,大概是思路如下:
①:在设置key的时候,设置一个过期时间字段一块存入缓存中,不给当前key设置过期时间
②:当查询的时候,从redis取出数据后判断时间是否过期
③:如果过期则开通另外一个线程进行数据同步,当前线程正常返回数据,这个数据不是最新当然两种方案各有利弊:
如果选择数据的强一致性,建议使用分布式锁的方案,性能上可能没那么高,锁需要等,也有可能产生死锁的问题
如果选择key的逻辑删除,则优先考虑的高可用性,性能比较高,但是数据同步这块做不到强一致。
缓存雪崩:是指在同一时段大量的缓存key同时失效或者Redis服务宕机,导致大量请求到达数据库,带来巨大压力。
解决方案:
给不同的Key的TTL添加随机值
利用Redis集群提高服务的可用性 哨兵模式、集群模式
给缓存业务添加降级限流策略 ngxin 或 spring cloud gateway
给业务添加多级缓存 Guava或Caffeine
缓存雪崩意思是设置缓存时采用了相同的过期时间,导致缓存在某一时刻同时失效,请求全部转发到DB,DB瞬时压力过重雪崩。与缓存击穿的区别:雪崩是很多key,击穿是某一个key缓存。
解决方案主要是可以将缓存失效时间分散开,比如可以在原有的失效时间基础上增加一个随机值,比如1—5分钟随机,这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件。