一文彻底搞懂Redis中缓存穿透,缓存击穿和缓存雪崩的区别以及解决方案

文章目录

      • 1、缓存击穿
        • 1.1 概念
        • 1.2 描述
        • 1.3 解决方案
      • 2、缓存穿透
        • 2.1 概念
        • 2.2 描述
        • 2.3 解决方案
      • 3、缓存雪崩
        • 3.1 概念
        • 3.2 描述
        • 3.3 缓存大量数据同时过期
        • 3.4 Redis 故障宕机
      • 4. 总结

  用户的数据一般都是存储于数据库,数据库的数据是落在磁盘上的,磁盘的读写速度可以说是计算机里最慢的硬件了。
  当用户的请求,都访问数据库的话,请求数量一上来,数据库很容易就奔溃的了,所以为了避免用户直接访问数据库,会用 Redis 作为缓存层。
  因为 Redis 是内存数据库,我们可以将数据库的数据缓存在 Redis 里,相当于数据缓存在内存,内存的读写速度比硬盘快好几个数量级,这样大大提高了系统性能。
   Redis使用过程中比较常见的三种问题:缓存穿透、缓存击穿、缓存雪崩。
   一文彻底搞懂Redis中缓存穿透,缓存击穿和缓存雪崩的区别以及解决方案_第1张图片

简要区别

名词 描述
缓存穿透 查询一个不存在的数据,导致大量的查询请求直接打到数据库
缓存击穿 某个热点数据在缓存中失效后,大量的请求同时访问数据库
缓存雪崩 在某个时间段内,大量的缓存集中失效,导致大量的请求直接打到数据库

1、缓存击穿

1.1 概念

Redis中一个热点key在失效的同时,大量的请求过来,从而会全部到达数据库,压垮数据库。

1.2 描述

缓存击穿是指缓存中没有但数据库中有的数据(一般是缓存时间到期),这时由于并发用户特别多,同时读缓存没读到数据,又同时去数据库去取数据,引起数据库压力瞬间增大,造成过大压力。
  一文彻底搞懂Redis中缓存穿透,缓存击穿和缓存雪崩的区别以及解决方案_第2张图片

1.3 解决方案
  • 过期时间 + 随机值
    对于热点数据,我们不设置过期时间,这样就可以把请求都放在缓存中处理,充分把 Redis 高吞吐量性能利用起来。或者过期时间再加一个随机值。
    设计缓存的过期时间时,使用公式:过期时间=baes 时间+随机时间。 即相同业务数据写缓存时,在基础过期时间之上,再加一个随机的过期时间,让数据在未来一段时间内慢慢过期,避免瞬时全部过期,对 DB 造成过大压力

  • 预热
    预先把热门数据提前存入 Redis 中,并设热门数据的过期时间超大值。

  • 使用锁
    当发现缓存失效的时候,不是立即从数据库加载数据。而是先获取分布式锁,获取锁成功才执行数据库查询和写数据到缓存的操作,获取锁失败,则说明当前有线程在执行数据库查询操作,当前线程睡眠一段时间在重试。
    这样只让一个请求去数据库读取数据。

伪代码如下:

public Object getData(String id) {
    String desc = redis.get(id);
        // 缓存为空,过期了
        if (desc == null) {
            // 互斥锁,只有一个请求可以成功
            if (redis(lockName)) {
                try
                    // 从数据库取出数据
                    desc = getFromDB(id);
                    // 写到 Redis
                    redis.set(id, desc, 60 * 60 * 24);
                } catch (Exception ex) {
                    LogHelper.error(ex);
                } finally {
                    // 确保最后删除,释放锁
                    redis.del(lockName);
                    return desc;
                }
            } else {
                // 否则睡眠200ms,接着获取锁
                Thread.sleep(200);
                return getData(id);
            }
        }
}

2、缓存穿透

2.1 概念

缓存和数据库中都没有的数据,可用户还是源源不断的发起请求,导致每次请求都会到数据库,从而压垮数据库。

2.2 描述

缓存穿透是指缓存和数据库中都没有的数据,而用户不断发起请求。由于缓存是不命中时被动写的,并且出于容错考虑,如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。
在流量大时,可能DB就挂掉了,要是有人利用不存在的key频繁攻击我们的应用,这就是漏洞。
如发起为id为“-1”的数据或id为特别大不存在的数据。这时的用户很可能是攻击者,攻击会导致数据库压力过大。
一文彻底搞懂Redis中缓存穿透,缓存击穿和缓存雪崩的区别以及解决方案_第3张图片

2.3 解决方案
  • 缓存空值:
    当请求的数据不存在 Redis也不存在数据库的时候,设置一个缺省值(比如:None)。当后续再次进行查询则直接返回空值或者缺省值。
  • 布隆过滤器:
    在数据写入数据库的同时将这个 ID 同步到到布隆过滤器中,当请求的 id 不存在布隆过滤器中则说明该请求查询的数据一定没有在数据库中保存,就不要去数据库查询了。

BloomFilter 要缓存全量的 key,这就要求全量的 key 数量不大,100 亿 条数据以内最佳,因为 100 亿条数据大概要占用 3.5GB 的内存。

布隆过滤器原理

BloomFilter 的算法是,首先分配一块内存空间做 bit 数组,数组的 bit 位初始值全部设为 0。加入元素时,采用 k 个相互独立的 Hash 函数计算,然后将元素 Hash 映射的 K 个位置全部设置为 1。检测 key 是否存在,仍然用这 k 个 Hash 函数计算出 k 个位置,如果位置全部为 1,则表明 key 存在,否则不存在。

如下图所示:
一文彻底搞懂Redis中缓存穿透,缓存击穿和缓存雪崩的区别以及解决方案_第4张图片

布隆过滤器

哈希函数会出现碰撞,所以布隆过滤器会存在误判。这里的误判率是指,BloomFilter 判断某个 key 存在,但它实际不存在的概率,因为它存的是 key 的 Hash 值,而非 key 的值。所以有概率存在这样的 key,它们内容不同,但多次 Hash 后的 Hash 值都相同。

对于 BloomFilter 判断不存在的 key ,则是 100% 不存在的,反证法,如果这个 key 存在,那它每次 Hash 后对应的 Hash 值位置肯定是 1,而不会是 0。布隆过滤器判断存在不一定真的存在。

3、缓存雪崩

3.1 概念

Redis中缓存的数据大面积同时失效,或者Redis宕机,从而会导致大量请求直接到数据库,压垮数据库。

出现该原因主要有两种:

  • 大量热点数据同时过期,导致大量请求需要查询数据库并写到缓存;
  • Redis 故障宕机,缓存系统异常。
3.2 描述

缓存雪崩是指缓存中数据大批量到过期时间,而查询数据量巨大,引起数据库压力过大甚至down机。和缓存击穿不同的是,缓存击穿指并发查同一条数据,缓存雪崩是不同数据都过期了,很多数据都查不到从而查数据库。
一文彻底搞懂Redis中缓存穿透,缓存击穿和缓存雪崩的区别以及解决方案_第5张图片

3.3 缓存大量数据同时过期

数据保存在缓存系统并设置了过期时间,但是由于在同时一刻,大量数据同时过期。系统就把请求全部打到数据库获取数据,并发量大的话就会导致数据库压力激增。
缓存雪崩是发生在大量数据同时失效的场景,而缓存击穿(失效)是在某个热点数据失效的场景,这是他们最大的区别。

解决方案

  • 过期时间添加随机值
    要避免给大量的数据设置一样的过期时间,过期时间 = baes 时间+ 随机时间(较小的随机数,比如随机增加 1~5 分钟)。
    这样一来,就不会导致同一时刻热点数据全部失效,同时过期时间差别也不会太大,既保证了相近时间失效,又能满足业务需求。
  • 接口限流
    当访问的不是核心数据的时候,在查询的方法上加上接口限流保护。比如设置 10000 req/s。如果访问的是核心数据接口,缓存不存在允许从数据库中查询并设置到缓存中。这样的话,只有部分请求会发送到数据库,减少了压力。
    限流,就是指,我们在业务系统的请求入口前端控制每秒进入系统的请求数,避免过多的请求被发送到数据库。

如下图所示:一文彻底搞懂Redis中缓存穿透,缓存击穿和缓存雪崩的区别以及解决方案_第6张图片

3.4 Redis 故障宕机

一个 Redis 实例能支撑 10 万的 QPS,而一个数据库实例只有 1000 QPS。一旦 Redis 宕机,会导致大量请求打到数据库,从而发生缓存雪崩。

解决方案
对于缓存系统故障导致的缓存雪崩的解决方案有两种:

  • 服务熔断和接口限流
    在业务系统中,针对高并发的使用服务熔断来有损提供服务从而保证系统的可用性。
    服务熔断就是当从缓存获取数据发现异常,则直接返回错误数据给前端,防止所有流量打到数据库导致宕机。
    服务熔断和限流属于在发生了缓存雪崩,如何降低雪崩对数据库造成的影响的方案。

  • 构建高可用缓存集群系统
    缓存系统一定要构建一套 Redis 高可用集群,比如 《Redis 哨兵集群》或者 《Redis Cluster 集群》,如果 Redis 的主节点故障宕机了,从节点还可以切换成为主节点,继续提供缓存服务,避免了由于缓存实例宕机而导致的缓存雪崩问题。

4. 总结

缓存击穿 指的是数据库有数据,缓存本应该也有数据,但是缓存过期了,Redis 这层流量防护屏障被击穿了,请求直奔数据库。

缓存穿透指的是数据库本就没有这个数据,请求直奔数据库,缓存系统形同虚设。

缓存雪崩指的是大量的热点数据无法在 Redis 缓存中处理(大面积热点数据缓存失效、Redis 宕机),流量全部打到数据库,导致数据库极大压力。

你可能感兴趣的:(Java开发,缓存,redis,mybatis,java)