深入浅出redis缓存应用

0.1、索引

https://blog.waterflow.link/articles/1663169309611

1、只读缓存

只读缓存的流程是这样的：

当查询请求过来时，先从redis中查询数据，如果有的话就直接返回。如果没有的话，就从数据库查询，并写入到缓存中。

当删改请求过来时，会直接从数据库中删除修改数据，并把redis中保存的数据删除。

这样做的好处是，所有最新的数据都在数据库中，而数据库是有数据可靠性保障的。

2、读写缓存

读写缓存的流程是这样的：

当查询请求过来时，先从redis中查询数据，如果有的话就直接返回。如果没有的话，就从数据库查询，并写入到缓存中。
当增删改请求过来时，得益于Redis的高性能访问特性，数据的增删改操作可以在缓存中快速完成，处理结果也会快速返回给业务应用，这就可以提升业务应用的响应速度。
但是和只读缓存不同的是，最新的数据都是在redis中，一旦出现掉电宕机，由于redis的持久化机制，最新的数据有可能会丢失，就会给业务带来风险。

所以，根据业务应用对数据可靠性和缓存性能的不同要求，我们会有同步直写和异步写回两种策略。其中，同步直写策略优先保证数据可

靠性，而异步写回策略优先提供快速响应。

2.1、同步直写

当增删改请求过来时，请求到redis的同时，也会请求mysql，等到redis和mysql都写完数据才会返回数据。

这样，即使缓存宕机或发生故障，最新的数据仍然保存在数据库中，这就提供了数据可靠性保证。

但是也会降低缓存的使用性能，因为写缓存很快，但是写数据库就要慢很多，整个的响应时间就会增加。

2.2、异步写回

异步写回优先考虑了响应速度，写到缓存会立即响应客户端。等到数据要从redis中淘汰时，再同步到mysql。

但是如果发生掉电，数据还是没有写到mysql，还是有丢失的风险。

3、如何选择

如果需要对写请求进行加速，我们选择读写缓存；
如果写请求很少，或者是只需要提升读请求的响应速度的话，我们选择只读缓存。

4、关于一致性

对于读写缓存的异步写回，由于是只写redis，淘汰时才会写入mysql，如果发生宕机不能保证一致性
对于读写缓存的同步写回，由于redis和mysql是同时写，需要加入事物机制，要么都执行要么都不执行，可以保证一致性。（问题：如何保证原子性？当有并发写过来时即使都执行了也可能会不一致，这是就要引入锁保证互斥性）
对于只读缓存，如果发生删改操作，应用既要更新数据库，也要在缓存中删除数据。由于redis和mysql是同时操作，需要加入事物机制，要么都执行要么都不执行，可以保证一致性。（问题：如何保证原子性？）

4.1、对于只读缓存的一致性问题

先删除缓存，再更新数据库

如果缓存删除成功，但是数据库更新失败，那么，应用再访问数据时，缓存中没有数据，就会发生缓存缺失。然后，应用再访问数库，但是数据库中的值为旧值，应用就访问到旧值了。
如果线程A都成功了，但是同时另一个线程B在线程A的这俩个请求中间过来。这个时候缓存已经删除，但是数据库还是旧值，线程B发现没有缓存，就从数据库读读取了旧值更新到redis中，然后线程A把新值更新到数据库。此时redis中是旧值，mysql中是新值。

先更新数据库，再删除缓存中的值

如果应用先完成了数据库的更新，但是，在删除缓存时失败了，那么，数据库中的值是新值，而缓存中的是旧值，这肯定是不一致的。这个时候，如果有其他的并发请求来访问数据，按照正常的缓存访问流程，就会先在缓存中查询，但此时，就会读到旧值了。
如果线程A删除了数据库中的值，但还没来得及删除缓存值，线程B就开始读取数据了，那么此时，线程B查询缓存时，发现缓存命中，就会直接从缓存中读取旧值。不过，在这种情况下，如果其他线程并发读缓存的请求不多，那么，就不会有很多请求读取到旧值。而且，线程A一般也会很快删除缓存值，这样一来，其他线程再次读取时，就会发生缓存缺失，进而从数据库中读取最新值。所以，这种情况对业务的影响较小。（可以理解为最终一致性，读到旧数据只是暂时的，最终都会读到新数据）

所以一般项目中使用只读缓存，先更新数据库，再删除缓存。这样的代价是最小的，而且尽量保证了一致性。

5、缓存异常

5.1、缓存雪崩

缓存雪崩是指，大量的请求无法在redis中处理（redis没拦住），直接打到了mysql，导致数据库压力激增，甚至服务崩溃。

redis无法处理的原因有两种：

缓存中大量数据同时过期

解决方案：

给过期时间增加一个较小的随机数，过期的数据通过时间去分摊
服务降级，直接返回错误信息

Redis缓存实例发生故障宕机了，无法处理请求，这就会导致大量请求一下子积压到数据库层

解决方案：

服务熔断或者请求限流，redis客户端直接返回，不会请求到redis服务，但是影响范围比较大
构建redis集群，提高可用性

5.2、缓存击穿

缓存击穿是指，访问某个热点数据，无法在缓存中处理，大量请求打到mysql，导致数据库压力激增，甚至服务崩溃。

解决方案：

对于频繁访问的热点数据不设置过期时间

5.3、缓存穿透

缓存穿透是指，要访问的数据既不在redis中，也不在mysql中。请求redis发现数据不存在，继续访问mysql发现数据还是不存在，然后也无法写回缓存，下次继续请求的时候还是会打到mysql。

解决方案：

缓存空值或者缺省值
使用布隆过滤器

布隆过滤器

布隆过滤器由一个初值都为0的bit数组和N个哈希函数组成，可以用来快速判断某个数据是否存在（准确说是判断不存在，如果布隆过滤器不存在数据库中一定不存在，如果布隆过滤器判断存在，数据库不一定存在，这是布隆过滤器的机制决定的）。当我们想标记某个数据存在时（例如，数据已被写入数据库），布隆过滤器会通过三个操作完成标记：

首先，使用N个哈希函数，分别计算这个数据的哈希值，得到N个哈希值。
然后，我们把这N个哈希值对bit数组的长度取模，得到每个哈希值在数组中的对应位置。
最后，我们把对应位置的bit位设置为1，这就完成了在布隆过滤器中标记数据的操作。

如果数据不存在（例如，数据库里没有写入数据），我们也就没有用布隆过滤器标记过数据，那么，bit数组对应bit位的值仍然为0。

所以当我们写入数据库时，使用布隆过滤器做个标记。当缓存缺失后，应用查询数据库时，可以通过查询布隆过滤器快速判断数据是否存在。如果不存在，就不用再去数据库中查询了。

6、应用场景

我们看下go-zero中是如何使用缓存的，go-zero中使用的只读缓存，当数据有更新删除操作的时候，redis中的对应Primary记录和查询条件记录会同步删除。go-zero中对某行的缓存，会缓存主键到行记录的缓存，和查询条件（唯一索引）到主键的缓存

我们看下查询的逻辑（针对的是单行的记录）：

通过查询条件查询某条记录时，如果没有查询条件到主键的缓存
通过查询条件到mysql查询行记录，然后把主键到行记录的缓存，和查询条件（唯一索引）到主键的缓存更新到redis（前者的过期时间会多余后者几秒时间）
继续回到1，如果有查询条件到主键的缓存，如果没有主键到记录的缓存，通过主键到mysql查询并写入redis

下面看下go-zero源码：

// v - 需要读取的数据对象
// key - 缓存key
// query - 用来从DB读取完整数据的方法
// cacheVal - 用来写缓存的方法
func (c cacheNode) doTake(v interface{}, key string, query func(v interface{}) error,
  cacheVal func(v interface{}) error) error {
  // singleflight一批请求过来，只允许一个去真正访问数据，防止缓存击穿
  val, fresh, err := c.barrier.DoEx(key, func() (interface{}, error) {
    // 从cache里读取数据
    if err := c.doGetCache(key, v); err != nil {
      // 如果是预先放进来的placeholder（用来防止缓存穿透）的，那么就返回预设的errNotFound
      // 如果是未知错误，那么就直接返回，因为我们不能放弃缓存出错而直接把所有请求去请求DB，
      // 这样在高并发的场景下会把DB打挂掉的
      if err == errPlaceholder {
        return nil, c.errNotFound
      } else if err != c.errNotFound {
        // why we just return the error instead of query from db,
        // because we don't allow the disaster pass to the DBs.
        // fail fast, in case we bring down the dbs.
        return nil, err
      }

      // 请求DB
      // 如果返回的error是errNotFound，那么我们就需要在缓存里设置placeholder，防止缓存穿透
      if err = query(v); err == c.errNotFound {
        if err = c.setCacheWithNotFound(key); err != nil {
          logx.Error(err)
        }

        return nil, c.errNotFound
      } else if err != nil {
        // 统计DB失败
        c.stat.IncrementDbFails()
        return nil, err
      }

      // 把数据写入缓存
      if err = cacheVal(v); err != nil {
        logx.Error(err)
      }
    }
  
    // 返回json序列化的数据
    return jsonx.Marshal(v)
  })
  if err != nil {
    return err
  }
  if fresh {
    return nil
  }

  // got the result from previous ongoing query
  c.stat.IncrementTotal()
  c.stat.IncrementHit()

  // 把数据写入到传入的v对象里
  return jsonx.Unmarshal(val.([]byte), v)
}

从上面代码我们可以看到：

使用sigleflight防止缓存击穿
缓存穿透，使用了占位符，即在redis中保存一个空值

深入浅出redis缓存应用

0.1、索引

1、只读缓存

2、读写缓存

2.1、同步直写

2.2、异步写回

3、如何选择

4、关于一致性

4.1、对于只读缓存的一致性问题

5、缓存异常

5.1、缓存雪崩

5.2、缓存击穿

5.3、缓存穿透

6、应用场景

你可能感兴趣的:(redis)