redis缓存篇---大总结(场景+解决方法+具体实现)

前言:

用户的数据一般都是存储于数据库,数据库的数据是落在磁盘上的,磁盘的读写速度可以说是计算机里最慢的硬件了,为了避免用户直接访问数据库,会用 Redis 作为缓存层。

Redis 是内存数据库,我们可以将数据库的数据缓存在 Redis 里,相当于数据缓存在内存,内存的读写速度比硬盘快好几个数量级,这样大大提高了系统性能

引入了缓存层,就会有缓存异常的三个问题,分别是缓存雪崩、缓存击穿、缓存穿透

缓存雪崩

定义:
缓存雪崩是指在缓存中大量的缓存数据同时失效,导致大量请求直接落到数据库引起数据库负载激增,系统压力剧增,从而影响系统正常运行。
发生缓存雪崩有两个原因:

  • 大量数据同时过期;
  • Redis 故障宕机;

解决方法:

  • 均匀设置过期时间;
  • 互斥锁;
  • 后台更新缓存;

1. 均匀设置过期时间

对缓存数据设置过期时间时,给这些数据的过期时间加上一个随机数,这样就保证数据不会在同一时间过期

简单的 Java 实现代码:

import java.util.HashMap;
import java.util.Map;

public class ExpiringCache {
    private Map<String, CacheItem> cache = new HashMap<>();

    // 存放缓存项,设置不同过期时间间隔
    public void put(String key, Object value) {
        // 设置不同过期时间间隔,例如 1 分钟到 5 分钟之间
        int expirationInterval = (int) (60 + Math.random() * 240); // 1分钟到5分钟之间的随机数
        long expirationTime = System.currentTimeMillis() + expirationInterval * 1000;

        CacheItem cacheItem = new CacheItem(value, expirationTime);
        cache.put(key, cacheItem);
    }

    // 获取缓存项,检查是否过期
    public Object get(String key) {
        CacheItem cacheItem = cache.get(key);
        if (cacheItem != null && System.currentTimeMillis() < cacheItem.getExpirationTime()) {
            return cacheItem.getValue();
        } else {
            // 缓存项过期,需要移除
            cache.remove(key);
            return null;
        }
    }

    // 缓存项类,包含值和过期时间
    private static class CacheItem {
        private Object value;
        private long expirationTime;

        public CacheItem(Object value, long expirationTime) {
            this.value = value;
            this.expirationTime = expirationTime;
        }

        public Object getValue() {
            return value;
        }

        public long getExpirationTime() {
            return expirationTime;
        }
    }
}

2、互斥锁
当业务线程在处理用户请求时,如果发现访问的数据不在 Redis 里,就加个互斥锁,保证同一时间内只有一个请求来构建缓存(从数据库读取数据,再将数据更新到 Redis 里),当缓存构建完成后,再释放锁。
下面是一个简单的示例代码,演示如何使用互斥锁解决缓存雪崩问题:

import java.util.HashMap;
import java.util.Map;
import java.util.concurrent.locks.Lock;
import java.util.concurrent.locks.ReentrantLock;

public class CacheWithMutex {
    private final Map<String, String> cache = new HashMap<>();
    private final Lock lock = new ReentrantLock();

    public String getFromCache(String key) {
        String value = cache.get(key);
        if (value == null) {
            // 缓存中不存在,获取互斥锁
            lock.lock();
            try {
                // 双重检查,防止多个线程同时通过第一个 if
                value = cache.get(key);
                if (value == null) {
                    // 模拟从数据库或其他数据源获取数据
                    value = fetchDataFromDatabase(key);
                    // 将数据放入缓存
                    cache.put(key, value);
                }
            } finally {
                // 释放互斥锁
                lock.unlock();
            }
        }
        return value;
    }

    private String fetchDataFromDatabase(String key) {
        // 模拟从数据库中获取数据的操作
        System.out.println("Fetching data from database for key: " + key);
        return "Data for " + key;
    }

    public static void main(String[] args) {
        CacheWithMutex cache = new CacheWithMutex();

        // 启动多个线程并发访问缓存
        for (int i = 0; i < 5; i++) {
            final int threadNumber = i;
            new Thread(() -> {
                String key = "key1";
                String result = cache.getFromCache(key);
                System.out.println("Thread " + threadNumber + ": " + result);
            }).start();
        }
    }
}

在这个示例中,CacheWithMutex 类使用了一个简单的 HashMap 作为缓存,以及一个 ReentrantLock 实例作为互斥锁。在 getFromCache 方法中,当缓存中不存在数据时,多线程会尝试获取互斥锁,然后再次检查缓存是否被其他线程填充了数据。这样可以确保只有一个线程能够从数据库中获取数据并放入缓存,其他线程会等待该线程完成操作后再访问缓存。

3、后台更新缓存

为了异步处理缓存更新,避免业务线程因为等待缓存更新而阻塞,提高系统的并发性和响应速度

业务线程不再负责更新缓存,缓存也不设置有效期,而是让缓存“永久有效”,并将更新缓存的工作交由后台线程定时更新。

在业务线程发现缓存数据失效后(缓存数据被淘汰),通过消息队列发送一条消息通知后台线程更新缓存,后台线程收到消息后,在更新缓存前可以判断缓存是否存在,存在就不执行更新缓存操作;不存在就读取数据库数据,并将数据加载到缓存

在业务刚上线的时候,我们最好提前把数据缓起来,而不是等待用户访问才来触发缓存构建,这就是所谓的缓存预热

“业务线程”指的是处理具体业务逻辑的线程,它是用户请求的处理线程
以下是一个简化的例子,展示了后台更新缓存的示例代码:

import java.util.HashMap;
import java.util.Map;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;

// 商家信息类
class Merchant {
    private int id;
    private String name;

    public Merchant(int id, String name) {
        this.id = id;
        this.name = name;
    }

    public int getId() {
        return id;
    }

    public String getName() {
        return name;
    }
}

// 商家缓存管理类
class MerchantCacheManager {
    private static final Map<Integer, Merchant> merchantCache = new HashMap<>();

    // 初始化商家缓存
    static {
        merchantCache.put(1, new Merchant(1, "Merchant A"));
        merchantCache.put(2, new Merchant(2, "Merchant B"));
        merchantCache.put(3, new Merchant(3, "Merchant C"));
    }

    // 获取商家信息
    public static Merchant getMerchant(int merchantId) {
        return merchantCache.get(merchantId);
    }

    // 更新商家缓存
    public static void updateMerchantCache() {
        // 模拟从数据库或其他来源获取最新的商家信息
        Map<Integer, Merchant> updatedData = fetchUpdatedMerchantData();

        // 更新缓存
        merchantCache.clear();
        merchantCache.putAll(updatedData);

        System.out.println("Merchant cache updated.");
    }

    // 模拟从数据库获取最新的商家信息
    private static Map<Integer, Merchant> fetchUpdatedMerchantData() {
        // 实际应用中,可以从数据库中查询最新的商家信息
        // 这里简化为手动创建一个新的商家信息集合
        Map<Integer, Merchant> updatedData = new HashMap<>();
        updatedData.put(1, new Merchant(1, "Updated Merchant A"));
        updatedData.put(2, new Merchant(2, "Updated Merchant B"));
        updatedData.put(3, new Merchant(3, "Updated Merchant C"));

        return updatedData;
    }
}

public class BackgroundCacheUpdateExample {
    public static void main(String[] args) {
        // 启动后台定时任务,每隔一段时间更新商家缓存
        ScheduledExecutorService executorService = Executors.newScheduledThreadPool(1);
        executorService.scheduleAtFixedRate(MerchantCacheManager::updateMerchantCache, 0, 5, TimeUnit.SECONDS);

        // 模拟业务线程,获取商家信息
        for (int i = 1; i <= 3; i++) {
            final int merchantId = i;
            new Thread(() -> {
                Merchant merchant = MerchantCacheManager.getMerchant(merchantId);
                System.out.println("Thread: " + Thread.currentThread().getId() +
                        " - Merchant Info: " + merchant.getId() + ", " + merchant.getName());
            }).start();
        }
    }
}

Redis 故障宕机
常见的应对方法有下面这几种:

  • 服务熔断或请求限流机制;
  • 构建 Redis 缓存高可靠集群;

1. 服务熔断或请求限流机制
服务熔断和请求限流是微服务架构中常用的两种机制,用于提高系统的稳定性和防止雪崩效应。

  1. 服务熔断(Circuit Breaking)

    • 定义:服务熔断是一种防止分布式系统中因服务故障导致的连锁反应,使得整个系统保持稳定的机制。类似于电路中的熔断器,当系统中的服务发生故障或异常时,可以主动熔断,避免故障扩散到整个系统。

    • 原理:通过监控服务的调用情况,当服务的错误率达到一定阈值时,系统会启动熔断机制,暂时停止对该服务的调用,避免影响到整个系统。在熔断状态下,系统可以执行降级操作,如返回缓存数据或默认值。

    • 优势:防止故障的传递,提高系统的容错性,保持系统的可用性。

    • 实现:通常使用熔断器(Circuit Breaker)模式来实现,如Netflix的Hystrix等。

  2. 请求限流

    • 定义:请求限流是一种通过控制请求的访问频率,避免系统因请求过多而产生的资源竞争、拥塞或服务不可用的机制。通过限制并发访问的请求数量,保障系统的稳定性。

    • 原理:对请求进行限制,当请求的速率超过系统的处理能力时,采取一定策略,如拒绝服务、延迟处理、排队等。通过限制并发请求数,可以有效控制系统的负载。

    • 优势:防止系统过载,提高系统的稳定性和可用性。

    • 实现:使用令牌桶算法、漏桶算法等,或者通过使用专业的限流组件,如Guava RateLimiter等。

这两种机制通常在微服务架构中结合使用,以应对不同层面的问题。服务熔断主要用于防止故障的传递,而请求限流主要用于控制系统的访问频率,防止系统被过多的请求拖垮。综合使用这两种机制,可以提高系统的健壮性和稳定性。

2. 构建 Redis 缓存高可靠集群
服务熔断或请求限流机制是缓存雪崩发生后的应对方案,我们最好通过主从节点的方式构建 Redis 缓存高可靠集群。

如果 Redis 缓存的主节点故障宕机,从节点可以切换成为主节点,继续提供缓存服务,避免了由于 Redis 故障宕机而导致的缓存雪崩问题

缓存击穿

定义:如果缓存中的某个热点数据过期了,此时大量的请求访问了该热点数据,就无法从缓存中读取,直接访问数据库,数据库很容易就被高并发的请求冲垮

业务通常会有几个数据会被频繁地访问,比如秒杀活动,这类被频地访问的数据被称为热点数据

为了防止缓存击穿,可以采取以下一些策略:

  • 互斥锁方案,保证同一时间只有一个业务线程更新缓存,未能获取互斥锁的请求,要么等待锁释放后重新读取缓存,要么就返回空值或者默认值。
  • 不给热点数据设置过期时间,由后台异步更新缓存,或者在热点数据准备要过期前,提前通知后台线程更新缓存以及重新设置过期时间;

缓存穿透

定义:当用户访问的数据,既不在缓存中,也不在数据库中,导致请求在访问缓存时,发现缓存缺失,再去访问数据库时,发现数据库中也没有要访问的数据,没办法构建缓存数据,来服务后续的请求。那么当有大量这样的请求到来时,数据库的压力骤增

缓存穿透的发生一般有这两种情况:

  • 业务误操作,缓存中的数据和数据库中的数据都被误删除了,所以导致缓存和数据库中都没有数据;
  • 黑客恶意攻击,故意大量访问某些读取不存在数据的业务;

应对缓存穿透的方案,常见的方案有三种

第一种方案,非法请求的限制;
第二种方案,缓存空值或者默认值;
第三种方案,使用布隆过滤器快速判断数据是否存在,避免通过查询数据库来判断数据是否存在;

第一种方案,非法请求的限制
在 API 入口处我们要判断求请求参数是否合理,请求参数是否含有非法值、请求字段是否存在,如果判断出是恶意请求就直接返回错误,避免进一步访问缓存和数据库。

第二种方案,缓存空值或者默认值
针对查询的数据,在缓存中设置一个空值或者默认值,这样后续请求就可以从缓存中读取到空值或者默认值,返回给应用,而不会继续查询数据库。

第三种方案,使用布隆过滤器快速判断数据是否存在,避免通过查询数据库来判断数据是否存在。

在写入数据库数据时,使用布隆过滤器做个标记,然后在用户请求到来时,业务线程确认缓存失效后,可以通过查询布隆过滤器快速判断数据是否存在,如果不存在,就不用通过查询数据库来判断数据是否存在

布隆过滤器是如何工作的呢?
布隆过滤器会通过 3 个操作完成标记:

第一步,使用 N 个哈希函数分别对数据做哈希计算,得到 N 个哈希值;
第二步,将第一步得到的 N个哈希值对位图数组的长度取模,得到每个哈希值在位图数组的对应位置。
第三步,将每个哈希值在位图数组的对应位置的值设置为 1;

当应用要查询数据 x 是否数据库时,通过布隆过滤器只要查到位图数组的映射 位置的值是否全为 1,只要有一个为 0,就认为数据 x 不在数据库中。

高效查找的同时存在哈希冲突的可能性:所以,查询布隆过滤器说数据存在,并不一定证明数据库中存在这个数据,但是查询到数据不存在,数据库中一定就不存在这个数据。

你可能感兴趣的:(知识深度解析系列,缓存,redis,mybatis)