【软件开发】Redis 理论篇(一)

Redis 理论篇(一)

一、概述

1.什么是 Redis?

Redis 是一个使用 C 语言写成的,开源的高性能 Key-Value 非关系缓存数据库。它支持存储的 Value 类型相对更多,包括 string(字符串)、list(链表)、set(集合)、zsetsorted set,有序集合)和 hash(哈希类型)。Redis 的数据都基于缓存的,所以很快,每秒可以处理超过 10 10 10 万次读写操作,是已知性能最快的 Key-Value DB。Redis 也可以实现数据写入磁盘中,保证了数据安全不丢失,而且 Redis 的操作是原子性的。

2.Redis 的优缺点

优点:

  • 读写性能优异。Redis 读的速度是 110000 110000 110000 次/s,写的速度是 81000 81000 81000 次/s。
  • 支持数据持久化。支持 AOFRDB 两种持久化方式。
  • 支持事务。Redis 的所有操作都是原子性的,同时 Redis 还支持对几个操作合并后的原子性执行。
  • 数据结构丰富。除了支持 string 类型的 value 外,还支持 hashsetzsetlist 等数据结构。
  • 支持主从复制。主机会自动将数据同步到从机,可以进行读写分离。

缺点:

  • 数据库容量受到物理内存的限制,不能用作海量数据的高性能读写,因此 Redis 适合的场景主要局限在较小数据量的高性能操作和运算上。
  • Redis 不具备自动容错和恢复功能,主机从机的宕机都会导致前端部分读写请求失败,需要等待机器重启或者手动切换前端的 IP 才能恢复。
  • 主机宕机,宕机前有部分数据未能及时同步到从机,切换 IP 后还会引入数据不一致的问题,降低了系统的可用性。
  • Redis 较难支持在线扩容,在集群容量达到上限时在线扩容会变得很复杂。为避免这一问题,运维人员在系统上线时必须确保有足够的空间,这对资源造成了很大的浪费。

3.使用 Redis 有哪些好处?

  • 速度快。因为数据存在内存中,类似于 HashMap,HashMap 的优势就是查找和操作的时间复杂度都很低。
  • 支持丰富数据类型,支持 stringlistsetsorted sethash
  • 支持事务,操作都是原子性,所谓的原子性就是对数据的更改要么全部执行,要么全部不执行。
  • 丰富的特性:可用于缓存,消息,按 Key 设置过期时间,过期后将会自动删除。

4.为什么要用 Redis?

主要从 高性能高并发 这两点来看待这个问题。

  • 高性能:假如用户第一次访问数据库中的某些数据。这个过程会比较慢,因为是从硬盘上读取的。将该用户访问的数据存在数缓存中,这样下一次再访问这些数据的时候就可以直接从缓存中获取了。操作缓存就是直接操作内存,所以速度相当快。如果数据库中的对应数据改变的之后,同步改变缓存中相应的数据即可!
  • 高并发:直接操作缓存能够承受的请求是远远大于直接访问数据库的,所以我们可以考虑把数据库中的部分数据转移到缓存中去,这样用户的一部分请求会直接到缓存这里而不用经过数据库。

5.为什么要用 Redis 而不用 map / guava 做缓存?

  • 缓存分为本地缓存和分布式缓存。以 Java 为例,使用自带的 map 或者 guava 实现的是本地缓存,最主要的特点是轻量以及快速,生命周期随着 jvm 的销毁而结束,并且在多实例的情况下,每个实例都需要各自保存一份缓存,缓存不具有一致性。
  • 使用 Redis 或 Memcached 之类的称为分布式缓存,在多实例的情况下,各实例共用一份缓存数据,缓存具有一致性。缺点是需要保持 Redis 或 Memcached 服务的高可用,整个程序架构上较为复杂。

6.Redis 为什么这么快?

  • 完全基于内存,绝大部分请求是纯粹的内存操作,非常快速。数据存在内存中,类似于 HashMap,HashMap 的优势就是查找和操作的时间复杂度都是 O ( 1 ) O(1) O(1)
  • 数据结构简单,对数据操作也简单,Redis 中的数据结构是专门进行设计的。
  • 采用单线程,避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换而消耗 CPU,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有因为可能出现死锁而导致的性能消耗。
  • 使用多路 I/O 复用模型,非阻塞 IO。
  • 使用底层模型不同,它们之间底层实现方式以及与客户端之间通信的应用协议不一样,Redis 直接自己构建了 VM 机制 ,因为一般的系统调用系统函数的话,会浪费一定的时间去移动和请求。

7.Redis 有哪些数据类型

Redis 主要有 5 种数据类型,包括 StringListSetZsetHash,满足大部分的使用要求。

8.Redis 的应用场景

  • 计数器:可以对 String 进行自增自减运算,从而实现计数器功能。Redis 这种内存型数据库的读写性能非常高,很适合存储频繁读写的计数量。
  • 缓存:将热点数据放到内存中,设置内存的最大使用量以及淘汰策略来保证缓存的命中率。
  • 会话缓存:可以使用 Redis 来统一存储多台应用服务器的会话信息。当应用服务器不再存储用户的会话信息,也就不再具有状态,一个用户可以请求任意一个应用服务器,从而更容易实现高可用性以及可伸缩性。
  • 全页缓存(FPC):除基本的会话 Token 之外,Redis 还提供很简便的 FPC 平台。以 Magento 为例,Magento 提供一个插件来使用 Redis 作为全页缓存后端。此外,对 WordPress 的用户来说,Pantheon 有一个非常好的插件 wp-redis,这个插件能帮助你以最快速度加载你曾浏览过的页面。
  • 查找表:例如 DNS 记录就很适合使用 Redis 进行存储。查找表和缓存类似,也是利用了 Redis 快速的查找特性。但是查找表的内容不能失效,而缓存的内容可以失效,因为缓存不作为可靠的数据来源。
  • 消息队列(发布/订阅功能):List 是一个双向链表,可以通过 LpushRpop 写入和读取消息。不过最好使用 KafkaRabbitMQ 等消息中间件。
  • 分布式锁实现:在分布式场景下,无法使用单机环境下的锁来对多个节点上的进程进行同步。可以使用 Redis 自带的 SETNX 命令实现分布式锁,除此之外,还可以使用官方提供的 RedLock 分布式锁实现。
  • 其它:Set 可以实现交集、并集等操作,从而实现共同好友等功能。ZSet 可以实现有序性操作,从而实现排行榜等功能。

9.持久化

持久化就是把内存的数据写到磁盘中去,防止服务宕机了内存数据丢失。

10.Redis 的持久化机制是什么?各自的优缺点?

Redis 提供两种持久化机制 RDB(默认)和 AOF 机制。

10.1 RDB

RDBRedis DataBase)是 Redis 默认的持久化方式。按照一定的时间将内存的数据以快照的形式保存到硬盘中,对应产生的数据文件为 dump.rdb。通过配置文件中的 save 参数来定义快照的周期。

优点:

  • 只有一个文件 dump.rdb方便持久化
  • 容灾性好,一个文件可以保存到安全的磁盘。
  • 性能最大化,fork 子进程来完成写操作,让主进程继续处理命令,所以是 IO 最大化。使用单独子进程来进行持久化,主进程不会进行任何 IO 操作,保证了 Redis 的高性能。
  • 相对于数据集大时,比 AOF 的 启动效率更高

缺点:

  • 数据安全性低。RDB 是间隔一段时间进行持久化,如果持久化之间 Redis 发生故障,会发生数据丢失。所以这种方式更适合数据要求不严谨的时候。

10.2 AOF

AOFAppend Only File)持久化,则是将 Redis 执行的每次写命令记录到单独的日志文件中,当重启 Redis 会重新将持久化的日志中文件恢复数据。

优点:

  • 数据安全,AOF 持久化可以配置 appendfsync 属性,有 always,每进行一次命令操作就记录到 AOF 文件中一次。
  • 通过 append 模式写文件,即使中途服务器宕机,可以通过 redis-check-aof 工具解决数据一致性问题。
  • AOF 机制的 rewrite 模式。AOF 文件没被 rewrite 之前(文件过大时会对命令进行合并重写),可以删除其中的某些命令(比如误操作的 flushall)。

缺点:

  • AOF 文件比 RDB 文件大,且恢复速度慢。
  • 数据集大的时候,比 RDB 启动效率低。

两种持久化的优缺点是什么?

  • AOF 文件比 RDB 更新频率高,优先使用 AOF 还原数据。
  • AOF 比 RDB 更安全也更大。
  • RDB 性能比 AOF 好。
  • 如果两个都配了,优先加载 AOF。

11.如何选择合适的持久化方式

  • 一般来说, 如果想达到足以媲美 PostgreSQL 的数据安全性,你应该同时使用两种持久化功能。在这种情况下,当 Redis 重启的时候会优先载入 AOF 文件来恢复原始的数据,因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。
  • 如果你非常关心你的数据, 但仍然可以承受数分钟以内的数据丢失,那么你可以只使用 RDB 持久化。
  • 有很多用户都只使用 AOF 持久化,但并不推荐这种方式,因为定时生成 RDB 快照(snapshot)非常便于进行数据库备份, 并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快,除此之外,使用 RDB 还可以避免 AOF 程序的 bug。
  • 如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化方式。

12.Redis 持久化数据和缓存怎么做扩容?

  • 如果 Redis 被当做缓存使用,使用 一致性哈希 实现动态扩容缩容。
  • 如果 Redis 被当做一个持久化存储使用,必须使用固定的 keys-to-nodes 映射关系,节点的数量一旦确定,则不能变化;否则的话(即 Redis 节点需要动态变化的情况),必须使用可以在运行时进行数据再平衡的一套系统,而当前只有 Redis 集群可以做到这样。

13.Redis 的过期键的删除策略

我们都知道,Redis 是 Key-Value 数据库,我们可以设置 Redis 中缓存的 Key 的过期时间。Redis 的过期策略就是指当 Redis 中缓存的 Key 过期了,Redis 如何处理。

过期策略通常有以下三种:

  • 定时过期:每个设置过期时间的 Key 都需要创建一个定时器,到过期时间就会立即清除。该策略可以立即清除过期的数据,对内存很友好;但是会占用大量的 CPU 资源去处理过期的数据,从而影响缓存的响应时间和吞吐量。
  • 惰性过期:只有当访问一个 Key 时,才会判断该 Key 是否已过期,过期则清除。该策略可以最大化地节省 CPU 资源,却对内存非常不友好。极端情况可能出现大量的过期 Key 没有再次被访问,从而不会被清除,占用大量内存。
  • 定期过期:每隔一定的时间,会扫描一定数量的数据库的 expires 字典中一定数量的 Key,并清除其中已过期的 Key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时,可以在不同情况下使得 CPU 和内存资源达到最优的平衡效果。expires 字典会保存所有设置了过期时间的 Key 的过期时间数据,其中,Key 是指向键空间中的某个键的指针,Value 是该键的毫秒精度的 UNIX 时间戳表示的过期时间。键空间是指该 Redis 集群中保存的所有键。

Redis 中同时使用了 惰性过期定期过期 两种过期策略。

14. Redis Key 的过期时间和永久有效分别怎么设置?

expirepersist 命令。

15.我们知道通过 expire 来设置 key 的过期时间,那么对过期的数据怎么处理呢?

除了缓存服务器自带的缓存失效策略之外(Redis 默认的有 6 种策略可供选择),我们还可以根据具体的业务需求进行自定义的缓存淘汰,常见的策略有两种:

  • 定时去清理过期的缓存;
  • 当有用户请求过来时,再判断这个请求所用到的缓存是否过期,过期的话就去底层系统得到新数据并更新缓存。

两者各有优劣,第一种的缺点是维护大量缓存的 Key 是比较麻烦的,第二种的缺点就是每次用户请求过来都要判断缓存失效,逻辑相对比较复杂!具体用哪种方案,大家可以根据自己的应用场景来权衡。

16.MySQL 里有 2000w 数据,Redis 中只存 20w 的数据,如何保证 Redis 中的数据都是热点数据?

Redis 内存数据集大小上升到一定大小的时候,就会施行数据淘汰策略。

17.Redis 的内存淘汰策略有哪些?

Redis 的内存淘汰策略是指在 Redis 用于缓存的内存不足时,怎么处理需要新写入且需要申请额外空间的数据。

(1)全局的键空间选择性移除

  • noeviction:当内存不足以容纳新写入数据时,新写入操作会报错。
  • allkeys-lru:当内存不足以容纳新写入数据时,在键空间中,移除最近最少使用的 Key。(这个是最常用的)
  • allkeys-random:当内存不足以容纳新写入数据时,在键空间中,随机移除某个 Key。

(2)设置过期时间的键空间选择性移除

  • volatile-lru:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,移除最近最少使用的 Key。
  • volatile-random:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,随机移除某个 Key。
  • volatile-ttl:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,有更早过期时间的 Key 优先移除。

Redis 的内存淘汰策略的选取并不会影响过期的 Key 的处理。内存淘汰策略 用于处理内存不足时的需要申请额外空间的数据;过期策略 用于处理过期的缓存数据。

18.Redis 主要消耗什么物理资源?

内存。

19.Redis 的内存用完了会发生什么?

如果达到设置的上限,Redis 的写命令会返回错误信息(但是读命令还可以正常返回)。或者你可
以配置内存淘汰机制,当 Redis 达到内存上限时会冲刷掉旧的内容。

20.Redis 如何做内存优化?

可以好好利用 hashlistsorted setset 等集合类型数据,因为通常情况下很多小的 Key-Value 可以用更紧凑的方式存放到一起。

尽可能使用散列表(Hashes),散列表使用的内存非常小(是说散列表里面存储的数少),所以你应该尽可能的将你的数据模型抽象到一个散列表里面。比如你的 Web 系统中有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的 Key,而是应该把这个用户的所有信息存储到一张散列表里面。

二、线程模型

21.Redis 线程模型

Redis 基于 Reactor 模式开发了网络事件处理器,这个处理器被称为 文件事件处理器File Event Handler)。它的组成结构为 4 4 4 部分:多个套接字、I/O 多路复用程序、文件事件分派器、事件处理器。因为文件事件分派器队列的消费是单线程的,所以 Redis 才叫单线程模型。文件事件处理器使用 I/O 多路复用(Multiplexing)程序来同时监听多个套接字, 并根据套接字目前执行的任务来为套接字关联不同的事件处理器。

当被监听的套接字准备好执行连接应答(accept)、读取(read)、写入(write)、关闭(close)等操作时, 与操作相对应的文件事件就会产生, 这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件。虽然文件事件处理器以单线程方式运行, 但通过使用 I/O 多路复用程序来监听多个套接字, 文件事件处理器既实现了高性能的网络通信模型, 又可以很好地与 Redis 服务器中其他同样以单线程方式运行的模块进行对接, 这保持了 Redis 内部单线程设计的简单性。

三、事务

22.什么是事务?

事务是一个单独的隔离操作:事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令请求所打断。

事务是一个原子操作:事务中的命令要么全部被执行,要么全部都不执行。

23.Redis 事务的概念

Redis 事务的本质是通过 MULTIEXECWATCH 等一组命令的集合。事务支持一次执行多个命令,一个事务中所有命令都会被序列化。在事务执行过程,会按照顺序串行化执行队列中的命令,其他客户端提交的命令请求不会插入到事务执行命令序列中。

总结说:Redis 事务就是一次性、顺序性、排他性的执行一个队列中的一系列命令。

24.Redis 事务的三个阶段

  • 事务开始 MULTI
  • 命令入队
  • 事务执行 EXEC

事务执行过程中,如果服务端收到有 EXECDISCARDWATCHMULTI 之外的请求,将会把请求放入队列中排队。

25.Redis 事务相关命令

Redis 事务功能是通过 MULTIEXECDISCARDWATCH 四个原语实现的。

Redis 会将一个事务中的所有命令序列化,然后按顺序执行。

  • Redis 不支持回滚。Redis 在事务失败时不进行回滚,而是继续执行余下的命令。所以 Redis 的内部可以保持简单且快速。
  • 如果在一个事务中的命令出现错误,那么所有的命令都不会执行。
  • 如果在一个事务中出现运行错误,那么正确的命令会被执行。

WATCH 命令是一个乐观锁,可以为 Redis 事务提供 Check-and-SetCAS)行为。 可以监控一个或多个键,一旦其中有一个键被修改(或删除),之后的事务就不会执行,监控一直持续到 EXEC 命令。

MULTI 命令用于开启一个事务,它总是返回 OK。 MULTI 执行之后,客户端可以继续向服务器发送任意多条命令,这些命令不会立即被执行,而是被放到一个队列中,当 EXEC 命令被调用时,所有队列中的命令才会被执行。

EXEC 执行所有事务块内的命令。返回事务块内所有命令的返回值,按命令执行的先后顺序排列。 当操作被打断时,返回空值。

通过调用 DISCARD,客户端可以清空事务队列,并放弃执行事务, 并且客户端会从事务状态中退出。

UNWATCH 命令可以取消 WATCH 对所有 Key 的监控。

26.事务管理(ACID)概述

  • 原子性Atomicity):原子性是指事务是一个不可分割的工作单位,事务中的操作要么都发生,要么都不发生。
  • 一致性Consistency):事务前后数据的完整性必须保持一致。
  • 隔离性Isolation):多个事务并发执行时,一个事务的执行不应影响其他事务的执行
  • 持久性Durability):持久性是指一个事务一旦被提交,它对数据库中数据的改变就是永久性的,接下来即使数据库发生故障也不应该对其有任何影响。

Redis 的事务总是具有 ACID 中的 一致性隔离性,其他特性是不支持的。当服务器运行在 AOF 持久化模式下,并且 appendfsync 选项的值为 always 时,事务也具有 持久性

27.Redis 事务支持隔离性吗?

Redis 是单进程程序,并且它保证在执行事务时,不会对事务进行中断,事务可以运行直到执行完所有事务队列中的命令为止。因此,Redis 的事务是总是带有隔离性的。

28.Redis 事务保证原子性吗,支持回滚吗?

Redis 中,单条命令是原子性执行的,但事务不保证原子性,且没有回滚。事务中任意命令执行失败,其余的命令仍会被执行。

29.Redis 事务其他实现

基于 Lua 脚本,Redis 可以保证脚本内的命令一次性、按顺序地执行,其同时也不提供事务运行错误的回滚,执行过程中如果部分命令运行错误,剩下的命令还是会继续运行完。

基于中间标记变量,通过另外的标记变量来标识事务是否执行完成,读取数据时先读取该标记变量判断是否事务执行完成。但这样会需要额外写代码实现,比较繁琐。

四、集群方案

30.哨兵模式

【软件开发】Redis 理论篇(一)_第1张图片
sentinel,中文名是哨兵。哨兵是 Redis 集群机构中非常重要的一个组件,主要有以下功能:

  • 集群监控:负责监控 redis master 和 slave 进程是否正常工作。
  • 消息通知:如果某个 redis 实例有故障,那么哨兵负责发送消息作为报警通知给管理员。
  • 故障转移:如果 master node 挂掉了,会自动转移到 slave node 上。
  • 配置中心:如果故障转移发生了,通知 client 客户端新的 master 地址。

哨兵用于实现 Redis 集群的高可用,本身也是分布式的,作为一个哨兵集群去运行,互相协同工作。

  • 故障转移时,判断一个 master node 是否宕机了,需要大部分的哨兵都同意才行,涉及到了 分布式选举 的问题。
  • 即使部分哨兵节点挂掉了,哨兵集群还是能正常工作的,因为如果一个作为高可用机制重要组成部分的故障转移系统本身是单点的,那就很坑爹了。

哨兵的核心知识:

  • 哨兵至少需要 3 3 3 个实例,来保证自己的健壮性。
  • 哨兵 + Redis 主从的部署架构,是不保证数据零丢失的,只能保证 Redis 集群的高可用性。
  • 对于哨兵 + Redis 主从这种复杂的部署架构,尽量在测试环境和生产环境,都进行充足的测试和演练。

31.官方 Redis Cluster 方案(服务端路由查询)

【软件开发】Redis 理论篇(一)_第2张图片
Redis 集群模式的工作原理能说一下么?在集群模式下,Redis 的 Key 是如何寻址的?

Redis Cluster 是一种服务端 Sharding 技术, 3.0 3.0 3.0 版本开始正式提供。Redis Cluster 并没有使用一致性 Hash,而是采用 Slot(槽)的概念,一共分成 16384 16384 16384 个槽。将请求发送到任意节点,接收到请求的节点会将查询请求发送到正确的节点上执行。

  • 通过哈希的方式,将数据分片,每个节点均分存储一定哈希槽(哈希值)区间的数据,默认分配了 16384 16384 16384 个槽位。
  • 每份数据分片会存储在多个互为主从的多节点上。
  • 数据写入先写主节点,再同步到从节点(支持配置为阻塞同步)。
  • 同一分片多个节点间的数据不保持一致性。
  • 读取数据时,当客户端操作的 Key 没有分配在该节点上时,Redis 会返回转向指令,指向正确的节点。
  • 扩容时需要需要把旧节点的数据迁移一部分到新节点

在 Redis Cluster 架构下,每个 Redis 要放开两个端口号,比如一个是 6379 6379 6379,另外一个就是 + 10000 +10000 +10000 的端口号,比如 16379 16379 16379

16379 16379 16379 端口号是用来进行节点间通信的,也就是 Cluster Bus 的东西。Cluster Bus 的通信,用来进行故障检测、配置更新、故障转移授权。Cluster Bus 用了另外一种二进制的协议,Gossip 协议,用于节点间进行高效的数据交换,占用更少的网络带宽和处理时间。

分布式寻址都有哪些算法?

  • Hash 算法(大量缓存重建)
  • 一致性 Hash 算法(自动缓存迁移)+ 虚拟节点(自动负载均衡)
  • Redis Cluster 的 Hash Slot 算法

了解一致性 Hash 算法吗?

优点

  • 无中心架构,支持动态扩容,对业务透明。
  • 具备 Sentinel 的监控和自动 Failover(故障转移)能力。
  • 客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可。
  • 高性能,客户端直连 Redis 服务,免去了 proxy 代理的损耗。

缺点

  • 运维也很复杂,数据迁移需要人工干预。
  • 只能使用 0 0 0 号数据库。
  • 不支持批量操作、管道(pipeline)操作。
  • 分布式逻辑和存储模块耦合等。

32.基于客户端分配

【软件开发】Redis 理论篇(一)_第3张图片

Redis Sharding 是 Redis Cluster 出来之前,业界普遍使用的多 Redis 实例集群方法。其主要思想是采用哈希算法将 Redis 数据的 Key 进行散列,通过 Hash 函数,特定的 Key 会映射到特定的 Redis 节点上。Java Redis 客户端驱动 Jedis,支持 Redis Sharding 功能,即 ShardedJedis 以及结合缓存池的 ShardedJedisPool

  • 优点:优势在于非常简单,服务端的 Redis 实例彼此独立,相互无关联,每个 Redis 实例像单服务器一样运行,非常容易线性扩展,系统的灵活性很强。
  • 缺点:由于 Sharding 处理放到客户端,规模进一步扩大时给运维带来挑战。客户端 Sharding 不支持动态增删节点。服务端 Redis 实例群拓扑结构有变化时,每个客户端都需要更新调整。连接不能共享,当应用规模增大时,资源浪费制约优化。

33.基于代理服务器分片

【软件开发】Redis 理论篇(一)_第4张图片

客户端发送请求到一个代理组件,代理解析客户端的数据,并将请求转发至正确的节点,最后将结果回复给客户端。

  • 透明接入,业务程序不用关心后端 Redis 实例,切换成本低。
  • Proxy 的逻辑和存储的逻辑是隔离的。
  • 代理层多了一次转发,性能有所损耗。

业界开源方案

  • Twtter 开源的 Twemproxy
  • 豌豆荚开源的 Codis

34.Redis 主从架构

单机的 Redis,能够承载的 QPS 大概就在上万到几万不等。对于缓存来说,一般都是用来支撑读高并发的。因此架构做成主从架构,一主多从,主负责写,并且将数据复制到其它的 slave 节点,从节点负责读。所有的读请求全部走从节点。这样也可以很轻松实现水平扩容,支撑读高并发。
【软件开发】Redis 理论篇(一)_第5张图片
Redis Replication → 主从架构 → 读写分离 → 水平扩容支撑读高并发。

Redis Replication 的核心机制

  • Redis 采用异步方式复制数据到 slave 节点,不过 Redis 2.8 开始,slave node 会周期性地确认自己每次复制的数据量;
  • 一个 master node 是可以配置多个 slave node;
  • slave node 也可以连接其他的 slave node;
  • slave node 做复制的时候,不会 block master node 的正常工作;
  • slave node 在做复制的时候,也不会 block 对自己的查询操作,它会用旧的数据集来提供服务;但是复制完成的时候,需要删除旧数据集,加载新数据集,这个时候就会暂停对外服务了;
  • slave node 主要用来进行横向扩容,做读写分离,扩容的 slave node 可以提高读的吞吐量。

注意

  • 如果采用了主从架构,那么建议必须开启 master node 的持久化,不建议用 slave node 作为 master node 的数据热备,因为那样的话,如果你关掉 master 的持久化,可能在 master 宕机重启的时候数据是空的,然后可能一经过复制, slave node 的数据也丢了。
  • 另外,master 的各种备份方案,也需要做。万一本地的所有文件丢失了,从备份中挑选一份 rdb 去恢复 master,这样才能确保启动的时候,是有数据的,即使采用了后续讲解的高可用机制,slave node 可以自动接管 master node,但也可能 sentinel 还没检测到 master failure,masternode 就自动重启了,还是可能导致上面所有的 slave node 数据被清空。

Redis 主从复制的核心原理

  • 当启动一个 slave node 的时候,它会发送一个 PSYNC 命令给 master node。
  • 如果这是 slave node 初次连接到 master node,那么会触发一次 full resynchronization 全量复制。此时 master 会启动一个后台线程,开始生成一份 RDB 快照文件。
  • 同时还会将从客户端 client 新收到的所有写命令缓存在内存中。 RDB 文件生成完毕后, master 会将这个 RDB 发送给 slave,slave 会先写入本地磁盘,然后再从本地磁盘加载到内存中。
  • 接着 master 会将内存中缓存的写命令发送到 slave,slave 也会同步这些数据。
  • slave node 如果跟 master node 有网络故障,断开了连接,会自动重连,连接之后 master node 仅会复制给 slave 部分缺少的数据。

【软件开发】Redis 理论篇(一)_第6张图片
过程原理

  • 当从库和主库建立 MS 关系后,会向主数据库发送 SYNC 命令。
  • 主库接收到 SYNC 命令后会开始在后台保存快照(RDB 持久化过程),并将期间接收到的写命令缓存起来。
  • 当快照完成后,主 Redis 会将快照文件和所有缓存的写命令发送给从 Redis。
  • 从 Redis 接收到后,会载入快照文件并且执行收到的缓存的命令。
  • 之后,主 Redis 每当接收到写命令时就会将命令发送从 Redis,从而保证数据的一致。

缺点

  • 所有的 slave 节点数据的复制和同步都由 master 节点来处理,会造成 master 节点压力太大,使用主从结构来解决。

35.Redis 集群的主从复制模型是怎样的?

为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型,每个节点都会有 N-1 个复制品。

36.生产环境中的 Redis 是怎么部署的?

  • Redis Cluster。 10 10 10 台机器, 5 5 5 台机器部署了 Redis 主实例,另外 5 5 5 台机器部署了 Redis 的从实例,每个主实例挂了一个从实例, 5 5 5 个节点对外提供读写服务,每个节点的读写高峰 QPS 可能可以达到每秒 5 5 5 万, 5 5 5 台机器最多是 25 25 25 万读写请求/s。
  • 机器是什么配置? 32 G 32G 32G 内存 + 8 8 8 核 CPU + 1 T 1T 1T 磁盘,但是分配给 Redis 进程的是 10 G 10G 10G 内存,一般线上生产环境,Redis 的内存尽量不要超过 10 G 10G 10G,超过 10 G 10G 10G 可能会有问题。
  • 5 5 5 台机器对外提供读写,一共有 50 G 50G 50G 内存。
  • 因为每个主实例都挂了一个从实例,所以是高可用的,任何一个主实例宕机,都会自动故障迁移,Redis 从实例会自动变成主实例继续提供读写服务。
  • 你往内存里写的是什么数据?每条数据的大小是多少?商品数据,每条数据是 10 K B 10KB 10KB 100 100 100 条数据是 1 M B 1MB 1MB 10 10 10 万条数据是 1 G 1G 1G。常驻内存的是 200 200 200 万条商品数据,占用内存是 20 G 20G 20G,仅仅不到总内存的 50 % 50\% 50%。目前高峰期每秒就是 3500 3500 3500 左右的请求量。

其实大型公司,会有基础架构的 Team 负责缓存集群的运维。

37.说说 Redis 哈希槽的概念?

Redis 集群没有使用一致性 Hash,而是引入了哈希槽的概念,Redis 集群有 16384 16384 16384 个哈希槽,每个 Key 通过 C R C 16 CRC16 CRC16 校验后对 16384 16384 16384 取模来决定放置哪个槽,集群的每个节点负责一部分 Hash 槽。

38.Redis 集群会有写操作丢失吗?为什么?

Redis 并不能保证数据的强一致性,这意味在实际中集群在特定的条件下可能会丢失写操作。

39.Redis 集群之间是如何复制的?

异步复制。

40.Redis 集群最大节点个数是多少?

16384 16384 16384 个。

41.Redis 集群如何选择数据库?

Redis 集群目前无法做数据库选择,默认在 0 0 0 数据库。

你可能感兴趣的:(软件开发,软件架构,数据库,redis,数据库,java,缓存,分布式)