Redis 是一个使用 C 语言写成的,开源的高性能 Key-Value 非关系缓存数据库。它支持存储的 Value 类型相对更多,包括 string
(字符串)、list
(链表)、set
(集合)、zset
(sorted set
,有序集合)和 hash
(哈希类型)。Redis 的数据都基于缓存的,所以很快,每秒可以处理超过 10 10 10 万次读写操作,是已知性能最快的 Key-Value DB。Redis 也可以实现数据写入磁盘中,保证了数据安全不丢失,而且 Redis 的操作是原子性的。
优点:
AOF
和 RDB
两种持久化方式。string
类型的 value 外,还支持 hash
、set
、zset
、list
等数据结构。缺点:
string
,list
,set
,sorted set
,hash
。主要从 高性能 和 高并发 这两点来看待这个问题。
map
或者 guava
实现的是本地缓存,最主要的特点是轻量以及快速,生命周期随着 jvm
的销毁而结束,并且在多实例的情况下,每个实例都需要各自保存一份缓存,缓存不具有一致性。Redis 主要有 5 种数据类型,包括 String
,List
,Set
,Zset
,Hash
,满足大部分的使用要求。
Magento
为例,Magento
提供一个插件来使用 Redis 作为全页缓存后端。此外,对 WordPress 的用户来说,Pantheon
有一个非常好的插件 wp-redis
,这个插件能帮助你以最快速度加载你曾浏览过的页面。Lpush
和 Rpop
写入和读取消息。不过最好使用 Kafka
、RabbitMQ
等消息中间件。SETNX
命令实现分布式锁,除此之外,还可以使用官方提供的 RedLock
分布式锁实现。持久化就是把内存的数据写到磁盘中去,防止服务宕机了内存数据丢失。
Redis 提供两种持久化机制 RDB
(默认)和 AOF
机制。
RDB
(Redis DataBase
)是 Redis 默认的持久化方式。按照一定的时间将内存的数据以快照的形式保存到硬盘中,对应产生的数据文件为 dump.rdb
。通过配置文件中的 save
参数来定义快照的周期。
优点:
dump.rdb
,方便持久化。缺点:
AOF
(Append Only File
)持久化,则是将 Redis 执行的每次写命令记录到单独的日志文件中,当重启 Redis 会重新将持久化的日志中文件恢复数据。
优点:
appendfsync
属性,有 always
,每进行一次命令操作就记录到 AOF 文件中一次。append
模式写文件,即使中途服务器宕机,可以通过 redis-check-aof
工具解决数据一致性问题。rewrite
模式。AOF 文件没被 rewrite
之前(文件过大时会对命令进行合并重写),可以删除其中的某些命令(比如误操作的 flushall
)。缺点:
两种持久化的优缺点是什么?
PostgreSQL
的数据安全性,你应该同时使用两种持久化功能。在这种情况下,当 Redis 重启的时候会优先载入 AOF 文件来恢复原始的数据,因为在通常情况下 AOF 文件保存的数据集要比 RDB 文件保存的数据集要完整。snapshot
)非常便于进行数据库备份, 并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快,除此之外,使用 RDB 还可以避免 AOF 程序的 bug。keys-to-nodes
映射关系,节点的数量一旦确定,则不能变化;否则的话(即 Redis 节点需要动态变化的情况),必须使用可以在运行时进行数据再平衡的一套系统,而当前只有 Redis 集群可以做到这样。我们都知道,Redis 是 Key-Value 数据库,我们可以设置 Redis 中缓存的 Key 的过期时间。Redis 的过期策略就是指当 Redis 中缓存的 Key 过期了,Redis 如何处理。
过期策略通常有以下三种:
expires
字典中一定数量的 Key,并清除其中已过期的 Key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时,可以在不同情况下使得 CPU 和内存资源达到最优的平衡效果。expires
字典会保存所有设置了过期时间的 Key 的过期时间数据,其中,Key 是指向键空间中的某个键的指针,Value 是该键的毫秒精度的 UNIX 时间戳表示的过期时间。键空间是指该 Redis 集群中保存的所有键。Redis 中同时使用了 惰性过期 和 定期过期 两种过期策略。
expire
和 persist
命令。
除了缓存服务器自带的缓存失效策略之外(Redis 默认的有 6 种策略可供选择),我们还可以根据具体的业务需求进行自定义的缓存淘汰,常见的策略有两种:
两者各有优劣,第一种的缺点是维护大量缓存的 Key 是比较麻烦的,第二种的缺点就是每次用户请求过来都要判断缓存失效,逻辑相对比较复杂!具体用哪种方案,大家可以根据自己的应用场景来权衡。
Redis 内存数据集大小上升到一定大小的时候,就会施行数据淘汰策略。
Redis 的内存淘汰策略是指在 Redis 用于缓存的内存不足时,怎么处理需要新写入且需要申请额外空间的数据。
(1)全局的键空间选择性移除
noeviction
:当内存不足以容纳新写入数据时,新写入操作会报错。allkeys-lru
:当内存不足以容纳新写入数据时,在键空间中,移除最近最少使用的 Key。(这个是最常用的)allkeys-random
:当内存不足以容纳新写入数据时,在键空间中,随机移除某个 Key。(2)设置过期时间的键空间选择性移除
volatile-lru
:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,移除最近最少使用的 Key。volatile-random
:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,随机移除某个 Key。volatile-ttl
:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,有更早过期时间的 Key 优先移除。Redis 的内存淘汰策略的选取并不会影响过期的 Key 的处理。内存淘汰策略 用于处理内存不足时的需要申请额外空间的数据;过期策略 用于处理过期的缓存数据。
内存。
如果达到设置的上限,Redis 的写命令会返回错误信息(但是读命令还可以正常返回)。或者你可
以配置内存淘汰机制,当 Redis 达到内存上限时会冲刷掉旧的内容。
可以好好利用 hash
、list
、sorted set
、set
等集合类型数据,因为通常情况下很多小的 Key-Value 可以用更紧凑的方式存放到一起。
尽可能使用散列表(Hashes
),散列表使用的内存非常小(是说散列表里面存储的数少),所以你应该尽可能的将你的数据模型抽象到一个散列表里面。比如你的 Web 系统中有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的 Key,而是应该把这个用户的所有信息存储到一张散列表里面。
Redis 基于 Reactor
模式开发了网络事件处理器,这个处理器被称为 文件事件处理器(File Event Handler
)。它的组成结构为 4 4 4 部分:多个套接字、I/O 多路复用程序、文件事件分派器、事件处理器。因为文件事件分派器队列的消费是单线程的,所以 Redis 才叫单线程模型。文件事件处理器使用 I/O 多路复用(Multiplexing
)程序来同时监听多个套接字, 并根据套接字目前执行的任务来为套接字关联不同的事件处理器。
当被监听的套接字准备好执行连接应答(accept
)、读取(read
)、写入(write
)、关闭(close
)等操作时, 与操作相对应的文件事件就会产生, 这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件。虽然文件事件处理器以单线程方式运行, 但通过使用 I/O 多路复用程序来监听多个套接字, 文件事件处理器既实现了高性能的网络通信模型, 又可以很好地与 Redis 服务器中其他同样以单线程方式运行的模块进行对接, 这保持了 Redis 内部单线程设计的简单性。
事务是一个单独的隔离操作:事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中,不会被其他客户端发送来的命令请求所打断。
事务是一个原子操作:事务中的命令要么全部被执行,要么全部都不执行。
Redis 事务的本质是通过 MULTI
、EXEC
、WATCH
等一组命令的集合。事务支持一次执行多个命令,一个事务中所有命令都会被序列化。在事务执行过程,会按照顺序串行化执行队列中的命令,其他客户端提交的命令请求不会插入到事务执行命令序列中。
总结说:Redis 事务就是一次性、顺序性、排他性的执行一个队列中的一系列命令。
MULTI
EXEC
事务执行过程中,如果服务端收到有 EXEC
、DISCARD
、WATCH
、MULTI
之外的请求,将会把请求放入队列中排队。
Redis 事务功能是通过 MULTI
、EXEC
、DISCARD
和 WATCH
四个原语实现的。
Redis 会将一个事务中的所有命令序列化,然后按顺序执行。
WATCH
命令是一个乐观锁,可以为 Redis 事务提供 Check-and-Set
(CAS
)行为。 可以监控一个或多个键,一旦其中有一个键被修改(或删除),之后的事务就不会执行,监控一直持续到 EXEC
命令。
MULTI
命令用于开启一个事务,它总是返回 OK。 MULTI
执行之后,客户端可以继续向服务器发送任意多条命令,这些命令不会立即被执行,而是被放到一个队列中,当 EXEC
命令被调用时,所有队列中的命令才会被执行。
EXEC
执行所有事务块内的命令。返回事务块内所有命令的返回值,按命令执行的先后顺序排列。 当操作被打断时,返回空值。
通过调用 DISCARD
,客户端可以清空事务队列,并放弃执行事务, 并且客户端会从事务状态中退出。
UNWATCH
命令可以取消 WATCH
对所有 Key 的监控。
Atomicity
):原子性是指事务是一个不可分割的工作单位,事务中的操作要么都发生,要么都不发生。Consistency
):事务前后数据的完整性必须保持一致。Isolation
):多个事务并发执行时,一个事务的执行不应影响其他事务的执行Durability
):持久性是指一个事务一旦被提交,它对数据库中数据的改变就是永久性的,接下来即使数据库发生故障也不应该对其有任何影响。Redis 的事务总是具有 ACID 中的 一致性 和 隔离性,其他特性是不支持的。当服务器运行在 AOF
持久化模式下,并且 appendfsync
选项的值为 always
时,事务也具有 持久性。
Redis 是单进程程序,并且它保证在执行事务时,不会对事务进行中断,事务可以运行直到执行完所有事务队列中的命令为止。因此,Redis 的事务是总是带有隔离性的。
Redis 中,单条命令是原子性执行的,但事务不保证原子性,且没有回滚。事务中任意命令执行失败,其余的命令仍会被执行。
基于 Lua 脚本,Redis 可以保证脚本内的命令一次性、按顺序地执行,其同时也不提供事务运行错误的回滚,执行过程中如果部分命令运行错误,剩下的命令还是会继续运行完。
基于中间标记变量,通过另外的标记变量来标识事务是否执行完成,读取数据时先读取该标记变量判断是否事务执行完成。但这样会需要额外写代码实现,比较繁琐。
sentinel
,中文名是哨兵。哨兵是 Redis 集群机构中非常重要的一个组件,主要有以下功能:
哨兵用于实现 Redis 集群的高可用,本身也是分布式的,作为一个哨兵集群去运行,互相协同工作。
哨兵的核心知识:
Redis 集群模式的工作原理能说一下么?在集群模式下,Redis 的 Key 是如何寻址的?
Redis Cluster
是一种服务端 Sharding
技术, 3.0 3.0 3.0 版本开始正式提供。Redis Cluster
并没有使用一致性 Hash,而是采用 Slot
(槽)的概念,一共分成 16384 16384 16384 个槽。将请求发送到任意节点,接收到请求的节点会将查询请求发送到正确的节点上执行。
在 Redis Cluster 架构下,每个 Redis 要放开两个端口号,比如一个是 6379 6379 6379,另外一个就是 + 10000 +10000 +10000 的端口号,比如 16379 16379 16379。
16379 16379 16379 端口号是用来进行节点间通信的,也就是 Cluster Bus 的东西。Cluster Bus 的通信,用来进行故障检测、配置更新、故障转移授权。Cluster Bus 用了另外一种二进制的协议,Gossip
协议,用于节点间进行高效的数据交换,占用更少的网络带宽和处理时间。
分布式寻址都有哪些算法?
Hash Slot
算法了解一致性 Hash 算法吗?
优点
Sentinel
的监控和自动 Failover
(故障转移)能力。proxy
代理的损耗。缺点
pipeline
)操作。Redis Sharding
是 Redis Cluster 出来之前,业界普遍使用的多 Redis 实例集群方法。其主要思想是采用哈希算法将 Redis 数据的 Key 进行散列,通过 Hash 函数,特定的 Key 会映射到特定的 Redis 节点上。Java Redis 客户端驱动 Jedis
,支持 Redis Sharding
功能,即 ShardedJedis
以及结合缓存池的 ShardedJedisPool
。
Sharding
处理放到客户端,规模进一步扩大时给运维带来挑战。客户端 Sharding
不支持动态增删节点。服务端 Redis 实例群拓扑结构有变化时,每个客户端都需要更新调整。连接不能共享,当应用规模增大时,资源浪费制约优化。客户端发送请求到一个代理组件,代理解析客户端的数据,并将请求转发至正确的节点,最后将结果回复给客户端。
Proxy
的逻辑和存储的逻辑是隔离的。业界开源方案
Twemproxy
。Codis
。单机的 Redis,能够承载的 QPS 大概就在上万到几万不等。对于缓存来说,一般都是用来支撑读高并发的。因此架构做成主从架构,一主多从,主负责写,并且将数据复制到其它的 slave 节点,从节点负责读。所有的读请求全部走从节点。这样也可以很轻松实现水平扩容,支撑读高并发。
Redis Replication
→ 主从架构 → 读写分离 → 水平扩容支撑读高并发。
Redis Replication 的核心机制:
注意:
rdb
去恢复 master,这样才能确保启动的时候,是有数据的,即使采用了后续讲解的高可用机制,slave node 可以自动接管 master node,但也可能 sentinel
还没检测到 master failure,masternode 就自动重启了,还是可能导致上面所有的 slave node 数据被清空。Redis 主从复制的核心原理
PSYNC
命令给 master node。full resynchronization
全量复制。此时 master 会启动一个后台线程,开始生成一份 RDB
快照文件。RDB
文件生成完毕后, master 会将这个 RDB
发送给 slave,slave 会先写入本地磁盘,然后再从本地磁盘加载到内存中。SYNC
命令。SYNC
命令后会开始在后台保存快照(RDB
持久化过程),并将期间接收到的写命令缓存起来。缺点
为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型,每个节点都会有 N-1
个复制品。
其实大型公司,会有基础架构的 Team 负责缓存集群的运维。
Redis 集群没有使用一致性 Hash,而是引入了哈希槽的概念,Redis 集群有 16384 16384 16384 个哈希槽,每个 Key 通过 C R C 16 CRC16 CRC16 校验后对 16384 16384 16384 取模来决定放置哪个槽,集群的每个节点负责一部分 Hash 槽。
Redis 并不能保证数据的强一致性,这意味在实际中集群在特定的条件下可能会丢失写操作。
异步复制。
16384 16384 16384 个。
Redis 集群目前无法做数据库选择,默认在 0 0 0 数据库。