Redis5.0版本新出stream数据结构,是实现消息队列的功能的。
Redis Stream 的结构如上图所示,每一个Stream都有一个消息链表,将所有加入的消息都串起来,每个消息都有一个唯一的 ID 和对应的内容。
每个 Stream 都有唯一的名称,它就是 Redis 的 key,在我们首次使用xadd指令追加消息时创建的。
每个 Stream 都可以挂多个消费组,每个消费组会有个游标last_delivered_id在 Stream 数组之上往前移动,表示当前消费组已经消费到哪条消息了。每个消费组都有一个 Stream 内唯一的名称,消费组不会自动创建,它需要单独的指令xgroup create进行创建,需要指定从 Stream 的某个消息 ID 开始消费,这个 ID 用来初始化last_delivered_id变量。
每个消费组 (Consumer Group) 的状态都是独立的,相互不受影响。也就是说同一份 Stream 内部的消息会被每个消费组都消费到。
同一个消费组 (Consumer Group) 可以挂接多个消费者 (Consumer),这些消费者之间是竞争关系,任意一个消费者读取了消息都会使游标last_delivered_id往前移动。每个消费者有一个组内唯一名称。
消费者 (Consumer) 内部会有个状态变量pending_ids,它记录了当前已经被客户端读取,但是还没有 ack的消息。
消息 ID 的形式是timestampInMillis-sequence,时间戳-流水号。消息 ID 可以由服务器自动生成,也可以由客户端自己指定,但是形式必须是整数-整数,而且必须是后面加入的消息的 ID 要大于前面的消息 ID。建议不要自己指定
消息内容就是键值对,形如 hash 结构的键值对
生产端常用命令如下所示:
# 追加消息
# xadd stream名字 消息id key value [key value ...]
xadd streamtest * name hushang age 23
# 删除消息,这里的删除仅仅是设置了标志位,不会实际删除消息。如果不指定消息id直接执行则是删除整个stream中的消息
# xdel stream名字 消息id
xdel streamtest 165847589548-0
# 获取消息,会过滤掉删除了的消息,也可以用- + 表示获取所有消息,-表示最小值 + 表示最大值
# xrange stream名字 最小消息id 最大消息id
xrange streamtest - +
# 获取stream中消息数量
# xlen stream名字
xlen streamtest
# 删除stream
del stream名字
案例
# 首先新增三条消息
127.0.0.1:6379> xadd streamtest * name hushang age 23
"1679980604367-0"
127.0.0.1:6379> xadd streamtest * name zhangsan age 24
"1679980624235-0"
127.0.0.1:6379> xadd streamtest * name lisi age 18
"1679980635354-0"
# 查询消息
127.0.0.1:6379> xrange streamtest - +
1) 1) "1679980604367-0"
2) 1) "name"
2) "hushang"
3) "age"
4) "23"
2) 1) "1679980624235-0"
2) 1) "name"
2) "zhangsan"
3) "age"
4) "24"
3) 1) "1679980635354-0"
2) 1) "name"
2) "lisi"
3) "age"
4) "18"
127.0.0.1:6379> xrange streamtest - 1679980624235-0
1) 1) "1679980604367-0"
2) 1) "name"
2) "hushang"
3) "age"
4) "23"
2) 1) "1679980624235-0"
2) 1) "name"
2) "zhangsan"
3) "age"
4) "24"
# 获取消息数量与删除消息
127.0.0.1:6379> xlen streamtest
(integer) 3
127.0.0.1:6379> xdel streamtest 1679980604367-0
(integer) 1
127.0.0.1:6379> xlen streamtest
(integer) 2
单消费者
stream中一般是以消费者组进行消费,但我们也可以使用单消费者,
Redis 设计了一个单独的消费指令xread,可以将 Stream 当成普通的消息队列 (list) 来使用。使用 xread 时,我们可以完全忽略消费组 (Consumer Group) 的存在,就好比 Stream 就是一个普通的列表 (list)。
# 可以使用0-0表示从头开始读取消息
# 最后一个参数消息id是一个开区间(n,+∞),也就是说不会读取到指定消息id的这条消息
# xread count 读取消息数量 streams stream名字 从哪条消息id开始读
xread count 1 streams streamName 0-0
也可以使用$
从尾开始读取,也就是当前时间之前发送的消息都不会读取到
xread count 1 streams streamName $
但是这条命名默认是不返回任何消息的,需要使用阻塞的方式读取
# block后面的数字代表阻塞时间,单位毫秒
xread count 1 block 0 streams streamName $
如下所示
# 直接从尾部读取没有数据返回
127.0.0.1:6379> xread count 1 streams streamtest $
(nil)
# 加上阻塞读取后,重新打开一个会话往steam中新加一条消息,然后这边就有返回了,最后返回的时间是阻塞了多久
127.0.0.1:6379> xread count 1 block 0 streams streamtest $
1) 1) "streamtest"
2) 1) 1) "1679983057656-0"
2) 1) "name"
2) "wangwu"
3) "age"
4) "111"
(40.16s)
127.0.0.1:6379>
# 如果阻塞时间不写0 那么等到指定的阻塞时间一到就结束了
127.0.0.1:6379> xread count 1 block 1000 streams streamtest $
(nil)
(1.07s)
127.0.0.1:6379>
这种单消费者方式不会有消费消息的offset偏移量,想要实现顺序消费消息,那么就需要自己维护消息id,记录当前已经消费到哪一个id了
消费者组group
消费者组中有一个last_delivered_id记录当前消费到那一条消息了,在创建消费者组时就需要传递一个消息id作为last_delivered_id
的值
# 创建一个消费者组,0-0表示从头开始消费,
# xgroup create 要消费的stream名 消费者组名 从哪一个消息id开始消费
xgroup create streamtest hs-group 0-0
# 也可以加$表示从尾部开始消费,当前时间之前发送的消息都不会被消费
xgroup create hs-group streamtest $
可以使用xinfo stream stream名字
命令来查看stream的情况
# 目前streamtest中有三条消息
127.0.0.1:6379> xrange streamtest - +
1) 1) "1679980624235-0"
2) 1) "name"
2) "zhangsan"
3) "age"
4) "24"
2) 1) "1679980635354-0"
2) 1) "name"
2) "lisi"
3) "age"
4) "18"
3) 1) "1679983057656-0"
2) 1) "name"
2) "wangwu"
3) "age"
4) "111"
127.0.0.1:6379> xinfo stream streamtest
1) "length"
2) (integer) 3 # 消息的数据量
3) "radix-tree-keys"
4) (integer) 1
5) "radix-tree-nodes"
6) (integer) 2
7) "groups"
8) (integer) 1 # 1个消费组
9) "last-generated-id"
10) "1679983057656-0" # 最后一条消息的消息id
11) "first-entry"
12) 1) "1679980624235-0" # 第一条消息与最后一条消息
2) 1) "name"
2) "zhangsan"
3) "age"
4) "24"
13) "last-entry"
14) 1) "1679983057656-0"
2) 1) "name"
2) "wangwu"
3) "age"
4) "111"
也可以使用xinfo groups stream名
来查看消费者组情况
127.0.0.1:6379> xinfo groups streamtest
1) 1) "name"
2) "hs-group" # 消费者组名
3) "consumers"
4) (integer) 0 # 消费者组中目前还没有消费者
5) "pending"
6) (integer) 0 # 有多少条消息为ack应答
7) "last-delivered-id" # 从哪条消息开始消费,也就是消费消息的offset
8) "0-0"
有了消费组,自然还需要消费者,Stream 提供了 xreadgroup
指令可以进行消费组的组内消费,需要提供消费组名称、消费者名称和起始消息 ID。
它同 xread
一样,也可以阻塞等待新消息。读到新消息后,对应的消息 ID 就会进入消费者的PEL(正在处理的消息) 结构里,客户端处理完毕后使用 xack 指令通知服务器,本条消息已经处理完毕,该消息 ID 就会从 PEL 中移除。
# 最后的> 表示从当前消费组的 last_delivered_id 后面开始读,每当消费者读取一条消息,last_delivered_id 变量就会前进
# xreadgroup GROUP 消费者组名 消费者名 count 消费消息数量 streams stream名 >
xreadgroup GROUP hs-group c1 count 1 streams streamtest >
开始读取消息
127.0.0.1:6379> xreadgroup GROUP hs-group c1 count 1 streams streamtest >
1) 1) "streamtest"
2) 1) 1) "1679980624235-0"
2) 1) "name"
2) "zhangsan"
3) "age"
4) "24"
127.0.0.1:6379> xreadgroup GROUP hs-group c1 count 1 streams streamtest >
1) 1) "streamtest"
2) 1) 1) "1679980635354-0"
2) 1) "name"
2) "lisi"
3) "age"
4) "18"
127.0.0.1:6379> xreadgroup GROUP hs-group c1 count 1 streams streamtest >
1) 1) "streamtest"
2) 1) 1) "1679983057656-0"
2) 1) "name"
2) "wangwu"
3) "age"
4) "111"
# 三条消息读完后就没有了
127.0.0.1:6379> xreadgroup GROUP hs-group c1 count 1 streams streamtest >
(nil)
# 接下来加上 block 0 尝试阻塞读取消息,当其他会话执行xadd命令后这边就能读取到数据了
127.0.0.1:6379> xreadgroup GROUP hs-group c1 count 1 streams streamtest >
1) 1) "streamtest"
2) 1) 1) "1679985519302-0"
2) 1) "name"
2) "zhaoliu"
3) "age"
4) "123"
(11.90s)
127.0.0.1:6379>
还可以通过xinfo consumers stream名字 消费者组名
来查看消费者组中消费者的信息
127.0.0.1:6379> xinfo consumers streamtest hs-group
1) 1) "name"
2) "c1" # 消费者名
3) "pending"
4) (integer) 4 # 当前有多少条消息未ack应答
5) "idle"
6) (integer) 199097 # 空闲了199097ms没有读取消息
ack应答
# xack streamtest 消费者组名 消息id [消息id...]
127.0.0.1:6379> xack streamtest hs-group 1679980624235-0
(integer) 1
# 现在再查看当前消费者组就只用3条消息未查看应答了
127.0.0.1:6379> xinfo consumers streamtest hs-group
1) 1) "name"
2) "c1"
3) "pending"
4) (integer) 3
5) "idle"
6) (integer) 351981
127.0.0.1:6379> xinfo groups streamtest
1) 1) "name"
2) "hs-group"
3) "consumers"
4) (integer) 1
5) "pending"
6) (integer) 3
7) "last-delivered-id"
8) "1679985519302-0"
基于List的lpush + brpop
需要处理空闲连接的问题,如果线程一直阻塞在那里,Redis客户端的连接就成了闲置连接,闲置过久,服务器一般会主动断开连接,减少闲置资源占用,这个时候blpop和brpop或抛出异常,所以在编写客户端消费者的时候要小心,如果捕获到异常需要重试。
基于Sorted-Set的实现
多用来实现延迟队列,当然也可以实现有序的普通的消息队列,但是消费者无法阻塞的获取消息,只能轮询,不允许重复消息。
PUB/SUB,订阅/发布模式
优点:
典型的广播模式,一个消息可以发布到多个消费者;多信道订阅,消费者可以同时订阅多个信道,从而接收多类消息;消息即时发送,消息不用等待消费者读取,消费者会自动接收到信道发布的消息。
缺点:
消息一旦发布,不能接收。换句话就是发布时若客户端不在线,则消息丢失,不能寻回;
基于Stream类型的实现
基本上已经有了一个消息中间件的雏形
这里首先介绍一下Reactor模式
具体事件处理程序不调用反应器,而向反应器注册一个事件处理器,表示自己对某些事件感兴趣,有事件来了,具体事件处理程序通过事件处理器对某个指定的事件发生做出反应;
单线程Reactor模式
客户端与服务端通信一般是下面几个步骤:建立连接、服务器读取数据、解码、计算处理、编码、响应给客户端
这种模式下所有的事情都是一个Reactor线程来做
单线程Reactor,工作者线程池
将非I/O操作从Reactor线程中移出转交给工作者线程池来执行,Reactor线程仅仅去处理客户端连接、读取、响应。而具体的处理交给多个工作线程去做
多Reactor线程模式
如果客户端的连接非常多,一个reactor线程也忙不过来时,那么这一块也可以使用多线程,一个主reactor线程去处理客户端的连接,子reactor线程处理读取和响应,工作线程处理业务操作
Redis 基于 Reactor 模式开发了自己的网络事件处理器 - 文件事件处理器(file event handler,后文简称为 FEH),而该处理器又是单线程的,所以redis设计为单线程模型。
多路复用、文件事件分派、文件事件处理都是一个线程。
这里的socket可以理解为就是一个redis客户端
采用I/O多路复用同时监听多个socket,根据socket当前执行的事件来为 socket 选择对应的文件事件处理器。
当被监听的socket准备好执行accept、read、write、close等操作时,和操作对应的文件事件就会产生,这时FEH就会调用socket之前关联好的事件处理器来处理对应事件。
socket
文件事件就是对socket操作的抽象, 每当一个 socket 准备好执行连接accept、read、write、close等操作时, 就会产生一个文件事件。一个服务器通常会连接多个socket, 多个socket可能并发产生不同操作,每个操作对应不同文件事件。
I/O多路复用程序
I/O 多路复用程序会负责监听多个socket。
尽管文件事件可能并发出现, 但 I/O 多路复用程序会将所有产生事件的socket放入队列, 通过该队列以有序、同步且每次一个socket的方式向文件事件分派器传送socket。
当上一个socket产生的事件被对应事件处理器执行完后, I/O 多路复用程序才会向文件事件分派器传送下个socket, 如下:
文件事件分派器
文件事件分派器接收 I/O 多路复用程序传来的socket, 并根据socket产生的事件类型, 调用相应的事件处理器。
文件事件处理器
服务器会为执行不同任务的套接字关联不同的事件处理器, 这些处理器是一个个函数, 它们定义了某个事件发生时, 服务器应该执行的动作。
文件事件的类型
I/O 多路复用程序可以监听多个socket的 ae.h/AE_READABLE 事件和 ae.h/AE_WRITABLE 事件, 这两类事件和套接字操作之间的对应关系如下:
当socket可读(比如客户端对Redis执行write/close操作),或有新的可应答的socket出现时(即客户端对Redis执行connect操作),socket就会产生一个AE_READABLE事件。
当socket可写时(比如客户端对Redis执行read操作),socket会产生一个AE_WRITABLE事件。
I/O多路复用程序可以同时监听AE_REABLE和AE_WRITABLE两种事件,要是一个socket同时产生这两种事件,那么文件事件分派器优先处理AE_REABLE事件。即一个socket又可读又可写时, Redis服务器先读后写socket。
总结
最后,让我们梳理一下客户端和Redis服务器通信的整个过程:
redis6.0版本之前,一个主线程处理用户的请求,包括读、解析、执行、响应。
但是还有一些后台线程执行其他操作比如:持久化、bigkey删除等等
这个时候cpu不是redis的瓶颈,redis的瓶颈是网络和内存的读写,既然不是cpu瓶颈也就没有必要用多线程了,使用现在的多路复用+FEH事件模型也能达到每秒10w的请求
redis6.0版本中,处理用户的请求的操作还是一个主线程来执行的,Redis的多线程部分只是用来处理网络数据的读写和协议解析。
因为用户量越来越大,一些公司的QPS已经超过了每秒10w的请求。执行一次redis命令,大部分的耗时都是在网络数据的读写上面,那么就在这一块用了多线程来进行,而其他操作还是由主线程来做。
Redis6.0多线程的实现机制
流程简述如下:
1、主线程负责接收建立连接请求,获取 socket 放入全局等待读处理队列
2、主线程处理完读事件之后,通过 RR(Round Robin) 将这些连接分配给这些 IO 线程
3、主线程阻塞等待 IO 线程读取 socket 完毕
4、主线程通过单线程的方式执行请求命令,请求数据读取并解析完成,但并不执行回写 socket
5、主线程阻塞等待 IO 线程将数据回写 socket 完毕
6、解除绑定,清空等待队列
该设计有如下特点:
1、IO 线程要么同时在读 socket,要么同时在写,不会同时读或写
2、IO 线程只负责读写 socket 解析命令,不负责命令处理