Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)

  • Redis的复制功能分为下面两个操作:
    • 同步操作(sync)用于将从服务器的数据库状态更新至主服务器当前所处的数据库状态
    • 命令传播操作(command propagate)则用于在主服务器的数据库状态被修改,导致主从服务器的数据库状态出现不一致时,让主从服务器的数据库重新回到一致状态

一、命令传播操作

  • 新版复制功能的命令传播操作与旧版复制功能的一致,在旧版复制功能的文件中已经介绍过了,可以见文章:https://blog.csdn.net/qq_41453285/article/details/103332968

二、同步操作(PSYNC命令)

  • 为了解决旧版复制功能在处理断线重复制情况时的低效问题,Redis从2.8版本开始,使用PSYNC命令代替SYNC命令来执行复制时的同步操作
  • PSYNC命令具有完整重同步(full resy nchronization)和部分重同步(partial resynchronization)两种模式:
    • 完整重同步:用于处理初次复制情况:完整重同步的执行步骤和SYNC命令的执行步 骤基本一样,它们都是通过让主服务器创建并发送RDB文件,以及向从服务器发送保存在缓 冲区里面的写命令来进行同步
    • 部分重同步:则用于处理断线后重复制情况:当从服务器在断线后重新连接主服务器 时,如果条件允许,主服务器可以将主从服务器连接断开期间执行的写命令发送给从服务 器,从服务器只要接收并执行这些写命令,就可以将数据库更新至主服务器当前所处的状态
  • PSYNC命令的部分重同步模式解决了旧版复制功能在处理断线后重复制时出现的低效情况

部分重同步的演示案例

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第1张图片

  • 对比一下SYNC命令和PSYNC命令处理断线重复制的方法,不难看出,虽然SYNC命令和PSYNC命令都可以让断线的主从服务器重新回到一致状态,但执行部分重同步所需的资源比起执行SYNC命令所需的资源要少得多,完成同步的速度也快得多。执行SYNC命令需要生成、传送和载入整个RDB文件,而部分重同步只需要将从服务器缺少的写命令发送给从服务器执行就可以了
  • 下图展示了主从服务器在执行部分重同步时的通信过程:

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第2张图片

三、同步的实现细节

  • 同步功能由以下三个部分构成:
    • 主服务器的复制偏移量(replication offset)和从服务器的复制偏移量
    • 主服务器的复制积压缓冲区(replication backlog)
    • 服务器的运行ID(run ID)

复制偏移量

  • 执行复制的双方——主服务器和从服务器会分别维护一个复制偏移量:
    • 主服务器每次向从服务器传播N个字节的数据时,就将自己的复制偏移量的值加上N
    • 从服务器每次收到主服务器传播来的N个字节的数据时,就将自己的复制偏移量的值加上N
  • 通过对比主从服务器的复制偏移量,程序可以很容易地知道主从服务器是否处于一致状态:
    • 如果主从服务器处于一致状态,那么主从服务器两者的偏移量总是相同的
    • 相反,如果主从服务器两者的偏移量并不相同,那么说明主从服务器并未处于一致状态
  • 在下图所示的例子中,主从服务器的复制偏移量的值都为10086

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第3张图片

  • 如果这时主服务器向三个从服务器传播长度为33字节的数据,那么主服务器的复制偏移量将更新为10086+33=10119,而三个从服务器在接收到主服务器传播的数据之后,也会将复制偏移量更新为10119,如下图所示:

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第4张图片

网络断开重连后的复制偏移量

  • 考虑以下这个例子:假设如上面的图片所示,主从服务器当前的复制偏移量都为10086,但是就在主服务器要向从服务器传播长度为33字节的数据之前,从服务器A断线了,那么主服务 器传播的数据将只有从服务器B和从服务器C能收到,在这之后,主服务器、从服务器B和从 服务器C三个服务器的复制偏移量都将更新为10119,而断线的从服务器A的复制偏移量仍然停留在10086,这说明从服务器A与主服务器并不一致,如下图所示:

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第5张图片

  • 假设从服务器A在断线之后就立即重新连接主服务器,并且成功,那么接下来,从服务器将向主服务器发送PSYNC命令,报告从服务器A当前的复制偏移量为10086,那么这时, 主服务器应该对从服务器执行完整重同步还是部分重同步呢?如果执行部分重同步的话,主 服务器又如何补偿从服务器A在断线期间丢失的那部分数据呢?以上问题的答案都和复制积压缓冲区有关

复制积压缓冲区

  • 复制积压缓冲区是由主服务器维护的一个固定长度(fixed-size)先进先出(FIFO)队列,默认大小为1MB

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第6张图片

  • 当主服务器进行命令传播时,它不仅会将写命令发送给所有从服务器,还会将写命令入队到复制积压缓冲区里面,如下图所示:

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第7张图片

  • 因此,主服务器的复制积压缓冲区里面会保存着一部分最近传播的写命令,并且复制积压缓冲区会为队列中的每个字节记录相应的复制偏移量,就像下表展示的那样

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第8张图片

  • 当从服务器重新连上主服务器时,从服务器会通过PSYNC命令将自己的复制偏移量offset发送给主服务器,主服务器会根据这个复制偏移量来决定对从服务器执行何种同步操 作:
    • 如果offset偏移量之后的数据(也即是偏移量offset+1开始的数据)仍然存在于复制积压缓冲区里面,那么主服务器将对从服务器执行部分重同步操作
    • 相反,如果offset偏移量之后的数据已经不存在于复制积压缓冲区,那么主服务器将对从服务器执行完整重同步操作

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第9张图片

演示案例:

  • 回到之前上面图片所展示的断线后重连接例子:

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第10张图片

  • 当从服务器A断线之后,它立即重新连接主服务器,并向主服务器发送PSYNC命令,报告自己的复制偏移量为10086
  • 主服务器收到从服务器发来的PSYNC命令以及偏移量10086之后,主服务器将检查偏移量10086之后的数据是否存在于复制积压缓冲区里面,结果发现这些数据仍然存在,于是主服务器向从服务器发送+CONTINUE回复,表示数据同步将以部分重同步模式来进行
  • 接着主服务器会将复制积压缓冲区10086偏移量之后的所有数据(偏移量为10087至 10119)都发送给从服务器
  • 从服务器只要接收这33字节的缺失数据,就可以回到与主服务器一致的状态,如下图所示

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第11张图片

服务器运行ID

  • 除了复制偏移量和复制积压缓冲区之外,实现部分重同步还需要用到服务器运行ID(run ID):
    • 每个Redis服务器,不论主服务器还是从服务,都会有自己的运行ID
    • 运行ID在服务器启动时自动生成,由40个随机的十六进制字符组成,例如 53b9b28df8042fdc9ab5e3fcbbbabff1d5dce2b3
  • 当从服务器对主服务器进行初次复制时,主服务器会将自己的运行ID传送给从服务器, 而从服务器则会将这个运行ID保存起来
  • 当从服务器断线并重新连上一个主服务器时,从服务器将向当前连接的主服务器发送之前保存的运行ID:
    • 如果从服务器保存的运行ID和当前连接的主服务器的运行ID相同,那么说明从服务器 断线之前复制的就是当前连接的这个主服务器,主服务器可以继续尝试执行部分重同步操 作
    • 相反地,如果从服务器保存的运行ID和当前连接的主服务器的运行ID并不相同,那么 说明从服务器断线之前复制的主服务器并不是当前连接的这个主服务器,主服务器将对从服 务器执行完整重同步操作
  • 举个例子,假设从服务器原本正在复制一个运行ID为 53b9b28df8042fdc9ab5e3fcbbbabff1d5dce2b3的主服务器,那么在网络断开,从服务器重新连 接上主服务器之后,从服务器将向主服务器发送这个运行ID,主服务器根据自己的运行ID是 否53b9b28df8042fdc9ab5e3fcbbbabff1d5dce2b3来判断是执行部分重同步还是执行完整重同步

四、PSYNC命令的实现

PSYNC命令的调用方法有两种:

  • 如果从服务器以前没有复制过任何主服务器,或者之前执行过SLAVEOF no one命令:那么从服务器在开始一次新的复制时将向主服务器发送PSYNC ? -1命令,主动请求主服务器进行完整重同步(因为这时不可能执行部分重同步)
  • 如果从服务器已经复制过某个主服务器,那么从服务器在开始一次新的复制时将向主服务器发送PSYNC 命令:
    • 其中runid是上一次复制的主服务器的运行 ID,而offset则是从服务器当前的复制偏移量
    • 接收到这个命令的主服务器会通过这两个参数来判断应该对从服务器执行哪种同步操作

接收到PSYNC命令的主服务器会向从服务器返回以下三种回复的其中一种:

  • 如果主服务器返回+FULLRESYNC 回复,那么表示主服务器将与从服务器执行完整重同步操作:其中runid是这个主服务器的运行ID,从服务器会将这个ID保存起 来,在下一次发送PSYNC命令时使用;而offset则是主服务器当前的复制偏移量,从服务器 会将这个值作为自己的初始化偏移量
  • 如果主服务器返回+CONTINUE回复,那么表示主服务器将与从服务器执行部分重同步操作,从服务器只要等着主服务器将自己缺少的那部分数据发送过来就可以了
  • 如果主服务器返回-ERR回复,那么表示主服务器的版本低于Redis 2.8,它识别不了PSYNC命令,从服务器将向主服务器发送SYNC命令,并与主服务器执行完整同步操作
  • 下面的流程图总结了PSYNC命令执行完整重同步和部分重同步时可能遇上的情况:

Redis(设计与实现):38---复制之新版复制功能(Redis 2.8版本之后、PSYNC命令)_第12张图片

演示案例

为了熟悉PSYNC命令的用法,让我们来看一个完整的复制——网络中断——重复制例 子

  • 首先,假设有两个Redis服务器,它们的版本都是Redis 2.8,其中主服务器的地址为 127.0.0.1:6379,从服务器的地址为127.0.0.1:12345
  • 如果客户端向从服务器发送命令SLAVEOF 127.0.0.1 6379,并且假设从服务器是第一次 执行复制操作,那么从服务器将向主服务器发送PSYNC ? -1命令,请求主服务器执行完整重 同步操作
  • 主服务器在收到完整重同步请求之后,将在后台执行BGSAVE命令,并向从服务器返回 +FULLRESYNC  53b9b28df8042fdc9ab5e3fcbbbabff1d5dce2b3  10086回复,其中 53b9b28df8042fdc9ab5e3fcbbbabff1d5dce2b3是主服务器的运行ID,而10086则是主服务器当 前的复制偏移量
  • 假设完整重同步成功执行,并且主从服务器在一段时间之后仍然保持一致,但是在复制 偏移量为20000的时候,主从服务器之间的网络连接中断了,这时从服务器将重新连接主服 务器,并再次对主服务器进行复制。
  • 因为之前曾经对主服务器进行过复制,所以从服务器将向主服务器发送命令PSYNC 53b9b28df8042fdc9ab5e3fcbbbabff1d5dce2b3 20000,请求进行部分重同步
  • 主服务器在接收到从服务器的PSYNC命令之后,首先对比从服务器传来的运行 ID53b9b28df8042fdc9ab5e3fcbbbabff1d5dce2b3和主服务器自身的运行ID,结果显示该ID和 主服务器的运行ID相同,于是主服务器继续读取从服务器传来的偏移量20000,检查偏移量 为20000之后的数据是否存在于复制积压缓冲区里面,结果发现数据仍然存在
  • 确认运行ID相同并且数据存在之后,主服务器将向从服务器返回+CONTINUE回复,表 示将与从服务器执行部分重同步操作,之后主服务器会将保存在复制积压缓冲区20000偏移 量之后的所有数据发送给从服务器,主从服务器将再次回到一致状态

你可能感兴趣的:(Redis(设计与实现),新版复制功能的实现,PSYNC命令)