当主从同步完成后,如果此时从服务器宕机了一段时间,重新上线后势必要重新同步一下主服务器,SYNC
与 PSYNC
命令的区别就在于断线后重复制阶段处理的方式不同。
SYNC
命令,主服务器将所有数据再次重新生成RDB快照发给从服务器开始同步PSYNC
命令。主服务器根据双方数据的偏差量判断是否是需要完整重同步还是仅将断线期间执行过的写命令发给从服务器。明显可以发先PSYNC相比SYNC效率好很多,要知道同步所有数据是一个非常费资源(磁盘IO,网络)的操作,而如果只是因为短暂网络不稳定就同步所有资源是非常不值的。
实现部分重同步主要靠三部分
主服务器与从服务器都会维护一个复制偏移量。
当主从双方数据是同步时,这个偏移量是相等的。而一旦有个从服务器断线一段时间而少收到了部分数据。那么此时主从双方的服务器偏移量是不相等的,而他们的差值就是少传输的字节数量。如果少传输的数据量不是很大,没有超过主服务器的复制积压缓冲区大小,那么将会直接将缓冲区内容发送给从服务器避免完全重同步。反之还是需要完全重同步的。
复制积压缓冲区是由主服务器维护的一个先进先出的字节队列,默认大小是1mb。每当向从服务器发送写命令时,都会将这些数据存入这个队列。每个字节都会记录自己的复制偏移量。从服务器在重连时会将自己的复制偏移量发送给主服务器,如果该复制偏移量之后的数据存在于复制积压缓冲区中,则仅需要将之后的数据发送给从服务器即可。
当执行主从同步时,主服务器会将自己的服务器ID(一般是自动生成的UUID)发送给从服务器。从服务器在断线恢复后会判断该ID是否为当前连接的主服务器。如果是同一个ID则代表主服务器没变尝试部分重同步。如果不是同一个ID代表主服务有变动,则会与主服务器完全重同步。
具体流程图如下:
Redis主从模式虽然能做到很好的数据备份,但是他并不是高可用的。一旦主服务器点宕机后,只能通过人工去切换主服务器。因此Redis的哨兵模式也就是为了解决主从模式的高可用方案。
哨兵模式引入了一个Sentinel系统去监视主服务器及其所属的所有从服务器。一旦发现有主服务器宕机后,会自动选举其中的一个从服务器升级为新主服务器以达到故障转义的目的。
同样的Sentinel系统也需要达到高可用,所以一般也是集群,互相之间也会监控。而Sentinel其实本身也是一个以特殊模式允许Redis服务器。
INFO
命令,主服务器则会返回主服务器本身的信息,以及其所有从服务器的信息。每一个Sentinel服务器每秒会向其连接的所有实例包括主服务器,从服务器,其他Sentinel服务器)发送 PING
命令,根据是否回复 PONG
命令来判断实例是否下线。
如果实例在收到 PING
命令的down-after-milliseconds毫秒内(根据配置),未有有效回复。则该实例将会被发起 PING
命令的Sentinel认定为主观下线。
当一台主服务器没某个Sentinel服务器判定为客观下线时,为了确保该主服务器是真的下线,Sentinel会向Sentinel集群中的其他的服务器确认,如果判定主服务器下线的Sentinel服务器达到一定数量时(一般是N/2+1),那么该主服务器将会被判定为客观下线,需要进行故障转移。
当有主服务器被判定客观下线后,Sentinel集群会选举出一个领头Sentinel服务器来对下线的主服务器进行故障转移操作。整个选举其实是基于RAFT一致性算法而实现的,大致的思路如下:
领头服务器会从从服务中挑选出一个最合适的作为新的主服务器。挑选的规则是:
INFO
命令的从服务器。挑选出新的主服务器后,领头服务器将会向新主服务器发送 SLAVEOF no one
命令将他真正升级为主服务器,并且修改其他从服务器的复制目标,将旧的主服务器设为从服务器,以此来达到故障转移。
Redis哨兵模式实现了高可用,读写分离,但是其主节点仍然只有一个,即写入操作都是在主节点中,这也成为了性能的瓶颈。
因此Redis在3.0后加入了Cluster模式,它采用去无心节点方式实现,集群将会通过分片方式保存数据库中的键值对
一个Redis集群中会由多个节点组成,每个节点都是互相连接的,会保存自己与其他节点的信息。节点之间通过gossip协议交换互相的状态,以及保新加入的节点信息。
Redis Cluster的整个数据库将会被分为16384个哈希槽,数据库中的每个键都属于这16384个槽中的其中一个,集群中的每个节点可以处0个或者最多16384个槽。
通过命令 CLUSTER ADDSLOTS
命令我们可以将一个或多个槽指派给某个节点。
如 127.0.0.1:7777> CLUSTER ADDSLOTS 1 2 3 4 5
命令就是将1,2,3,4,5号插槽指派给本地端口号为7777的节点负责。
设置后节点将会将槽指派的信息发送给其他集群,让其他集群更新信息。
def slot_number(key):
return CRC16(key) & 16383
计算哈希槽位置其实使用的是CRC16算法对键值进行计算后再对16383取模得到最终所属插槽。
也可以使用 CLUSTER KEYSLOT
进行查看。
Redis的每个节点都可以分为主节点与对应从节点。主节点负责处理槽,从节点负责复制某个主节点,并在主节点下线时,代替下线的主节点。
其实与哨兵模式类似,Redis的每个节点都会定期向其他节点发送Ping消息,以此来检测对方是否在线。当一个节点检测到另一个节点下线后,会将其设置为疑似下线。如果一个机器中,有半数以上的节点将某个主节点设为疑似下线,则该节点将会被标记为已下线状态,并开始执行故障转移。
SLAVEOF no one
命令,成为新的主节点本文主要介绍了Redis三种集群模式,总结一下