一篇掌握Redis的主从复制机制+哨兵模式

1. 什么是主从复制

主从复制是主机数据更新后根据配置和策略, 自动同步到备机的master/slave机制,Master以写为主,Slave以读为主

2.主从复制的作用

数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;
         实际上是一种服务的冗余。
负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,
        由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),
        分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,
        可以大大提高Redis服务器的并发量。
高可用基石:主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。

3.Redis 主从同步最终一致性

主从必然存在延迟问题,Redis按照分布式集群来讲,就不是强一致性的CAP结构,只保证了高可用AP,没有保证强一致性CP,所以必然存在延迟。

Redis 的主从数据是异步同步的,所以分布式的 Redis 系统并不满足「一致性」要求。当客户端在 Redis 的主节点修改了数据后,立即返回,即使在主从网络断开的情况下,主节点依旧可以正常对外提供修改服务,所以 Redis 满足「可用性」。

Redis 保证「最终一致性」,从节点会努力追赶主节点,最终从节点的状态会和主节点的状态将保持一致。如果网络断开了,主从节点的数据将会出现大量不一致,一旦网络恢复,从节点会采用多种策略努力追赶上落后的数据,继续尽力保持和主节点一致。

4.主从复制的实现原理

设置主节点的地址和端口
建立套接字连接
发送PING命令
权限验证
同步
命令传播

一篇掌握Redis的主从复制机制+哨兵模式_第1张图片

1. 设置主服务器的地址和端口

第一步首先是在从服务器设置需要同步的主服务器信息,包括机器IP, 端口。 主从复制的开启,完全是在从节点发起的;不需要我们在主节点做任何事情。

2.建立套接字连接

在slaveof命令执行之后,从服务器会根据设置的ip和端口,向主服务器建立socket连接。 在6380从服务器里面执行完slave of 127.0.0.1 6379后意味着,从服务器向主服务器发起socket连接 在执行info Replication 命令,可以看到6380服务器的角色是slave了

3.发送PING命令

从节点成为主节点的客户端之后,发送ping命令进行首次请求,目的是:检查socket连接是否可用,以及主节点当前是否能够处理请求。

4. 身份验证

如果从节点中设置了masterauth选项,则从节点需要向主节点进行身份验证;没有设置该选项,则不需要验证。从节点进行身份验证是通过向主节点发送auth命令进行的,auth命令的参数即为配置文件中的masterauth的值。

如果主节点设置密码的状态,与从节点masterauth的状态一致(一致是指都存在,且密码相同,或者都不存在),则身份验证通过,复制过程继续;如果不一致,则从节点断开socket连接,并重连。

5. 同步

同步就是将从节点的数据库状态更新成主节点当前的数据库状态。具体执行的方式是:从节点向主节点发送psync命令(Redis2.8以前是sync命令),开始同步。 数据同步阶段是主从复制最核心的阶段,根据主从节点当前状态的不同,可以分为全量复制和部分复制 下面会有详细介绍全量复制和部分复制内容,这里暂不详述

6.命令传播

经过上面同步操作,此时主从的数据库状态其实已经一致了,但这种一致的状态的并不是一成不变的。 在完成同步之后,也许主服务器马上就接受到了新的写命令,执行完该命令后,主从的数据库状态又不一致。

数据同步阶段完成后,主从节点进入命令传播阶段;在这个阶段主节点将自己执行的写命令发送给从节点,从节点接收命令并执行,从而保证主从节点数据的一致性。

延迟与不一致:

命令传播是异步的过程,即主节点发送写命令后并不会等待从节点的回复;
因此实际上主从节点之间很难保持实时的一致性,延迟在所难免。数据不一致的程度,
与主从节点之间的网络状况、主节点写命令的执行频率、
以及主节点中的repl-disable-tcp-nodelay配置等有关。
Redis是如何保证主从服务器一直处于连接状态以及命令是否丢失? 
答:命令传播阶段,从服务器会利用心跳检测机制定时的向主服务发送消息。 

全量复制与部分复制:

全量复制:用于初次复制或其他无法进行部分复制的情况,将主节点中的所有数据都发送给从节点,
        是一个非常重型的操作。
部分复制:用于网络中断等情况后的复制,只将中断期间主节点执行的写命令发送给从节点,
        与全量复制相比更加高效。需要注意的是,如果网络中断时间过长,
        导致主节点没有能够完整地保存中断期间执行的写命令,则无法进行部分复制,仍使用全量复制。

心跳检测机制:

心跳检测机制的作用有三个:

检查主从服务器的网络连接状态
辅助实现min-slaves选项
检测命令丢失

数据过期问题 :

惰性删除:服务器不会主动删除数据,只有当客户端查询某个数据时,
         服务器判断该数据是否过期,如果过期则删除。 定期删除:服务器执行定时任务删除过期数据,
         但是考虑到内存和CPU的折中(删除会释放内存,但是频繁的删除操作对CPU不友好),
         该删除的频率和执行时间都受到了限制。 在主从复制场景下,为了主从节点的数据一致性,
         从节点不会主动删除数据,而是由主节点控制从节点中过期数据的删除。
         由于主节点的惰性删除和定期删除策略,都不能保证主节点及时对过期数据执行删除操作,
         因此,当客户端通过Redis从节点读取数据时,很容易读取到已经过期的数据。

故障切换问题:

在没有使用哨兵的读写分离场景下,应用针对读和写分别连接不同的Redis节点;
当主节点或从节点出现问题而发生更改时,需要及时修改应用程序读写Redis数据的连接;
连接的切换可以手动进行,或者自己写监控程序进行切换,但前者响应慢、容易出错,
后者实现复杂,成本都不算低。

复制超时问题:

如果主节点判断连接超时,其会释放相应从节点的连接,从而释放各种资源,
否则无效的从节点仍会占用主节点的各种资源(输出缓冲区、带宽、连接等);
此外连接超时的判断可以让主节点更准确的知道当前有效从节点的个数,
有助于保证数据安全(配合前面讲到的min-slaves-to-write等参数)。

如果从节点判断连接超时,则可以及时重新建立连接,避免与主节点数据长期的不一致。

5.哨兵模式的概念

能够后台监控主机是否故障,如果故障了根据投票数自动将从机转换为主机,通过哨兵服务器监控master/slave可以实现主从复制集群的自动管理

一篇掌握Redis的主从复制机制+哨兵模式_第2张图片

2.哨兵有两个作用:

  • 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。

  • 当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。

然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。

用文字描述一下故障切换(failover)的过程。假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线。这样对于客户端而言,一切都是透明的。

你可能感兴趣的:(redis,redis)