【zookeeper学习笔记】| 八、Zookeeper之Zab协议

一、介绍

1、Zab协议 的全称是 Zookeeper Atomic Broadcast (Zookeeper原子广播)。

2、Zab协议是为分布式协调服务Zookeeper专门设计的一种保证数据一致性的核心算法,Zab借鉴了Paxos算法。
3、三种角色

  1. leader:领导人
  1. follower:追随者
  1. candidate:候选人

3、流程图

广播proposal
半数以上ack
客户端
master
follower

二、协议特性和协议实现的作用

1、协议特性

1)确保那些已经在 Leader 服务器上提交(Commit)的事务最终被所有的服务器提交。

2)确保丢弃那些只在 Leader 上被提出而没有被提交的事务。

2、作用

  1. 使用一个单一的主进程(Leader)来接收并处理客户端的事务请求(也就是写请求),并采用了Zab的原子广播协议,将服务器数据的状态变更以 事务proposal (事务提议)的形式广播到所有的副本(Follower)进程上去。
  1. 保证一个全局的变更序列被顺序引用。
  1. 当主进程出现异常的时候,整个zk集群依旧能正常工作。

三、协议内容(崩溃恢复和消息广播)

1、崩溃恢复模式

集群中 当 Leader 服务器出现网络中弄断、崩溃退出或重启等异常时,Zab协议就会 进入崩溃恢复模式,选举产生新的Leader。

2、消息广播模式

产生了新的 Leader,同时集群中有过半的机器与该 Leader 服务器完成了状态同步(即数据同步)之后,Zab协议就会退出崩溃恢复模式,进入消息广播模式。

3、协议状态切换

当Leader出现崩溃退出或者机器重启,亦或是集群中不存在超过半数的服务器与Leader保存正常通信,Zab就会再一次进入崩溃恢复,发起新一轮Leader选举并实现数据同步。同步完成后又会进入消息广播模式,接收事务请求。

4、保证消息有序

a:在整个消息广播中,Leader会将每一个事务请求转换成对应的 proposal 来进行广播。

b:在广播 事务Proposal 之前,Leader服务器会首先为这个事务Proposal分配一个全局单递增的唯一ID,称之为事务ID(即zxid)。

c:由于Zab协议需要保证每一个消息的严格的顺序关系,因此必须将每一个proposal按照其zxid的先后顺序进行排序和处理。

四、消息广播

1、实现步骤

1)客户端发起一个写操作请求。

2)Leader 服务器将客户端的请求转化为事务 Proposal 提案,同时为每个 Proposal 分配一个全局的ID,即zxid。

3)Leader 服务器为每个 Follower 服务器分配一个单独的队列,然后将需要广播的 Proposal 依次放到队列中取,并且根据 FIFO 策略进行消息发送。

4)Follower 接收到 Proposal 后,会首先将其以事务日志的方式写入本地磁盘中,写入成功后向 Leader 反馈一个 Ack 响应消息。

5)Leader 接收到超过半数以上 Follower 的 Ack 响应消息后,即认为消息发送成功,可以发送 commit 消息。

6)Leader 向所有 Follower 广播 commit 消息,同时自身也会完成事务提交。Follower 接收到 commit 消息后,会将上一条事务提交。

2、消息队列

1)Leader 服务器与每一个 Follower 服务器之间都维护了一个单独的 FIFO 消息队列进行收发消息,使用队列消息可以做到异步解耦。

3、整体是以一种弱一致性中的最终一致性实现的。

五、奔溃恢复(Leader选举 和 数据恢复)

1、Zab协议需要保证选举出来的Leader需要满足以下条件:

1)新选举出来的 Leader 不能包含未提交的 Proposal 。

即新选举的 Leader 必须都是已经提交了 Proposal 的 Follower 服务器节点。

2)新选举的 Leader 节点中含有最大的 zxid 。

这样做的好处是可以避免 Leader 服务器检查 Proposal 的提交和丢弃工作。

2、数据恢复
1)完成 Leader 选举后(新的 Leader 具有最高的zxid),在正式开始工作之前(接收事务请求,然后提出新的 Proposal),Leader 服务器会首先确认事务日志中的所有的 Proposal 是否已经被集群中过半的服务器 Commit。

2)Leader 服务器需要确保所有的 Follower 服务器能够接收到每一条事务的 Proposal ,并且能将所有已经提交的事务 Proposal 应用到内存数据中。等到 Follower 将所有尚未同步的事务 Proposal 都从 Leader 服务器上同步过啦并且应用到内存数据中以后,Leader 才会把该 Follower 加入到真正可用的 Follower 列表中。

六、整体流程

1、选举阶段: 选举leader

2、发现、同步数据阶段:信息交流、数据复制

3、广播阶段: 处理请求、对外提供服务

选举阶段
发现阶段
同步阶段
广播阶段

你可能感兴趣的:(【Zookeeper】)