Zookeeper Leader选举机制 (图文解释)

第一次启动:

Zookeeper Leader选举机制 (图文解释)_第1张图片

假设这是一个有5台设备的集群:

  1. 服务器1启动,发起一次选举,服务器1投自己一票,此时服务器1票数为一票,不够半数以上(3票),选举无法完成,服务器1状态保持为LOOKING。

  2. 服务器2启动,再发起一次选举,服务器1和2分别投自己一票,并且交换选票信息。此时服务器1发现服务器2的myid比自己目前投票推举的(服务器1)大,更改选票为推举服务器2,此时服务器1票数为0票,服务器2票数为2票,并没有达到半数以上的结果,选举无法完成,服务器1和服务器2状态保持为LOOKING。

  3. 服务器3启动,发起一次选举。此时服务器1和2都会更改选票给服务器3,(服务器3的myid最大),此时投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数已经超过半数,服务器3当选Leader,服务器1和服务器2更改状态为FLOWING,服务器3更改状态为LEADING。 (都先投自己1票,2的myid比1大,1把票给2,此时2两票,3的myid比2大,2把两票都给3,此时3有3票,票都给最大myid的服务器3了)

  4. 服务器4启动,发起一次选举,此时服务器1、2、3已经不是LOOKING状态,不会更改选票信息。选票结果:服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票信息为服务器3,并更改状态为FOLLOWING。(就是已经选出LEADER了,谁来了也不好使!)。

  5. 服务器5启动,同服务器4一样当小弟。

非第一次启动:

Zookeeper Leader选举机制 (图文解释)_第2张图片

  1. 当Zookeeper集群中的一台服务器出现一下两种情况之一时,就会开始进入Leader选举:

    (1)服务器初始化启动
    (2)服务器运行期间无法和Leader保持连接。
  2. 当一台机器进入Leader选举流程时,当前集群也可能会处于以下两种状态:

    • 集群中本来就已经存在一个Leader。 机器试图去选举Leader时,会被告知当前服务器的Leader信息,对于该机器来说,仅仅需要和Leader机器建立连接,并进行状态同步即可。

    • 集群中确实不存在Leader。 假设Zookeeper由5台服务器组成,SID分别为1、2、3、4、5,ZXID分别为8、8、8、7、7,并且此时SID为3的服务器为Leader.某一时刻,3和5服务器出现故障,因此开始进行Leader选举。

      SID为1、2、4的机器情况(EPOCH / ZXID / SID 为):(1 8 1)、(1 8 2)、(1 7 4)

      选举Leader规则:①EPOCH大的直接胜出,②EPOCH相同, 事务id ZXID大的胜出,③事务id ZXID相同,服务器id SID大的胜出

      所以是服务器2胜出。

你可能感兴趣的:(zookeeper)