Zab系列5 选举恢复(源码分析)

Zab系列博客

Raft Vs Zab
https://www.jianshu.com/p/24307e7ca9da
Zab系列1 核心概念
https://www.jianshu.com/p/76e5dba31ea4
Zab系列2 角色和存储
https://www.jianshu.com/p/d80f9250ffd1
Zab系列3 选举
https://www.jianshu.com/p/0d2390c242f6
Zab系列4 zookeeper特性
https://www.jianshu.com/p/08b62ca1fe4e
Zab系列5 选举恢复(源码分析)
https://www.jianshu.com/p/b6acd99921b7
Zab系列6 zk单机版工作原理
https://www.jianshu.com/p/ed45982b18b4
Zab系列7 集群工作原理Leader篇
https://www.jianshu.com/p/59240c36ba1b
Zab系列8 集群工作原理Follower篇
https://www.jianshu.com/p/8d7c7f1b2838

参考资料

https://www.cnblogs.com/siodoon/articles/5438076.html

主线程源码分析

QuorumPeer.run()

  1. zk启动的时候,会开启一个线程QuorumPeer.run()
  2. 该线程会持续监听自己的state,一旦检测到自己进入到了LOOKING状态,则会读取 选举策略(默认是 FastLeaderElection),执行选举,因为该方法也是个while循环,直到选举成功,返回一个leader的投票,自己进入following或者leading的state
  3. 如果监听到自己已经获选为leader,则调用 leader.lead(),先进入选举恢复,再进行leader正常工作阶段
//Main loop
while (running) {
    switch (getPeerState()) {
    case LOOKING:
        startLeaderElection()
        setCurrentVote(makeLEStrategy().lookForLeader());
    case LEADING:
        setLeader(makeLeader(logFactory));
        leader.lead(); 
}

恢复选举阶段源码分析

Leader.lead()

  1. leader从内存中加载数据(zxid和Sessions信息)
  2. 分配给每个节点一个专门的LearnerHandler线程,后期的交互都是在LearnerHandler线程里面完成
  3. 主线程自增epoch,调整zxid为最新的,高32位为新的epoch,低32位从0开始
  4. 给所有的follower发送消息,确认自己 leader身份,以及自己的最新数据,会等待所有的节点完成数据同步,并且半数ack后,leader身份确定且可以对外提供服务
  5. 这时Leader和Client之间的交互在cnxnFactory的Server中,Leader和Follower之间的交互在LearnerHandler所属的线程中
  6. 主线程无限循环在每个tickTime中都会发送2个ping消息给其他的follower,follower在接收到ping消息后会回复一个ping消息,保持心跳
  7. leader不断检是否有过半机器进行了心跳回复,如果没有过半,则执行关闭操作,开始进入FOLLOWING状态
void lead() throws IOException, InterruptedException {
    //1. leader从内存中加载数据(zxid和Sessions信息)
    zk.loadData();
    //2. 分配给每个节点一个专门的LearnerHandler线程,后期的交互都是在LearnerHandler线程里面完成
    cnxAcceptor = new LearnerCnxAcceptor();
    cnxAcceptor.start();
    
    //3. 主线程自增epoch,调整zxid为最新的,高32位为新的epoch,低32位从0开始
    long epoch = getEpochToPropose(self.getId(), self.getAcceptedEpoch());
    zk.setZxid(ZxidUtils.makeZxid(epoch, 0));
    
    //4.给所有的follower发送消息,确认自己 leader身份,需要得到半数 ack,自己才是正在的被认可的leader,执行leader功能
    newLeaderProposal.packet = new QuorumPacket(NEWLEADER, zk.getZxid(),null, null);
    waitForEpochAck(self.getId(), leaderStateSummary);
    self.setCurrentEpoch(epoch);
    
    //启动服务
    startZkServer();
    //6. 主线程无限循环在每个tickTime中都会发送2个ping消息给其他的follower,follower在接收到ping消息后会回复一个ping消息,保持心跳
    while (true) {
        long end = start + self.tickTime / 2;
        for (LearnerHandler f : getLearners()) {
            f.ping();
        }
}

你可能感兴趣的:(Zab系列5 选举恢复(源码分析))