FollowYourHeart2015

ZooKeeper leader选举源码分析

文章目录

Leader选举算法

一句话概况选举算法精髓
选举算法流程解析--lookForLeader
如何跟其他节点交换投票：网络I/O

Leader选举算法

一句话概况选举算法精髓

所有节点都有两个属性，SID：节点ID，zoo.cfg中配置的myid，ZXID：节点当前的最大事务ID
选举的目的就是选目前所有节点中拥有最大ZXID的节点作为Leader，如果拥有的ZXID相同，就选取SID最大的节点作为Leader

选举算法流程解析–lookForLeader

在实现选举的过程中，其实还有很多细节需要注意，那么接下来看下选举的具体细节：

在ZooKeeper中，提供了3种Leader的选举算法，分别是LeaderElection、 UDP版本的FastLeaderElection、TCP版本的FastLeaderElection，可以通过再配置文件zoo.cfg中使用electionAlg属性来指定。从3.4.0版本开始，ZooKeeper废弃了前2种算法，只保留了TCP版本的FastLeaderElection算法。所有算法都实现了Election接口：

public interface Election {
    //选举的核心算法
    public Vote lookForLeader() throws InterruptedException;
    //关闭选举过程中创建了链接及启动的线程
    public void shutdown();
}

先看下选举算法核心部分(FastLeaderElection.lookForLeader)的流程示意图：

lookForLeader详细源码

每次选举开始，各个节点都会先为自己投票(原子操作)，其中logicalclock代表选举逻辑时钟(类比现实中的第十八次全国人大、第十九次全国人大……)，这个值从0开始递增，在同一次选举中，各节点的值基本相同，也有例外情况，比如在第18次选举中，某个节点A挂了，其他节点完成了Leader选举，但没过多久，该Leader又挂了，于是进入了第19次Leader选举，同时节点A此时恢复，加入到Leader选举中，那么节点A的logicallock为18，而其他节点的logicallock为19，针对这种情况，节点A的logicallock会被直接更新为19并参与到第19次Leader选举中。
其中getInitId()是当前节点的serverId, getInitLastLoggedZxid()是当前节点的最大事务ID，getPeerEpoch当前节点选举轮次，即当前节点Zxid的高位代表的epoch其中getInitId()是当前节点的serverId, getInitLastLoggedZxid()是当前节点的最大事务ID，getPeerEpoch当前节点选举轮次，即当前节点Zxid的高位代表的epoch

public Vote lookForLeader() throws InterruptedException {
    {...}
    try {
        HashMap recvset = new HashMap();
        HashMap outofelection = new HashMap();
        int notTimeout = finalizeWait;
		//1.初始化选票，首先为自己投票
        synchronized(this){
            logicalclock++;
            updateProposal(getInitId(), getInitLastLoggedZxid(), getPeerEpoch());
        }

 		//2.向所有节点发送投票信息
        sendNotifications();

        /*
         * Loop in which we exchange notifications until we find a leader
         * 3.循环交换投票直至选出Leader
         */
        while ((self.getPeerState() == ServerState.LOOKING) &&
                (!stop)){...}
        }
}

向所有节点发送投票信息

private void sendNotifications() {
        for (QuorumServer server : self.getVotingView().values()) {
            long sid = server.id;

            ToSend notmsg = new ToSend(ToSend.mType.notification,
                    proposedLeader, //推荐的leader的id,就是配置文件中写好的每个服务器的id
                    proposedZxid, //推荐的leader的zxid,zookeeper中的每份数据,都有一个对应的zxid值,越新的数据,zxid值就越大
                    logicalclock,    //选举的逻辑时钟
                    QuorumPeer.ServerState.LOOKING,
                    sid,
                    proposedEpoch);
            sendqueue.offer(notmsg);
        }
    }

循环交换投票直至选出Leader

while ((self.getPeerState() == ServerState.LOOKING) &&
        (!stop)){
   //从接收投票的队列中取出一条投票信息
    Notification n = recvqueue.poll(notTimeout,
            TimeUnit.MILLISECONDS);

    if(n == null){...}
    else if(self.getVotingView().containsKey(n.sid)) {
        switch (n.state) {
        case LOOKING://拿别人的票跟自己对比，谁的更合理，就发出去更合理的选票(类似于冒泡排序算法，每次对比，都选比自己大/小的数)
        case OBSERVING://观察者是不参与Leader选举的
        case FOLLOWING:
        case LEADING://当已经收到LEADING和FOLLOWING表示已经票选出Leader，然后投最后一票给Leader，结束投票
        default:
        }
    }
}

LOOKING相关部分是leader选举的精髓所在，注释中提到的更合理的选票，其实就是在两两PK中，更适合做Leader的选票。谁的选票更合理，大家就选谁为Leader，如果过半数的节点都选择了某个服务器为Leader，那该服务器就成了真正的Leader。看下它具体是如何实现的

/ * 表示投票轮次大于本节点记录的轮次，表示自己已经落后投票了，将自己的
 * 投票轮次设置为最新的，清空自己的票箱，这个票箱记录了集群中其他节点
 * 的投票结果
 */
if (n.electionEpoch > logicalclock) {
    logicalclock = n.electionEpoch;
    recvset.clear();
    /*
     * 将n节点的投票结果与自己的投票结果比较,如果投票比自己的投票合理，
     * 覆盖自己的投票，否则还是投自己
     */
    if(totalOrderPredicate(n.leader, n.zxid, n.peerEpoch,getInitId(), getInitLastLoggedZxid(), getPeerEpoch())) {
        updateProposal(n.leader, n.zxid, n.peerEpoch);
    } else {
        updateProposal(getInitId(),getInitLastLoggedZxid(),getPeerEpoch());
    }
    //发送在此次PK过程中，发送更加合理的选票给其他节点
    sendNotifications();
} else if (n.electionEpoch < logicalclock) {
    // 投票轮次比自己记录的轮次小，说明这个投票已经过时，不处理
    break;
} else if (totalOrderPredicate(n.leader, n.zxid, n.peerEpoch,proposedLeader, proposedZxid, proposedEpoch)) {
    // 如果是一个轮次，将n节点的投票与自己PK，如果n节点的投票更合理，覆盖自己投票，并将更合理的选票给其他节点
	updateProposal(n.leader, n.zxid, n.peerEpoch);
    sendNotifications();
}
// 将n节点的投票记录下来
recvset.put(n.sid, new Vote(n.leader, n.zxid, n.electionEpoch, n.peerEpoch));

/*
 * 尝试通过现在已经收到的信息，判断是否已经足够确认最终的leader了，通过方法termPredicate() ，判断标准很简单：是否已经有超过半数的机
 * 器所推举的leader为当前自己所推举的leader.如果是，保险起见，最多再等待finalizeWait（默认200ms）的时间进行最后的确认，如果发现有
 * 了更新的leader信息，则把这个Notification重新放回recvqueue,显然，选举将继续进行。否则，选举结束，根据选举的leader是否是自己，设
 * 置自己的状态为LEADING或者OBSERVING或者FOLLOWING。
 */
if (termPredicate(recvset,new Vote(proposedLeader, proposedZxid, logicalclock, proposedEpoch))) {

    while((n = recvqueue.poll(finalizeWait,TimeUnit.MILLISECONDS)) != null){
        if(totalOrderPredicate(n.leader, n.zxid, n.peerEpoch, proposedLeader, proposedZxid, proposedEpoch)){
            recvqueue.put(n);
            break;
        }
    }

    //队列中所有的投票都已处理完，则选举出Leader，并判断是否属于自己
    if (n == null) {
        self.setPeerState((proposedLeader == self.getId()) ? ServerState.LEADING: learningState());

        Vote endVote = new Vote(proposedLeader, proposedZxid, proposedEpoch);
        leaveInstance(endVote);
        return endVote;
    }
}
break;

totalOrderPredicate为判断更合理的逻辑，比较的顺序是Epoch、zxid、Id，优先选投票轮次高的，投票轮次相同选Zxid高的，Zxid相同选id高的，因此在Zookeeper启动的时候，往往id高的获得Leader，但不绝对，比如在5个节点的集群中，启动顺序分别是1->2->3->4->5，当票选到节点3时已经票选超过半数，那么后面启动的4和5就直接成为follower

protected boolean totalOrderPredicate(long newId, long newZxid, long newEpoch, long curId, long curZxid, long curEpoch) {

        if(self.getQuorumVerifier().getWeight(newId) == 0){
            return false;
        }
        
        /*
         返回true说明接收到的外部投票更合理，要覆盖内部投票
         * We return true if one of the following three cases hold:
         * 1- New epoch is higher
         * 2- New epoch is the same as current epoch, but new zxid is higher
         * 3- New epoch is the same as current epoch, new zxid is the same
         *  as current zxid, but server id is higher.
         */
        
        return ((newEpoch > curEpoch) || 
                ((newEpoch == curEpoch) &&
                ((newZxid > curZxid) || ((newZxid == curZxid) && (newId > curId)))));
    }

termPredicate为判断过半的逻辑，在默认实现类QuorumMaj中进行过半的判断：

private boolean termPredicate(
            HashMap votes,
            Vote vote) {

        HashSet set = new HashSet();

        /*
         * First make the views consistent. Sometimes peers will have
         * different zxids for a server depending on timing.
         */
        for (Map.Entry entry : votes.entrySet()) {
            if (vote.equals(entry.getValue())){
                set.add(entry.getKey());
            }
        }
		//默认实现类为QuorumMaj
        return self.getQuorumVerifier().containsQuorum(set);
    }

步骤3的循环，最终会得到超过半数节点认同的Leader的投票，至此完成Leader选举。

如何跟其他节点交换投票：网络I/O

在看了以上的代码实现，似乎遗漏了一个重要环节，就是向其他节点发送选票、接收其他节点的投票，具体是如何实现的呢？这离不开QuorumCnxManager这个大功臣，让我们一点点往下来看：

系统初始化时，每一个QuorumPeer对象（一个QuorumPeer可以理解为一个准备参加选举的ZK的server,即配置文件zoo.cfg中配置的服务器）维护了一个FastLeaderElection对象来为自己的选举工作进行代言。在选举过程中需要进行消息的沟通，因此在FastLeaderElection中维护了两个变量:

    LinkedBlockingQueue sendqueue;
    LinkedBlockingQueue recvqueue;

recvqueue中存放了选举过程中接收到的消息，这些消息被交给了FastLeaderElection的最核心方法lookForLeader()进行处理以选举出leader。而sendqueue中存放了待发送出去的消息。

同时，每一个FastLeaderElection变量维护了一个内置类Messager，Messager类包含了两个实现了Runnable接口的类WorkerReceiver和WorkerSender，从名字可以看出，这两个类分别负责消息的发送和接收。即WorkerReceiver负责接收消息并将接收到的消息放入recvqueue中等待处理，WorkerSender负责从sendqueue中取出待发送消息，交给下层的连接管理类QuorumCnxManager进行发送。

每一个QuorumPeer都有一个QuorumCnxManager对象负责选举期间QuorumPeer之间连接的建立和发送、接收消息队列的维护，而这些消息是通过以下3个集合被处理的：

	//发送器集合。每个SenderWorker消息发送器，都对应一台远程ZooKeeper服务器，负责消息的发送，在这个集合中，key为SID
    final ConcurrentHashMap senderWorkerMap;
    //每个SID需要发送的消息队列
    final ConcurrentHashMap> queueSendMap;
    //最近发送过的消息。在这个集合中，为每个SID保留最近发送过的一个消息
    final ConcurrentHashMap lastMessageSent;

QuorumCnxManager还有分别负责消息的发送和接收的SenderWorker和RecvWorker两个继承了Runnable接口的线程类，这两个线程类的构造方法如下：

SendWorker(Socket sock, Long sid) {
    super("SendWorker:" + sid);
    this.sid = sid;
    this.sock = sock;
    recvWorker = null;
    try {
        dout = new DataOutputStream(sock.getOutputStream());
    } catch (IOException e) {
        LOG.error("Unable to access socket output stream", e);
        closeSocket(sock);
        running = false;
    }
    LOG.debug("Address of remote peer: " + this.sid);
}

RecvWorker(Socket sock, Long sid, SendWorker sw) {
    super("RecvWorker:" + sid);
    this.sid = sid;
    this.sock = sock;
    this.sw = sw;
    try {
        din = new DataInputStream(sock.getInputStream());
        // OK to wait until socket disconnects while reading.
        sock.setSoTimeout(0);
    } catch (IOException e) {
        LOG.error("Error while accessing socket for " + sid, e);
        closeSocket(sock);
        running = false;
    }
}

每个SenderWorker或者RecvWorker都有一个sid变量，显然，每一个sid对应的QuorumPeer都会有与之对应的SenderWorker和RecvWorker来专门负责处理接收到的它的消息或者向它发送消息。

接下来再看下对应的run()方法做了什么操作
SendWorker.run()

pubic void run() {
        threadCnt.incrementAndGet();
        try {
            /**
             * If there is nothing in the queue to send, then we
             * send the lastMessage to ensure that the last message
             * was received by the peer. The message could be dropped
             * in case self or the peer shutdown their connection
             * (and exit the thread) prior to reading/processing
             * the last message. Duplicate messages are handled correctly
             * by the peer.
             *
             * If the send queue is non-empty, then we have a recent
             * message than that stored in lastMessage. To avoid sending
             * stale message, we should send the message in the send queue.
             */
            ArrayBlockingQueue bq = queueSendMap.get(sid);
            if (bq == null || isSendQueueEmpty(bq)) {
               ByteBuffer b = lastMessageSent.get(sid);
               if (b != null) {
                   LOG.debug("Attempting to send lastMessage to sid=" + sid);
                   send(b);
               }
            }
        } catch (IOException e) {
            LOG.error("Failed to send last message. Shutting down thread.", e);
            this.finish();
        }
        
        try {
            while (running && !shutdown && sock != null) {

                ByteBuffer b = null;
                try {
                    ArrayBlockingQueue bq = queueSendMap
                            .get(sid);
                    if (bq != null) {
                        b = pollSendQueue(bq, 1000, TimeUnit.MILLISECONDS);
                    } else {
                        LOG.error("No queue of incoming messages for " +
                                  "server " + sid);
                        break;
                    }

                    if(b != null){
                        lastMessageSent.put(sid, b);
                        send(b);
                    }
                } catch (InterruptedException e) {
                    LOG.warn("Interrupted while waiting for message on queue",
                            e);
                }
            }
        } catch (Exception e) {
            LOG.warn("Exception when using channel: for id " + sid + " my id = " + 
                    self.getId() + " error = " + e);
        }
        this.finish();
        LOG.warn("Send worker leaving thread");
    }
}

RecvWorker.run()

public void run() {
    threadCnt.incrementAndGet();
    try {
        while (running && !shutdown && sock != null) {
            /**
             * Reads the first int to determine the length of the
             * message
             */
            int length = din.readInt();
            if (length <= 0 || length > PACKETMAXSIZE) {
                throw new IOException(
                        "Received packet with invalid packet: "
                                + length);
            }
            /**
             * Allocates a new ByteBuffer to receive the message
             */
            byte[] msgArray = new byte[length];
            din.readFully(msgArray, 0, length);
            ByteBuffer message = ByteBuffer.wrap(msgArray);
            addToRecvQueue(new Message(message.duplicate(), sid));
        }
    } catch (Exception e) {
        LOG.warn("Connection broken for id " + sid + ", my id = " + 
                self.getId() + ", error = " , e);
    } finally {
        LOG.warn("Interrupting SendWorker");
        sw.finish();
        if (sock != null) {
            closeSocket(sock);
        }
    }
}

从代码可以看到，SenderWorker负责不断从全局的queueSendMap中读取自己所负责的sid对应的消息的列表，然后将消息发送给对应的sid。

而RecvWorker负责从与自己负责的sid建立的TCP连接中读取数据放入到recvQueue的末尾。

从QuorumCnxManager.SenderWorker和QuorumCnxManager.RecvWorker的run方法中可以看出，这两个worker都是基于QuorumCnxManager建立的连接，与对应的server进行消息的发送和接收，而要发送的消息则来自FastLeaderElection，接收到的消息，也是被FastLeaderElection处理，因此，QuorumCnxManager的两个worker并不负责具体的算法实现，只是消息发送、接收的代理类，FastLeaderElection不需要理睬怎么与其它的server通信、怎么获得其它server的投票信息这些细节，只需要从QuorumCnxManager提供的队列里面取消息或者放入消息。

下面，我们来看看FastLeaderElection.Messager.WorkekSender和 FastLeaderElection.Messager.WorkerReceiver各自的run方法：

WorkerReceiver.run()

public void run() {

    Message response;
    while (!stop) {
        try{
        	//从QuorumCnxManager的recvqueue队列中取出一个Message
            response = manager.pollRecvQueue(3000, TimeUnit.MILLISECONDS);
            
            if(response == null) continue;

            /*
             * 如果该消息来自一个未知的发送者（自己没有维护这个发送者的sid，即配置文件中没有配置这个sid），就把自己当前的投票结果
             * 发送给对方。
             */
            if(!self.getVotingView().containsKey(response.sid)){
                Vote current = self.getCurrentVote();
                ToSend notmsg = new ToSend(ToSend.mType.notification,
                        current.getId(),
                        current.getZxid(),
                        logicalclock,
                        self.getPeerState(),
                        response.sid,
                        current.getPeerEpoch());

                sendqueue.offer(notmsg);
            } else {
      
                {...}

                // Instantiate Notification and set its attributes
                Notification n = new Notification();
                n.leader = response.buffer.getLong();
                n.zxid = response.buffer.getLong();
                n.electionEpoch = response.buffer.getLong();
                n.state = ackstate;
                n.sid = response.sid;
                if(!backCompatibility){
                    n.peerEpoch = response.buffer.getLong();
                } else {
                    if(LOG.isInfoEnabled()){
                        LOG.info("Backward compatibility mode, server id=" + n.sid);
                    }
                    n.peerEpoch = ZxidUtils.getEpochFromZxid(n.zxid);
                }

                /*
                 * If this server is looking, then send proposed leader
                 */

                if(self.getPeerState() == QuorumPeer.ServerState.LOOKING){
                	//放入到recvqueue队列中，待处理
                    recvqueue.offer(n);

                    {...}
    }
}

WorkerSender.run()

public void run() {
    while (!stop) {
        try {
            ToSend m = sendqueue.poll(3000, TimeUnit.MILLISECONDS);
            if(m == null) continue;
			//交给了QuorumCnxManager来处理消息的发送
            process(m);
        } catch (InterruptedException e) {
            break;
        }
    }
    LOG.info("WorkerSender is down");
}

以上就是Leader选举的源码实现，欢迎交流~~~

参考：https://blog.csdn.net/zhanyuanlin/article/details/50662921
https://blog.csdn.net/oDaiLiDong/article/details/41855613
http://fenlan.github.io/2018/04/19/ZookeeperLeaderElection/

k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
Apache Dubbo实战：JavaSDK使用秃了也弱了。 Dubbo apache dubbo
文章目录一、写在前面二、基于zookeeper：快速创建dubbo应用1、maven包（客户端+服务端）（注意spring版本）2、application.yml配置文件（客户端+服务端）3、定义公共接口4、启动类添加注解@EnableDubbo5、服务端6、客户端7、启动试试吧8、拓展：使用JavaConfig代替注解三、拓展配置1、注册中心2、版本与分组3、传递调用参数4、泛化调用5、泛化实现
Kafka系列之：安装具有安全认证的kafka-2.8.2分布式集群快乐骑行^_^ 大数据 Kafka系列安全认证 kafka-2.8.2 分布式集群
Kafka系列之：安装具有安全认证的kafka-2.8.2分布式集群一、下载Zookeeper3.7.1和Kafka2.8.2二、解压Zookeeper3.7.1和Kafka2.8.2三、安装Zookeeper3.7.1详细步骤1.修改zookeeper配置文件2.创建zookeeper数据目录3.zookeeper创建myid4.设置zookeeper访问kafka认证5.拷贝zookeeper
千亿级消息引擎 Apache Pulsar 深度剖析：架构原理、设计哲学与实战实践北漂老男人 Pulsar apache 架构学习方法运维
千亿级消息引擎ApachePulsar深度剖析：架构原理、设计哲学与实战实践Pulsar不止是消息队列，更是下一代云原生流平台。本文将深入剖析其底层架构、核心特性、关键差异、源码细节、调优技巧与企业级实践路径，力求做到“知其然，知其所以然”。一、架构哲学：分层解耦+IO隔离1.1三层架构模型（Broker+BookKeeper+ZooKeeper）Pulsar基于分布式系统经典设计范式：计算与存储
服务注册和发现组件的详细对比与选型建议（详细版）古龙飞扬 spring cloud spring 后端
服务注册和发现组件Eureka、Consul、ZooKeeper、Etcd和Nacos的区别与选型建议在微服务架构中，服务注册与发现是一个核心组件，它解决了服务实例的动态管理和自动发现的问题。目前，市场上存在多种服务注册与发现组件，其中Eureka、Consul、ZooKeeper、Etcd和Nacos较为常见。作为资深的软件架构师，本文将详细分析这些组件的区别，并提供选型建议。一、EurekaE
Kafka浅学文文Tao kafka java 分布式
Kafka应用场景？异步解耦流量消锋Kafka消息队列特点？Kafka吞吐量高：因为他存储数据时，磁盘顺序存储，磁盘的顺序存储速度很快。Kafka持久化消息：这些消息日志可以被重复读取和永久保留可以运行时动态扩展伸缩：Kafka是分布式系统：它以集群的方式运行，早期依赖Zookeeper对于Kafka的作用是什么？Zookeeper是分布式协调服务。Zookeeper作用：用于在Kafka集群中不
Zookeeper的典型应用场景?
大家好，我是锋哥。今天分享关于【Zookeeper的典型应用场景?】面试题。希望对大家有帮助；Zookeeper的典型应用场景?超硬核AI学习资料，现在永久免费了！Zookeeper是一个开源的分布式协调服务，它被广泛应用于需要分布式系统协调的场景。以下是Zookeeper的一些典型应用场景：1.分布式锁在分布式系统中，多个节点可能需要对共享资源进行访问，这时就需要确保访问的排他性。Zookeep
分布式生成 ID 策略的演进和最佳实践，含springBoot 实现（Java版本）
一、背景在单体架构中，ID通常使用数据库自增或UUID即可满足需求。但在微服务、分布式环境中，这些方式存在性能瓶颈、重复冲突、时序不全等问题。因此，分布式ID生成策略应运而生，用于确保在高并发、跨节点、异地部署的系统中，生成全局唯一、趋势递增、高性能的ID。二、演进历程单机自增ID（如数据库自增）Java原生UUID工具类生成（如雪花算法、KeyUtil等）中间件分布式协调（如Zookeeper、
【容器】优质文章分享
文章目录加速器Docker教程安装坑volumn网络配置踩坑其他dockerfiledocker-compose手册教程网络坑docker使用dockermysqldockermongoredisdocker-rabbitmqnginxtomcatnacoszookeeperelasticsearch加速器现在docker镜像站真的不好找了。阿里什么的加速目前只能给阿里自己的容器用了。且用且珍惜D
Kafka Controller 元数据解析与故障恢复实战指南磐基Stack专业服务团队 Kafka kafka linq 分布式
#作者：张桐瑞文章目录1生产案例：Controller选举在故障恢复中的关键作用1.1问题背景1.2核心操作原理：2Controller元数据全景：从ZooKeeper到内存的数据镜像2.1元数据核心载体：ControllerContext类2.2核心元数据深度解析1生产案例：Controller选举在故障恢复中的关键作用1.1问题背景某Kafka集群部分核心主题分区一直处于“不可用”状态，通过k
Zookeeper异常ConnectionLossException: KeeperErrorCode = ConnectionLoss for / 问题解决大全 takmehand Java java zookeeper
zookeeper报ConnectionLossException:KeeperErrorCode=ConnectionLossfor异常我的开发环境是Windows开发zookeeper客户端程序,zookeeper集群安装在本地虚拟机上centos7经过自己踩坑和查找博客,发现报此异常有三种原因一是:zookeeper服务没有启动,这是最low的错误二是:centos防火墙未关闭,导致连接不上
【Note】《Kafka: The Definitive Guide》第二章 Installing Kafka：Kafka 安装与运行
《Kafka:TheDefinitiveGuide》第二章InstallingKafka：Kafka安装与运行本章核心目标是教读者如何在本地搭建Kafka，包括依赖安装、启动服务、测试运行等操作。一、Kafka的依赖与基本结构1.Kafka的核心组成Kafka并不是一个单独运行的进程，它依赖以下两个核心组件：组件作用ZooKeeperKafka用于存储元数据（如broker注册信息、control
利用已有的 PostgreSQL 和 ZooKeeper 服务，启动dolphinscheduler-standalone-server3.1.9 镜像云游大数据平台 zookeeper docker postgresql 工作流任务调度
ApacheDolphinScheduler是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景，提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。ApacheDolphinScheduler旨在解决复杂的大数据任务依赖关系，并为应用程序提供数据和各种OPS编排中的关系。解决数据研发ETL依赖错综复杂，无法监控任务健康状态的问题。DolphinSchedule
RPC--zookeeper服务提供类
ZKServiceProviderImpl实现类：下面三个属性，第一个serviceMap，key是服务名称，value是Object也就是服务对象，用于快速查找服务实例第二个registeredService，是已经注册的服务名称，防止重复注册服务第三个serviceRegistry是一个服务注册组件，负责将服务元数据写入Zookeeper接口方法：添加服务、获取服务、发布服务1、addServ
解决Windows下C++编译ZooKeeper时的`__imp_zookeeper_init`错误
本文还有配套的精品资源，点击获取简介：在Windows环境中使用C++编译ZooKeeper客户端库时，可能会遇到__imp_zookeeper_init错误，这通常是由于动态链接库（DLL）导入问题导致的。文章解释了如何处理这个错误，包括获取ZooKeeper开发库、配置编译器、链接ZooKeeper库、拷贝DLL文件以及正确使用API。此外，也提到了如何从源代码编译ZooKeeper，以确保所
ZooKeeper应用场景和实现方案详解：从分布式协调到微服务架构的全场景实践一切皆有迹可循微服务注册中心分布式技术分布式架构 zookeeper 后端云原生微服务 java
前言在分布式系统中，协调与一致性是构建可靠服务的核心挑战。ApacheZooKeeper作为高性能分布式协调服务，提供了一套通用的分布式原语，被广泛应用于服务注册发现、分布式锁、配置管理等关键场景。本文将深入解析ZooKeeper的典型应用场景，结合具体代码示例展示实现方案，帮助开发者快速掌握其核心用法。一、服务注册与发现：构建弹性微服务架构1.1场景需求微服务架构中，服务实例动态上下线，需要一个
SpringBoot教程（二十二） | SpringBoot实现分布式定时任务之elastic-job Slow菜鸟 #SpringBoot学习篇 spring boot 分布式后端
SpringBoot教程（二十二）|SpringBoot实现分布式定时任务之elastic-job简介适用场景前置条件：需要ZooKeeper配合1、引入相关依赖2、application.yml中配置注册中心和作业调度巨坑（配置修改无效）3、job实例4、ElasticJob-UI监控平台（相当于管理端页面）参考文章：【1】SpringBoot整合分布式任务调度Elastic-Job【2】Ela
分布式作业: Elastic-Job 赤橙红的黄 Spring 分布式
1.背景介绍Spring框架自带的定时任务scheduled如果部署多台机器时，同一个任务会执行多次，比如给用户计算收益定时任务，每天定时给用户计算收益，如果部署了多台，同一个用户将重复计算多次收益（业务错误），但如果只部署一台机器，无法保证高可用性，如果定时任务机器宕机，无法故障转移；Elastic-Job基于Zookeeper、Quartz开发的Java分布式定时任务解决方案。2.优点高可用性
分布式定时任务：Elastic-Job-Lite
Elastic-Job-Lite是一款由Apache开源的轻量级分布式任务调度框架，属于ShardingSphere生态体系的一部分。它专注于分布式任务调度，支持弹性伸缩、分片处理、高可用等特性，且不依赖中心化架构。一、基础（一）核心特性分布式协调通过ZooKeeper实现作业的分布式调度和协调，确保任务在集群环境中不重复、不遗漏地执行。分片机制支持将任务拆分为多个分片（Sharding）并行执行
【Java面试】RocketMQ的设计原理用心分享技术 Java面试题 java 面试 rocketmq
一、核心架构设计原因NameServer轻量级无状态问题：传统注册中心（如ZooKeeper）强一致性（CP）设计复杂，且在高并发场景下性能瓶颈明显。解决：NameServer采用无状态+最终一致性（AP），节点间不通信，仅通过Broker心跳（30s/次）更新路由，降低复杂度并提升吞吐量。容忍分钟级不一致（如Broker宕机需120s剔除），适合消息路由这种非强一致场景。Broker主从架构与文
基于 SASL/SCRAM 让 Kafka 实现动态授权认证 zlt2000 Java java springboot kafka
一、说明在大数据处理和分析中ApacheKafka已经成为了一个核心组件。然而在生产环境中部署Kafka时，安全性是一个必须要考虑的重要因素。SASL（简单认证与安全层）和SCRAM（基于密码的认证机制的盐化挑战响应认证机制）提供了一种方法来增强Kafka集群的安全性。本文将从零开始部署ZooKeeper和Kafka并通过配置SASL/SCRAM和ACL（访问控制列表）来增强Kafka的安全性。二
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二) 争取不加班！ hadoop hbase zookeeper 大数据运维
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
Nacos与Eureka、ZooKeeper的区别？ leijmdas java
Nacos、Eureka和ZooKeeper是分布式系统中常用的服务注册与发现组件，但它们在功能定位、一致性模型、性能特性及适用场景上存在显著差异。以下从核心维度进行对比分析：一、功能定位对比特性NacosEurekaZooKeeper核心功能服务注册发现+动态配置管理仅服务注册发现分布式协调（含服务发现）健康检查多模式（心跳+服务端主动探测）仅客户端心跳临时节点会话机制管理界面功能丰富，支持配置
JT808教程：设置/查询终端参数
REDISANT提供互联网与物联网开发测试套件#互联网与中间件：RedisAssistantZooKeeperAssistantKafkaAssistantRocketMQAssistantRabbitMQAssistantPulsarAssistantHBaseAssistantNoSqlAssistantEtcdAssistantGarnetAssistant工业与物联网：MQTTAssist
深入了解大数据领域Zookeeper的ACL权限管理 AGI大模型与大数据研究院大数据 zookeeper wpf ai
深入了解大数据领域Zookeeper的ACL权限管理关键词：Zookeeper、ACL权限管理、大数据安全、分布式系统、访问控制、权限模型、数据保护摘要：本文深入探讨了Zookeeper中的ACL(AccessControlList)权限管理系统。作为分布式协调服务的核心组件，Zookeeper的ACL机制对于保障大数据环境中的数据安全至关重要。文章将从基础概念出发，详细解析ZookeeperAC
Dubbo与Zookeeper核心解析 Java开发廖志伟 Java场景面试宝典 Dubbo Service Discovery Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
.net基于数据库实现分布式锁
.NET基于数据库实现分布式锁全解析前言在分布式系统中，分布式锁是保证数据一致性和避免并发问题的重要手段。在.NET环境下，除了使用Redis、Zookeeper等专业工具实现分布式锁，我们还可以基于数据库来实现。本文将深入探讨如何在.NET中利用数据库实现分布式锁，并分析其优缺点和注意事项。实现思路基于数据库实现分布式锁的核心思路是利用数据库的事务和唯一性约束。我们可以创建一个专门的表来存储锁的
Zookeeper集群永旗狍子 Linux java zookeeper 分布式
目录Zookeeper集群架构图Zookeeper集群中节点的角色Zookeeper数据同步Zookeeper选举搭建Zookeeper集群Java连接Zookeeper集群Zookeeper集群架构图Zookeeper集群中节点的角色Leader(Master)：事务请求的唯一处理者，也可以处理读请求。Follower(Slave)：可以直接处理客户端的读请求，并向客户端响应；但其不会处理事务请
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

ZooKeeper leader选举 源码分析