zthgreat

ZooKeeper分析-选举篇

前言

前面几篇文章讲了整体概念，服务器启动的流程，对于选举过程是一笔带过，我们已经了解了ZooKeeper 集群中的三种服务器角色：Leader,Follower 和Observer,本篇接下来主要讲述Leader选举的相关流程。

我们从选举算法概述、服务器启动Leader选举详细过程两个方面探讨实现细节。

仅仅分析选举流程还是比较简单的

ZooKeeper 系列文章会讲一些重要的功能和概念，主要包括：

重要概念介绍 - 整体视图的认识
服务端启动流程
集群选举过程
会话管理
读写请求操作
数据与存储

本节主要讲一下 Leader选举流程,对于前面内容可以点击相关链接进行跳转。

选举算法概述

ZooKeeper 的Leader 选举过程，简单来讲，就是一个集群中所有的机器相互之间进行一系列的投票，选举产生最合适的机器成为Leader,同时其余的机器成为Follower 或少 Observer的集群机器角色初始化过程。

关于Leader 选举算法，简而言之，就是集群中哪个机器处理的数据越新，其越有可能成为Leader。当然如果集群中的所有机器处理的数据都是一致的话，那么SID 最大的服务器将成为Leader.具体的判断逻辑，可以看后面的选票PK内容。

SID 用来标识一台ZooKeeper 集群中的机器，每台机器不能重复，和myId的值一致

ZXID 是一个64位事务ID,用来标识一次服务器状态的变更。在某一个时刻，集群中每台机器的ZXID值都不一定全都一致。

它高32位是epoch（ZAB协议通过epoch编号来区分 Leader 周期变化的策略）用来标识 leader 关系是否改变，每次一个 leader 被选出来，它都会有一个新的 epoch=（原来的epoch+1），标识当前属于那个leader的统治时期。低32位用于递增计数。

选举的条件是集群中至少有两台机器。主要流程如下：

每个server发出一个投票
接收各个服务器的投票消息
处理投票
统计投票
改变服务器状态

QuorumPeer.OrderState定义了服务器的四种状态，分表是：

LOOKING： 寻找Leader状态，服务器处于该状态时，表示集群中没有leader，需要进入leader选举流程。
FOLLOWING： 跟随者状态，表明当前服务器角色是Follower
LEADER： 领导者状态，表明当前服务器角色是leader
OBSERVING： 观察者状态

服务器启动时的Leader 选举和服务器运行期间的Leader 选举基本是一样的，这里我们主要分析服务启动时的Leader选举流程。

Leader选举

服务器启动Leader选举只在集群模式启动时触发。根据上一篇文章
ZooKeeper分析-服务端启动流程，描述了项目启动过程，在执行QuerumPeer start()方法时会触发选举逻辑。

选举流程图

同样的我们先来看一下整体的流程图，方便梳理有个整体的认识。

其实也就是FastLeaderElection#lookForLeader 方法的逻辑。

初始化选举算法

QuerumPeer super.start()方法中会开始选举过程(相关代码在QuerumPeer. run 中)。

 @Override
public synchronized void start() {
    if (!getView().containsKey(myid)) {
        throw new RuntimeException("My id " + myid + " not in the peer list");
    }
    loadDataBase();
    startServerCnxnFactory();
    try {
        adminServer.start();
    } catch (AdminServerException e) {
        LOG.warn("Problem starting AdminServer", e);
        System.out.println(e);
    }
    // 设置选举算法，初始化相关工作
    // 初始选举算法，和 选举网络IO管理器
    startLeaderElection();
    super.start();
}

在 startLeaderElection() 中，根据electionAlg来决定实现哪种选举算法，这个参数是在zoo.cfg配置文件中配置的。electionAlg的值有0，1，2，3四种。3为TCP版本的FastLeaderElection。

3.4.0之后的版本都推荐使用FastLeaderElection模式，下面主要讲这种实现。

同时还会生成初始投票(初始投票投自己)

投票数据结构

投票的数据结构如下：

//相关代码可以参考 org.apache.zookeeper.server.quorum.Vote

//被推举的Leader的SID值
private final long id;

//被推举的Leader的事务ID
private final long zxid;

//选举轮次
private final long electionEpoch;

//被推举的Leader的epoch
private final long peerEpoch;

//当前服务器的状态
private final ServerState state;

//选举的版本
private final int version;

只有当server state为LOOKING状态是才触发选举过程。

if (getPeerState() == ServerState.LOOKING) {
    // 初始投票，投自己
    currentVote = new Vote(myid, getLastLoggedZxid(), getCurrentEpoch());
}

生成投票的规则为首次都选择自己作为Leader进行投票，传入myid,zxid,epoch值。分表代表机器编号ID，事务ID，当前的轮询次数。生成的投票结果再下面会用到，会作为message发给其他机器。

初始化QuorumCnxManager

//org.apache.zookeeper.server.quorum.QuorumPeer#createElectionAlgorithm
QuorumCnxManager qcm = createCnxnManager();

在上篇文章中，我们介绍过 QuorumCnxManager：

QuorumCnxManager 是用于服务端选举过程中处理网络IO的一个管理器，每台服务器启动的时候

都会启动一个QuorumCnxManager，负责各台服务器之间的底层Leader选举过程中的网络通信

在QuorumCnxManager 这个类内部维护了一系列的队列，用于保存接收到的，待发送的消息，以及消息的发送器。除接收队列以外，这里提到的所有队列都有一个共同点―按SID分组形成队列集合，我们已发送队列为例说明这个分组的概念。假设集群中自身外还有4台机器，那么当前服务器就会为这4台服务器分别创建一个发送队列，互不干扰。

初始化监听器

如果选举网络I/O管理器创建成功，需要注册一个监听器，监听器里维护着两个线程，进行消息发送和接收

QuorumCnxManager.Listener listener = qcm.listener;
if (listener != null) {
    listener.start();
    FastLeaderElection fle = new FastLeaderElection(this, qcm);
    // 初始化/开启选举算法
    fle.start();
    le = fle;
} else {
    LOG.error("Null listener when initializing cnx manager");
}

listener.start() 后续会进行注册端口，监听事件，部分功能委托 ListenerHandler,这部分可以自行阅读。

初始化选举算法

在初始化监听器后，紧接着会开启选举算法:

FastLeaderElection fle = new FastLeaderElection(this, qcm);
fle.start();

下面的代码只截图了部分，为了方便里面，先来看看FastLeaderElection 部分数据结构：

FastLeaderElection 中有两个阻塞队列(上图中没有画出来)：sendqueue，recvqueue 用于收发消息。

收发消息委托给了 Messenger 类，而 Messenger 有两个子类，WorkerSender和WorkerReceiver 分别来承担这两个工作，更多的可以阅读相关源码。

// FastLeaderElection 构造函数
public FastLeaderElection(QuorumPeer self, QuorumCnxManager manager) {
	this.stop = false;
	this.manager = manager;
	// 初始化相关环境
	starter(self, manager);
}


private void starter(QuorumPeer self, QuorumCnxManager manager) {
	this.self = self;
	proposedLeader = -1;
	proposedZxid = -1;
	
	// 消息发送队列
	sendqueue = new LinkedBlockingQueue();
	// 消息接收队列
	recvqueue = new LinkedBlockingQueue();
	this.messenger = new Messenger(manager);
}

/**
* This method starts the sender and receiver threads.
*/
public void start() {
	this.messenger.start();
}


// 消息发送 worker
WorkerSender ws;
// 消息接收 worker
WorkerReceiver wr;

// 消息发送线程
Thread wsThread = null;

// 消息接收线程
Thread wrThread = null;

Messenger(QuorumCnxManager manager) {

	this.ws = new WorkerSender(manager);

	this.wsThread = new Thread(this.ws, "WorkerSender[myid=" + self.getId() + "]");
	this.wsThread.setDaemon(true);

	this.wr = new WorkerReceiver(manager);

	this.wrThread = new Thread(this.wr, "WorkerReceiver[myid=" + self.getId() + "]");
	this.wrThread.setDaemon(true);
}

建立连接

当接收到连接后，会初始化进行相关工作(是否主动发起连接，或者初始化消息发送和接收线程)。

为了避免两台服务器之间重复得创建TCP连接，ZooKeeper 设计了一个建立TCP连接的规则：

只允许SID大的服务器主动和其他服务器建立连接，否则端口连接。服务器通过对比自己和远程服务器的SID值，来判断是否接受连接请求。如果当前服务器发现自己的SID值更大，那么会断开当前连接，然后自己主动去和远程服务器建立连接。

这个我们在服务启动篇也提及过这个

自增选举轮次

在FastLeaderElection 实现中，有一个logicalclock 属性，用于标识当前Leader 的选举轮次，ZooKeeper规定了所有有效的投票都必须在同一轮次中。ZooKeeper 在开始新一轮的投票时，会首先对logicalclock 进行自增操作。

synchronized (this) {
	logicalclock.incrementAndGet();
	// 初始化投票信息
	updateProposal(getInitId(), getInitLastLoggedZxid(), getPeerEpoch());
}
// 发送初始化投票
sendNotifications();

初始化投票

在开始进行新一轮的投票之前，每个服务器都会首先初始化自己的选票，在初始化阶段，每台服务器都会将自己推选为Leader。

发送投票消息

在完成选票初始化后，服务器就会发起第一次投票。ZooKeeper会将刚刚初始化好的选票放入sendqueue队列中，由发送器WorkerSender负责发送出去。

WorkerSender的处理逻辑在private void process(ToSend m)中，它根据messge type来判断消息类型进行不同的处理。用switch case来处理。总共有四类不同的消息类型

crequest：发起选举的请求信息
challenge：选举信息
notification：通知消息
ack：响应消息

这里代码粗略看一下就行了。

static enum mType {
            crequest, challenge, notification, ack
        }

ToSend(mType type, long tag, long leader, long zxid, long epoch,
        ServerState state, InetSocketAddress addr) {

    switch (type) {
    case crequest:
        this.type = 0;
        this.tag = tag;
        this.leader = leader;
        this.zxid = zxid;
        this.epoch = epoch;
        this.state = state;
        this.addr = addr;

        break;
    case challenge:
        this.type = 1;
        this.tag = tag;
        this.leader = leader;
        this.zxid = zxid;
        this.epoch = epoch;
        this.state = state;
        this.addr = addr;

        break;
    case notification:
        this.type = 2;
        this.leader = leader;
        this.zxid = zxid;
        this.epoch = epoch;
        this.state = QuorumPeer.ServerState.LOOKING;
        this.tag = tag;
        this.addr = addr;

        break;
    case ack:
        this.type = 3;
        this.tag = tag;
        this.leader = leader;
        this.zxid = zxid;
        this.epoch = epoch;
        this.state = state;
        this.addr = addr;

        break;
    default:
        break;
    }
}

case 0:构造一个选举开始请求给其他机器。

/*
 * Building challenge request packet to send
 */
requestBuffer.clear();
requestBuffer.putInt(ToSend.mType.crequest.ordinal());
requestBuffer.putLong(m.tag);
requestBuffer.putInt(m.state.ordinal());
zeroes = new byte[32];
requestBuffer.put(zeroes);
requestPacket.setLength(48);
requestPacket.setSocketAddress(m.addr);

if (challengeMap.get(m.tag) == null) {
    mySocket.send(requestPacket);
}

case 1: 发送选举信息给其他机器

/*
 * Building challenge packet to send
 */
long newChallenge;
ConcurrentHashMap tmpMap = addrChallengeMap.get(m.addr); 
if(tmpMap != null){
    Long tmpLong = tmpMap.get(m.tag);
    if (tmpLong != null) {
        newChallenge = tmpLong;
    } else {
        newChallenge = genChallenge();
    }

    tmpMap.put(m.tag, newChallenge);

    requestBuffer.clear();
    requestBuffer.putInt(ToSend.mType.challenge.ordinal());
    requestBuffer.putLong(m.tag);
    requestBuffer.putInt(m.state.ordinal());
    requestBuffer.putLong(newChallenge);
    zeroes = new byte[24];
    requestBuffer.put(zeroes);
    requestPacket.setLength(48);
    requestPacket.setSocketAddress(m.addr);
    mySocket.send(requestPacket);   
}

case 2：构造通知消息去发送，有重试机制，最多重试maxAttempts次

case 3：发送ack消息

case 3:
    requestBuffer.clear();
    requestBuffer.putInt(m.type);
    requestBuffer.putLong(m.tag);
    requestBuffer.putInt(m.state.ordinal());
    requestBuffer.putLong(m.leader);
    requestBuffer.putLong(m.zxid);
    requestBuffer.putLong(m.epoch);
    requestPacket.setLength(48);
    try {
        requestPacket.setSocketAddress(m.addr);
    } catch (IllegalArgumentException e) {
    }
    try {
        mySocket.send(requestPacket);
    } catch (IOException e) {
        LOG.warn("Exception while sending ack: ", e);
    }
    break;

接收外部投票

每台服务器都会不断的从 recvqueue 队列中获取外部投票。

WorkerReceiver也是根据消息类型来进行处理的。
当message type = 0时，表示其他机器发起了选举的请求，当前机器也会生成内部投票消息去发送。每台服务器都会不断的从recvqueue队列中获取外部投票，如果服务器无法获取任何外部投票时，会立即确认自己是否和集群中其他服务器保持着有效连接，如果没有建立连接，那么会马上建立连接，如果已经建立连接，那么就再次发送当前的内部投票

case 0:
    // Receive challenge request
    ToSend c = new ToSend(ToSend.mType.challenge, tag,
            current.getId(), current.getZxid(),
            logicalclock.get(), self.getPeerState(),
            (InetSocketAddress) responsePacket.getSocketAddress());
    sendqueue.offer(c);
    break;

type = 1时，接收其他机器发来的选举信息，保存到本地。是通过challengeMap来保存的，是个ConcurrentHashMap

case 1:
    // Receive challenge and store somewhere else
    long challenge = responseBuffer.getLong();
    saveChallenge(tag, challenge);
    break;

判断选举轮次

在处理外部投票的时候，会根据选举轮次来进行不同的处理

如果通知消息的选举轮次比本身的高，则更新自己的选举轮次，并接收通知中的选举信息作为自己的选举信息进行发送。然后把通知消息放入recvqueue中，生成的自身的选举消息放入sendqueue中。
如果外部投票的选举轮次小于内部投票，那么会忽略该外部投票，不做任何处理。
外部投票和内部投票选举轮次一致，则开始进行选票PK。

if ((myMsg.lastEpoch <= n.epoch)
        && ((n.zxid > myMsg.lastProposedZxid) 
        || ((n.zxid == myMsg.lastProposedZxid) 
        && (n.leader > myMsg.lastProposedLeader)))) {
    myMsg.lastProposedZxid = n.zxid;
    myMsg.lastProposedLeader = n.leader;
    myMsg.lastEpoch = n.epoch;
}

recvqueue.offer(n);
ToSend a = new ToSend(ToSend.mType.ack, tag,
        current.getId(), current.getZxid(),
        logicalclock.get(), self.getPeerState(),
        (InetSocketAddress) responsePacket
                .getSocketAddress());
sendqueue.offer(a);

选票PK

totalOrderPredicate会判断一个外部选票是否大于内部选票。判断的逻辑为：

外部选票的选举轮次更高
外部选票的选举轮次跟内部一样，但是zxid更高
外部选票的选举轮次跟内部一样,zxid也相同，但是sid更高

这三种情况都会是外部选票胜出。

protected boolean totalOrderPredicate(long newId, long newZxid, long newEpoch, long curId, long curZxid, long curEpoch) {
    if(self.getQuorumVerifier().getWeight(newId) == 0){
        return false;
    }

    /*
     * We return true if one of the following three cases hold:
     * 1- New epoch is higher
     * 2- New epoch is the same as current epoch, but new zxid is higher
     * 3- New epoch is the same as current epoch, new zxid is the same
     *  as current zxid, but server id is higher.
     */
    return ((newEpoch > curEpoch) ||
            ((newEpoch == curEpoch) &&
            ((newZxid > curZxid) || ((newZxid == curZxid) && (newId > curId)))));
}

变更投票

通过选票PK，确定了外部选票优于内部投票，那么就进行选票变更。使用外部投票的选票信息覆盖内部投票。变更完成后，再次将这个变更后的内部投票发送出去。

synchronized void updateProposal(long leader, long zxid, long epoch){
    if(LOG.isDebugEnabled()){
        LOG.debug("Updating proposal: " + leader + " (newleader), 0x"
                + Long.toHexString(zxid) + " (newzxid), " + proposedLeader
                + " (oldleader), 0x" + Long.toHexString(proposedZxid) + " (oldzxid)");
    }
    proposedLeader = leader;
    proposedZxid = zxid;
    proposedEpoch = epoch;
}

发送通知：

/**
 * Send notifications to all peers upon a change in our vote
 */
private void sendNotifications() {
    for (long sid : self.getCurrentAndNextConfigVoters()) {
        QuorumVerifier qv = self.getQuorumVerifier();
        ToSend notmsg = new ToSend(ToSend.mType.notification,
                proposedLeader,
                proposedZxid,
                logicalclock.get(),
                QuorumPeer.ServerState.LOOKING,
                sid,
                proposedEpoch, qv.toString().getBytes());
        if(LOG.isDebugEnabled()){
            LOG.debug("Sending Notification: " + proposedLeader + " (n.leader), 0x"  +
                  Long.toHexString(proposedZxid) + " (n.zxid), 0x" + Long.toHexString(logicalclock.get())  +
                  " (n.round), " + sid + " (recipient), " + self.getId() +
                  " (myid), 0x" + Long.toHexString(proposedEpoch) + " (n.peerEpoch)");
        }
        sendqueue.offer(notmsg);
    }
}

选票归档

无论是否进行了投票变更，都会将收到的外部投票放入选票集合recvset中进行归档，recvset用于记录当前服务器在本轮次的选举中收到的所有外部投票

voteSet = getVoteTracker(
        recvset, new Vote(proposedLeader, proposedZxid,
                logicalclock.get(), proposedEpoch));

if (voteSet.hasAllQuorums()) {

    // Verify if there is any change in the proposed leader
    while((n = recvqueue.poll(finalizeWait,
            TimeUnit.MILLISECONDS)) != null){
        if(totalOrderPredicate(n.leader, n.zxid, n.peerEpoch,
                proposedLeader, proposedZxid, proposedEpoch)){
            recvqueue.put(n);
            break;
        }
    }

统计投票

投票统计的过程就是为了统计集群中是否已经有了过半的服务器认可了当前的内部投票，如果是，则终止投票
FastLeaderElection#lookForLeader:

// 投票是否过半
if (voteSet.hasAllQuorums()) {

    // Verify if there is any change in the proposed leader
	while ((n = recvqueue.poll(finalizeWait, TimeUnit.MILLISECONDS)) != null) {
		if (totalOrderPredicate(n.leader, n.zxid, n.peerEpoch, proposedLeader, 			proposedZxid, proposedEpoch)) {
			recvqueue.put(n);
			break;
		}
	}

    /*
    * This predicate is true once we don't read any new
    * relevant message from the reception queue
    */
	if (n == null) {
		setPeerState(proposedLeader, voteSet);
		Vote endVote = new Vote(proposedLeader, proposedZxid, logicalclock.get(), 	proposedEpoch);
		leaveInstance(endVote);
		return endVote;
	}
}

更新服务器状态

统计投票后，如果已经确定可以终止投票，那么就更新服务器状态。先判断投票结果的Leader是否是自己，如果是的话，就会将自己的服务器状态更新为Leading，如果不是自己的话，根据情况来确定自己是FOLLOWING还是OBSERVING,这部分的内容，我们上篇文章(启动流程)中有介绍，这里就不重复了。

总结

我们在这篇文章中一起了解了 Zookeeper 选举流程，单独看选举过程的话，过程思路还是比较简单，对于ZAB协议等等什么的就没有介绍了，这里就了解整个选举过程就可以了，在整个过程中，很多地方都用到队列，和单独的一些线程，这种思想很值得我们学习。

参考

《从PAXOS到ZOOKEEPER分布式一致性原理与实践》

ZooKeeper源码分析(四) - Leader选举

你可能感兴趣的:(【分布式框架】)

Java架构师之路：微服务架构图解和详情技术人小冯分布式微服务微服务架构分布式架构 java
微服务框架搭建：总体规划框架名称当前技术选型方案微服务框架搭建开发框架单体服务SpringBoot分布式框架SpringCloud最新框架SpringCloudAlibaba服务配置中心+服务消息总线阿里巴巴Nacos、Config+Bus+RabbitMQ配合使用、携程apolo服务网关SpringCloud-Gateway服务降级限流阿里Sentienl、SpringCloud-Hystrix
python 并行框架_基于python的高性能实时并行机器学习框架之Ray介绍 weixin_39778582 python 并行框架
前言加州大学伯克利分校实时智能安全执行实验室(RISELab)的研究人员已开发出了一种新的分布式框架，该框架旨在让基于Python的机器学习和深度学习工作负载能够实时执行，并具有类似消息传递接口(MPI)的性能和细粒度。这种框架名为Ray，看起来有望取代Spark，业界认为Spark对于一些现实的人工智能应用而言速度太慢了;过不了一年，Ray应该会准备好用于生产环境。目前ray已经发布了0.3.0
爬虫分布式框架PySpider 菠菜很好吃 python 爬虫分布式
介绍PySpider是一个基于Python的分布式爬虫框架，它以其强大的功能和灵活性在数据爬取领域得到广泛应用。以下是对PySpider的详细介绍：一、PySpider的特点分布式部署：PySpider支持分布式部署和任务调度，可以通过配置多个爬虫节点来实现高并发的爬取任务，提高爬取效率和可靠性。高效异步爬取：PySpider使用异步网络库（如Tornado、gevent等）来实现并发请求，能够显
鸿蒙学习自由流转与分布式运行环境-价值与架构定义(1) 技术分享，共享成长鸿蒙 harmonyos 学习架构
文章目录价值与架构定义1、价值2、架构定义随着个人设备数量越来越多，跨多个设备间的交互将成为常态。基于传统OS开发跨设备交互的应用程序时，需要解决设备发现、设备认证、设备连接、数据同步等技术难题，不但开发成本高，还存在安全隐私、兼容性、性能等诸多问题。为了适应万物互联时代的环境变化，鸿蒙系统构建了基于分布式运行环境所需要的基础设施，为开发者提供了基础的分布式框架能力，使开发者可以更方便的实现跨设备
（九）ROS运行管理 PaLu-LvL ROS从入门到实践机器人 c++ubuntu 学习
前言1.ROS是多进程(节点)的分布式框架，一个完整的ROS系统实现：可能包含多台主机；每台主机上又有多个工作空间(workspace)；每个的工作空间中又包含多个功能包(package)；每个功能包又包含多个节点(Node)，不同的节点都有自己的节点名称；每个节点可能还会设置一个或多个话题(topic)...2.在多级层深的ROS系统中，其实现与维护可能会出现一些问题，比如，如何关联不同的功能包
分布式框架Celery七(Django-Celery-Flower实现异步和定时爬虫及其监控邮件告警) yjjpp2301 Celery 分布式 django python 后端
Django中集成方式安装模块pipinstallDjango==3.2.22pipinstallcelerypipinstallredispipinstalleventlet#在windows环境下需要安装eventlet包-----------pipinstalldjango-celery-beatpipinstalldjango-celery-resultspipinstalldjango-
python ray分布式_取代 Python 多进程！伯克利开源分布式框架 Ray weixin_39946313 python ray分布式
Ray由伯克利开源，是一个用于并行计算和分布式Python开发的开源项目。本文将介绍如何使用Ray轻松构建可从笔记本电脑扩展到大型集群的应用程序。并行和分布式计算是现代应用程序的主要内容。我们需要利用多个核心或多台机器来加速应用程序或大规模运行它们。网络爬虫和搜索所使用的基础设施并不是在某人笔记本电脑上运行的单线程程序，而是相互通信和交互的服务的集合。云计算承诺在所有维度上(内存、计算、存储等)实
wueasy基础平台1.3.0版本发布 fallsea
1.3.0版本发布wueasy是一个java后端的分布式快速开发平台（框架），主要用于提供后端接口的研发，提供简单、高效、安全、稳定的基础平台。使用自动生成代码工具，可以更便捷的开发。底层基于SpringBoot和RPC实现的一个分布式框架。1.高效开发.他使开发更简洁、更高效新的开发模式，开发一个业务功能已最新的代码来实现，不需要太多的代码和配置，使开发更简洁、高效。提供接口自动生成工具，减少重
《Linux运维总结：基于银河麒麟V10+ARM64架构CPU部署zookeeper 3.8.4二进制分布式集群》东城绝神《Linux运维实战总结》运维分布式 linux zookeeper
总结：整理不易，如果对你有帮助，可否点赞关注一下？更多详细内容请参考：《Linux运维篇：Linux系统运维指南》一、功能简介1、什么是ZookeeperZooKeeper是一个开源的、分布式的应用程序协调服务，它为分布式框架提供协调服务的Apache项目。它是Google的Chubby项目的开源实现之一，并且是Hadoop和HBase等项目的重要组成部分。ZooKeeper提供的功能包括配置维护
Java面试：分布式框架面试题合集 returnShitBoy java 面试分布式
为了方便分享，我把这些面试资料都上传到了百度网盘，提取地址如下：链接:https://pan.baidu.com/s/1naAr7TIpsI6N_WSiAHytsQ?pwd=hx5z如果链接失效了，请加这个百度网盘群890162707，资料在群共享里面。1.什么是ZooKeeper？答：ZooKeeper是一个开源的分布式应用程序协调服务，是一个典型的分布式数据一致性解决方案。设计目的是将那些复杂
Zookeeper efzy 大数据 zookeeper 分布式云原生
Zookeeper第1章Zookeeper入门Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。1.1Zookeeper工作机制1.2特点1）Zookeeper：一个领导者（Leader），多个跟随者（Follower）组成的集群。2）集群中只要有半数以上节点存活，Zookeeper集群就能正常服务。所以Zookeeper适合安装奇数台服务器。3）全局数据一致：每
大数据Zookeeper--入门泛黄的咖啡店大数据 zookeeper 分布式
文章目录Zookeeper入门概述Zookeeper工作机制特点数据结构应用场景Zookeeper下载地址Zookeeper本地安装本地模式安装安装前准备配置修改配置参数解读Zookeeper入门概述Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。Zookeeper=文件系统+通知机制Zookeeper工作机制Zookeeper从设计模式角度来理解：是一个基于观
SpringBoot log4j2日志追踪 Java_Chuck springboot log4j2 spring boot log4j2
写在前面本文只讨论非分布式体系的日志追踪，如果项目使用了微服务、RPC等分布式框架的话，日志追踪有很成熟的框架，Google的Dapper,阿里的EagleEye，Twitter基于Google的Dapper论文开发的Zipkin通过本文将了解到什么是MDC、MDC应用中存在的问题、如何解决存在的问题MDC介绍简介：MDC（MappedDiagnosticContext，映射调试上下文）是log4
深度学习的开源分布式框架Deeplearning4j weixin_43106248 深度学习 Hadoop 深度学习开源分布式框架 deeplearning4j
Deeplearning4j（DL4J）是专门为JVM编写的一个开源深度学习框架，主要用于商业级需求。该框架完全使用Java编写，因此名称中包含了4j”。因为是使用流行的Java语言编写的，所以Deeplearning4j开始受到更多的人和从业者的欢迎。该框架基本上是由Hadoop和Spark集成的分布式深度学习库组成的。在Hadoop和Spark的帮助下，我们可以轻松地分发模型和大数据集，并运行
2024-01-31（MapReduce，YARN）陈xr 随记日志 hadoop mapreduce yarn
1.MapReduce---分布式计算框架MapReduce是分散--->汇总模式的分布式框架，可以供开发人员开发相关程序进行分布式数据计算MapReduce提供了2个编程接口：Map接口，Reduce接口其中，Map接口提供了“分散”功能，由服务器分布式对数据进行处理；Reduce提供了“汇总”功能将分布式的处理结果汇总统计。程序员如果需要使用MapReduce框架完成自定义需求的c程序开发，只
JVS开源框架系列：快速搭建应用中心「含软开企服的开源地址」软件部长
JVS项目简介JVS是面向软件开发团队可以快速实现应用的基础开发框架，采用微服务分布式框架，提供丰富的基础功能，集成众多业务引擎，它灵活性强，界面化配置对开发者友好，底层容器化构建，集合持续化构建。项目仓库：https://gitee.com/software-minister/jvs如何快速搭建JVS应用中心？文章末端有操作视频！应用管理员在JVS角色中有“应用管理员”的角色，如果赋予该角色，则
大数据----4.hadoop分布式框架搭建学无止境的大象 #大数据 hadoop
hadoop分布式框架搭建一、Hadoop的三种运行模式（启动模式）1.1、单机模式（独立模式）（Local或StandaloneMode）-默认情况下，Hadoop即处于该模式，用于开发和调式。-不对配置文件进行修改。-使用本地文件系统，而不是分布式文件系统。-Hadoop不会启动NameNode、DataNode、JobTracker、TaskTracker等守护进程，Map()和Reduce
JVS开源框架系列：快速学会创建列表页「含软开企服的开源地址」软件部长
JVS项目简介JVS是软开企服开源的，面向软件开发团队可以快速实现应用的基础开发框架，采用微服务分布式框架，提供丰富的基础功能，集成众多业务引擎，它灵活性强，界面化配置对开发者友好，底层容器化构建，集合持续化构建。项目仓库：https://gitee.com/software-minister/jvs关于JVS列表页的创建，具体操作视频如下：JVS开源框架系列：快速学会创建列表页demo:http
Zookeeper集群+Kafka集群 lelelele798 zookeeper kafka 分布式
ZookeeperZookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。分布式系统管理框架，主要用来解决分布式应用集群中应用系统的数据一致性问题相当于各种分布式应用的注册中心+文件系统+通知机制。本质：用于注册各种分布式应用，存储和管理这些分布式应用的元数据，如果应用或服务本身状态发送变化就会通知客户端。Zookeeper工作机制Zookeeper从设计模式角度来理解
Zookeeper集群 + Kafka集群睡美人章繁 zookeeper kafka 分布式
目录一、Zookeeper概述二、Kafka概述三、部署1.部署Zookeeper集群1.环境准备2.安装Zookeeper2.部署kafka集群1.下载安装包2.安装Kafka3.部署Filebeat一、Zookeeper概述1.Zookeeper定义Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。2.Zookeeper工作机制Zookeeper从设计模式角度
消息队列之王——Kafka 袁慕求玲 kafka 分布式
Zookeeper在学习kafka之前，我们需要先学习Zookeeper，那Zookeeper是什么呢？Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。Zookeeper工作机制Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeepe
Zookeeper+Kafka集群王德发666 zookeeper kafka 分布式
1Zookeeper1.1Zookeeper概述Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。分布式系统管理框架，主要用来解决分布式应用集群中应用系统的一致性问题，想大于各种分布式应用的注册中心+文件系统+通知机制本质用于注册各种分布式应用，存储和管理这些分布式应用的元数据，如果应用或服务本身状态发生变化就会通知到客户端数据结构ZooKeeper数据模型的结构
Zookeeper集群为什么老是名字被占用 zookeeper zookeeper kafka 分布式
一、Zookeeper概述1.1Zookeeper定义Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。1.2Zookeeper工作机制Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已经在Zookeeper上注册
渗透测试工具使用之Nmap详解 0rch1d 渗透测试 WEB安全
渗透测试工具使用之Nmap详解0x01Nmap介绍Namp(NetworkMapper)网络映射器，是一款开源免费的网络探测和安全审核工具,他被设计用来快速扫描大型网络，他有图形化界面版本Zenmap，分布式框架DNmap。主要的功能及用途：用于主机发现：发现网络中存活的主机端口扫描：扫描目标主机上端口开放的情况服务识别：识别目标主机上开放的服务以及服务的版本情况系统检测：检测目标主机的操作系统以
Dubbo源代码实现五：RPC中的服务消费方实现飞向札幌的班机 dubbo dubbo Dubbo源代码实现五 RPC中的服务消费方实现
刚开始使用Dubbo的人，可能对Dubbo的第一印象就是它是一个RPC框架，当然，所有的分布式框架都少不了相互通信的过程，何况Dubbo的任务就是帮助分布式业务系统完成服务的通讯、负载、注册、发现和监控等功能。不得不承认，RPC是Dubbo提供服务的核心流程，为了兼容多种使用场景，Dubbo显然需要提供多种RPC方式（协议）.开发一个简单的RPC框架，重点需要考虑的是两点，即编解码方式和底层通讯协
SeaTunnel 、DataX 、Sqoop、Flume、Flink CDC 对比贾斯汀玛尔斯数据湖大数据生态 sqoop flume flink
对比对比项ApacheSeaTunnelDataXApacheSqoopApacheFlumeFlinkCDC部署难度容易容易中等，依赖于Hadoop生态系统容易中等，依赖于Hadoop生态系统运行模式分布式，也支持单机单机本身不是分布式框架，依赖HadoopMR实现分布式分布式，也支持单机分布式，也支持单机健壮的容错机制无中心化的高可用架构设计，有完善的容错机制易受比如网络闪断、数据源不稳定等因
【大数据】zookeeper-3.9.0安装欧叶冲冲冲 zookeeper 大数据 zookeeper 分布式程序人生笔记学习
目录前言一、zookeeper概述1.zookeeper特点2.zookeeper数据结构3.应用场景二、zookeeper安装说明（就要用最新版）1.本地安装2.集群安装3.选举机制4.集群启动停止脚本5.客户端命令行操作总结前言Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目一、zookeeper概述1.zookeeper特点1️⃣Zookeeper：一个领导
zookeeper简介喝水的鱼. zookeeper zookeeper
Zookeeper是一个开源的分布式的，为分布式框架提供协调服务的Apache项目。Zookeeper工作机制Zookeeper从设计模式角度来理解：是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应。Zookeeper特点Zooke
java技术专家【分布式框架】【通过C语言深度解读Redis核心架构】02-Redis底层数据结构源码分析之压缩列表的源码分析不走小道 Java技术专家 java c语言 redis
文章目录三、压缩列表的源码分析3.1、存储结构字节数组结构节点结构3.2、压缩解码zipEntryZIP_DECODE_PREVLENZIP_DECODE_LENGTH3.3、API解析ziplistNewziplistInsertziplistDeleteziplistFind3.4、级联更新
java技术专家【分布式框架】【通过C语言深度解读Redis核心架构】01-Redis源码环境搭建和整体分析不走小道 Java技术专家分布式 redis 开源
文章目录一、环境搭建1.1软件介绍Cygwin（64位）Clion（2022.1）1.2软件安装1>安装配置cygwin2>加入path3>安装apt-cyg4>下载Clion2022.11.3将Redis源码导入Clion并运行1>下载Redis6.2源码2>导入Redis项目3>编写CMakeLists.txt
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C