xwy_hdu

死磕Zookeeper Leader选举算法

文章目录

摘要
一、引言
二、背景知识

1、Zookeeper 集群角色
2、Zookeeper 集群服务器（Server）的状态
3、术语定义
4、算法简介

**算法流程如下**：
**算法流程如下**：
B.算法实现

三、Zookeeper Leader选举过程

1、何时选举Leader
2、为何选举Leader
3、如何选举Leader

服务器初始化启动时期Leader选举：
服务器运行期间无法和Leader保持连接：

四、Zookeeper 一致性协议与数据同步
五、参考文献

摘要

本文旨在介绍Zookeeper集群Leader过程及相关算法分析，对Zookeeper数据同步及其他功能涉及有限。

一、引言

最近部门组织技术分享，分享内容是架构相关的，其中考虑线上集群数据一致性问题。由此引发了Zookeeper是如何实现数据一致的讨论，中间最重要环节就是Zookeeper 集群Leader的选举过程及算法，之前自己也网上搜罗过一些Zookeepre集群Leader选举相关的文章，但多数文章对一些选举的细节讲的都不够深入和透彻，以至于直到这次分享讨论时都没有完全明白整个Leader选举过程，遂以此文终结该问题。

二、背景知识

正文开始之前，先介绍一下Zookeeper相关的基本概念及下文中用到的相关术语。

1、Zookeeper 集群角色

分布式集群中最典型的部署就是Master/Slave 模式（主备模式）和Master/Follower 模式（主从模式），然而Zookeeper并未没有采用上述模式，而是将集群中的服务分为：Leader、Follower 和 Observer 三种角色，每个角色的职责与承担功能略有差异。

Leader：既能提供读服务也能提供写服务，负责更新（同步）数据及数据更新（同步）前的写请求的投票发起与决议，是整个集群（半数以上Server）数据一致性的保障，所有Follower与Observer的数据均由Leader同步所得；
Follower：用于接受客户端请求并想客户端返回结果，在选主过程中参与投票；
Observer：接受客户端连接，将写请求转发给leader，但不参加投票过程，只同步leader的状态（数据），设计observer的目的是为了扩展系统，提升数据读取速度与集群的负载能力；
Learner：Follower和Observer的统称；
Client：请求发起方，获取配置信息及更新配置请求；

图1（集群角色关系）

图2（集群角色职能）

2、Zookeeper 集群服务器（Server）的状态

Zookeeper集群中服务器具有以下四种状态，分别为：LOOKING、FOLLOWING、LEADING及OBSERVING。

LOOKING：寻找Leader的状态（选举Leader状态），当服务器处于该状态时，它会认为当前集群中没有Leader，因此需要进入Leader选举状态；
FOLLOWING：跟随者状态，表明当前服务器角色是Follower；
LEADING：领导者状态，表明当前服务器角色是Leader；
OBSERVING：观察者状态，表明当前服务器角色是Observer；

3、术语定义

Zookeeper集群常用术语及Leader选举过程中名次解释：
常用术语：

znode：Zookeeper中的节点，数据操作与承载的主体，对zk的操作主要是对znode的操作，根据存活时间可分为：持久节点和临时节点；持久节点的存活时间不依赖于客户端会话，只有客户端在显式执行删除节点操作时节点才消失，
临时节点的存活时间依赖于客户端会话，当会话结束，临时节点将会被自动删除（也可以手动删除），临时节点也不能拥有子节点；
ZAB协议（ZooKeeper Atomic Broadcast 原子广播）：是为分布式协调服务 ZooKeeper 专门设计的一种支持崩溃恢复的原子广播协议，是Zookeeper实现分布式数据一致性的基础，基于该协议ZooKeeper 实现了一种主备模式的系统架构来保持集群中各个副本之间的数据一致性，协议有两种基本模式：恢复模式和消息广播模式；

ZAB协议的两种基本模式：

1、整个服务框架在启动或是 Leader 服务器出现网络中断、崩溃退出与重启等异常情况时，ZAB 协议就会进人*恢复模式*并选举产生新的Leader服务器。当选举产生了新的 Leader 服务器，同时集群中已经有过半的机器与该Leader服务器完成了状态（数据）同步之后，ZAB协议就会退出*恢复模式*进入*消息广播模式*。其中，所谓的状态（数据）同步用来保证集群中存在过半的机器能够和Leader服务器的数据状态保持一致。

2、当一台同样遵守ZAB协议的服务器启动后加入到集群中时，如果此时集群中已经存在一个Leader服务器在负责进行消息广播，那么新加入的服务器就会进人数据恢复模式（Leader服务器暂停更新）：找到Leader所在的服务器，并与其进行数据同步，数据同步完成后进入消息广播模式。

3、为了实现数据一致性，ZooKeeper设计成只允许唯一的一个Leader服务器来进行事务请求的处理。Leader服务器在接收到客户端的事务请求后，会生成对应的事务提案（zxid）并发起一轮广播协议，决定是否进行事务处理；而集群中的Follower接收到客户端的事务请求时，会将这个事务请求转发给Leader服务器，由Leader发起广播协议进而处理事务请求。

Leader选举名词：

zxid（Zookeeper Transaction Id）：Client发起事务请求Leader接收后，会对该事务请求进行提议（Proposal），针对这个提议Leader服务器会生成一个64位的数字（zxid），它的高32位是epoch（选举周期）用来标识Leader关系是否改变，低32位是electionEpoch/logicalclock（本地选举周期）用来判断是否为同一次选举。zxid会被记录到transaction log中，值越大，表示数据越新；
epoch（peerEpoch）：选举周期，每次选举最终确定完leader结束选举流程时会自增(zxid的前32位)；
logicalclock（electionEpoch）：本地选举周期，每次投票都会自增(zxid的后32位)；
sid/myid（Server Id）：服务器在集群中被标记id；

4、算法简介

Zookeeper集群Leader选取过程中主要有3中选举算法：

LeaderElection：LeaderElection是Fast Paxos最简单的一种实现，每个Server启动以后都询问其它的Server它要投票给谁，收到所有Server回复以后，就计算出zxid最大的哪个Server，并将这个Server相关信息设置成下一次要投票的Server。该算法于Zookeeper 3.4以后的版本废弃；

算法流程如下：

 a.选举线程首先向所有Server发起一次询问(包括自己)； 

 b.选举线程收到回复后，验证是否是自己发起的询问(验证zxid是否一致)，然后获取对方的sid，并存储到当前询问对象列表中，最后获取对方提议的leader相关信息(sid,zxid)，并将这些信息存储到当次选举的投票记录表中；

 c.收到所有Server回复以后，就计算出zxid最大的那个Server，并将这个Server相关信息设置成下一次要投票的Server；

 d.线程将当前zxid最大的Server设置为当前Server要推荐的Leader，如果此时获胜的Server获得多数Server票数， 将当前获胜的Server设置为Leader，其他Server根据Leader相关信息设置自己的状态（数据），否则，继续这个过程，直到leader被选举出来；

异常问题的处理：

a.选举过程中，新Server的加入：
  新Server启动后它都会发起一次选举投票，由选举线程发起相关流程，该Server会获得当前zxid最大的Server，如果当次最大的Server没有获得不低于 n/2+1 （n为所有的Server数量）的票数，那么下一次投票时，该Server将Leader选举投票给zxid最大的Server，重复以上流程，最后一定能选举出一个Leader。
b.选举过程中，Server的退出：
  只要保证集群中至少有n/2+1个Server是正常的就没有任何问题，如果少于n/2+1个Server存活，那么该集群就不能正常提供服务（Zookeeper集群协议决定），也就没有必要进行Leader选举了。
c.选举过程中，Leader死亡：
  选举出Leader以后，每个Server的状态(FLLOWING)都已经确定，如果此时Leader死亡，Fllower都会向Leader发送Ping消息，检查Leader状态，以便数据同步，如果无法ping通，就改变自己的状为(FLLOWING ==> LOOKING)，发起新的一轮选举。
d.双主问题：
  Leader的选举是保证有且只有一个Leader产生，而且Follower重新选举与旧Leader恢复并退出基本上是同时发生的，当有一半以上Follower无法Ping通Leader时是就会认为Leader已经出问题开始重新选举。

FastLeaderElection：由于LeaderElection收敛速度较慢（需要等n台Server全部都收到其他对应的n-1台Server回复自己信息及自己投票信息后才进行下一轮选举，一般2-3轮投票能选出Leader），所以Zookeeper引入了FastLeaderElection选举算法，FastLeaderElection也是Zookeeper默认的Leader选举算法。FastLeaderElection是标准的Fast Paxos的实现，它首先向所有Server提议自己要成为Leader，当其它Server收到提议以后，比较投票中 sid 和 zxid 的值，并决定是否接受对方的提议，然后向对方发送接受提议完成的消息。FastLeaderElection算法通过异步的通信方式来收集其它节点的选票，同时在分析选票时又根据投票者的当前状态来作不同的处理，以加快Leader的选举进程；

算法流程如下：

 A.发起一轮投票选举，推举自己作为Leader，通知所有的服务器，等待接收外部选票； 

 B.只要当前服务器状态为LOOKING，进入循环，不断地读取其它Server发来的通知、进行比较、更新自己的投票、发送自己的投票、统计投票结果，直到Leader选出或出错退出；具体实现如下：

B.算法实现

 从队列中取出一个Notification（选票），则根据消息中对方的状态进行相应的处理：
 1.LOOKING状态：
   a.如果其他Server发送过来Notification的逻辑时钟大于当前的逻辑时钟，说明这是一次新的选举投票，此时更新本机的逻辑时钟（logicalclock），清空投票箱（数据已经过期），判断Notification是否优于当前本机的投票，是的话用对方推荐的Leader更新下一次的投票，否则使用本机的投票（投自己），通知其它Server我的投票，跳到d；
   b.如果对方处于上轮投票，不予理睬，回到B；
   c.如果对方也处于本轮投票，判断对方的投票是否优于当前的投票，是的话更新当前的投票，否则使用初始的投票（投自己）并新生成Notification消息放入发送队列。通知其它Server我的投票
   d.将收到的投票放入自己的投票箱中。
   e.判断所推荐的Leader是否得到集群多数人的同意（根据计票器的实现不同，可以是单纯看数量是否超过n/2，也可以是按权重来判断，我们这里假设单纯看数量），如果得到多数人同意，那么还需等待一段时间，看是否有比当前更优的提议，如果没有，则认为投票结束。根据投票结果修改自己的状态。以上任何一条不满足，则继续循环。
   
 2.OBSERVING状态：不做任何事；
 
 3.FOLLOWING或LEADING状态：
  a.如果选举周期相同（选票是同一轮选举产生），将该数据保存到投票箱，根据当前投票箱的投票判断对方推荐的Leader是否得到多数人的同意，如果是则设置状态退出选举过程，否则到b；
  b.这是一条与当前逻辑时钟不符合的消息，或者对方推荐的Leader没有得到多数人的同意（有可能是收集到的投票数不够），那么说明可能在另一个选举过程中已经有了选举结果，于是将该选举结果加入到outofelection集合中，再根据outofelection来判断是否可以结束选举，如果可以也是保存逻辑时钟，设置状态，退出选举过程。否则继续循环。outofelection用于保存那些状态为FOLLOWING或者LEADING的ZooKeeper节点发送的选票，由于对方的状态为FOLLOWING或者LEADING，所以它们当前不参与选举过程（可能人家已经选完了），因此称为“out of election”；

AuthFastLeaderElection：AuthFastLeaderElection算法同FastLeaderElection算法基本一致，只是在消息中加入了认证信息，该算法在最新的Zookeeper中也建议弃用，这里就不做过多的介绍了，有需要的可自行网上查阅了解；

三、Zookeeper Leader选举过程

上面介绍了一些Zookeeper相关的知识，特别是Leader选举算法中的FastLeaderElection算法，实现起来比较复杂，看完之后也未必能够明白，下面重点通过实例的方式对该算法进行讲解说明。

1、何时选举Leader

服务器初始化启动时；
服务器运行期间无法和Leader保持连接（Follower Ping不通 Leader）；

2、为何选举Leader

Leader是保证分布式数据一致性的关键所在，所有Follower服务器都需要从Leader同步数据，如果集群中Leader不存在将无法保证集群中服务器上的数据一致性，Zookeeper也就失去了其存在的价值与意义。

3、如何选举Leader

Leader选举一般有两种情况：服务器初始化启动和服务器运行期间无法和Leader保持连接，下面分别针对这两种情况进行说明：

服务器初始化启动时期Leader选举：

若进行Leader选举，则至少需要3台机器（否则无法达到Leader收到投票过半数的要求），假设服务器集群中有5台机器（编号依次为Server1-Server5），在集群初始化阶段，所有服务器均启动完成后，此时任意两台机器都可以相互通信，每台机器都试图找到Leader，于是就进入Leader选举过程。
选举过程如下：

1.  各个Server发起投票。每个Server将自己作为Leader服务器来进行投票，每次投票会包含所推举的服务器的myid（sid）和zxid，使用(myid, zxid)来表示，此时Server1的投票为(1, 0)，Server2的投票为(2, 0)，Server3的投票为(3, 0)，Server4的投票为(4, 0)，Server5的投票为(5, 0)，然后各自将这个投票发给集群中其他机器；
2.  接受来自其他Server的投票。集群的每个服务器收到其他Server的投票后，首先判断该投票的有效性，如检查是否是本轮投票（基于zxid）、是否来自LOOKING状态的服务器等；
3. 处理投票。针对每一个接收到的投票，服务器都需要将其他Server的投票和自己的投票进行PK，PK规则如下：
  a. 比较zxid，zxid大的投票信息保留，并作为下一轮的投票信息；
  b.zxid相同比较myid（sid），myid（sid）大的投票信息保留，并作为下一轮的投票信息；
  对于Server1而言，它自己的投票是(1, 0)，接收到的投票为(2, 0)、(3, 0)、(4, 0)、(5, 0)，规矩比较规则，会更新自己的投票为(5, 0)，然后重新投票；对于Server3、Server4同理也会更新自己的投票为(5,0)；对Server5而言，其无须更新自己的投票，只是再次向集群中所有机器发出上一次投票信息即可。
4. 统计投票结果。每次投票后，服务器都会统计投票信息，判断是否已经有过半机器接受到相同的投票信息，对于第二轮投票Server1、Server2、Server3而言，都统计出集群中已经有3台机器接受了(5, 0)的投票信息，此时便认为已经选出了Leader 为 Server5；
5. 改变服务器状态。一旦确定了Leader，每个服务器就会更新自己的状态，如果是Follower，那么就变更为FOLLOWING，如果是Leader，就变更为LEADING；

服务器运行期间无法和Leader保持连接：

在Zookeeper运行期间，Leader与Follower服务器各司其职，即便当有Follower服务器宕机或新加入，此时也不会影响Leader，但是一旦Leader服务器挂了，那么整个集群将暂停对外服务，进入新一轮Leader选举，其过程和启动时期的Leader选举过程基本一致。假设Zookeepre集群中正在运行的服务器有Server1、Server2、Server3、Server4、Server5，当前Leader是Server5，若某一时刻Server5挂了，此时便开始新Leader的选举。选举过程如下：

1.  变更状态。Leader挂后，余下的Follower服务器都会将自己的服务器状态变更为LOOKING，然后开始进入Leader选举；
2.  每个Server会发出一个投票。在运行期间，每个服务器上的zxid可能不同，此时假定Server1的zxid为121，Server2的zxid为122，Server3的zxid为122，Server4的zxid为121；在第一轮投票中，Server1、Server2、Server3、Server4都会投自己，产生投票(1, 121)，(2, 122)，(3, 122)，(4, 121)，然后各自将投票发送给集群中所有机器；
3. 处理投票。针对每一个接收到的投票，服务器都需要将其他Server的投票和自己的投票进行PK，PK规则如下：
  a. 比较zxid，zxid大的投票信息保留，并作为下一轮的投票信息；
  b.zxid相同比较myid（sid），myid（sid）大的投票信息保留，并作为下一轮的投票信息；
  对于Server1而言，它自己的投票是(1, 121)，接收到的投票为(2, 122)、(3, 122)、(4, 121)，规矩比较规则，会更新自己的投票为(3,122)，然后重新投票；对于Server2、Server4同理也会更新自己的投票为(3,122)；对Server3而言，其无须更新自己的投票，只是再次向集群中所有机器发出上一次投票信息即可。
4. 统计投票结果。每次投票后，服务器都会统计投票信息，判断是否已经有过半机器接受到相同的投票信息，对于第二轮投票Server1、Server2、Server4而言，都统计出集群中已经有3台机器接受了(3,122)的投票信息，此时便认为已经选出了Leader位Server3；
5. 改变服务器状态。一旦确定了Leader，每个服务器就会更新自己的状态，如果是Follower，那么状态会有LOOKING变更为FOLLOWING，如果是Leader，就变更为LEADING；

四、Zookeeper 一致性协议与数据同步

Zookeeper实现数据一致性的核心是ZAB协议，该协议需要做到以下几点：

集群在半数以下节点宕机的情况下，能正常对外提供服务；
客户端的写请求全部转交给leader来处理，leader需确保写变更能实时同步给所有follower及observer；
leader宕机或整个集群重启时，需要确保那些已经在leader服务器上提交的事务最终被所有服务器都提交，确保丢弃那些只在leader服务器上被提出的事务，并保证集群能快速恢复到故障前的状态；

Zab协议有两种模式：崩溃恢复（选主+数据同步）和消息广播（事务操作），任何时候都需要保证只有一个主进程负责进行事务操作，而如果主进程崩溃了，就需要迅速选举出一个新的主进程，主进程的选举机制与事务操作机制是紧密相关的。

1、选主后数据同步：选主算法中的zxid是从内存数据库中取的最新事务id，事务操作分为两个阶段：提出阶段和提交阶段，leader生成提议并广播给followers，收到半数以上的ack后，再广播commit消息，同时将事务操作应用到内存中。follower收到提议后先将事务写到本地事务日志，然后反馈ack，等接到leader的commit消息时，才会将事务操作应用到内存中。选主其实只是选出了内存数据是最新的节点，仅仅靠这个是无法保证已经在leader服务器上提交的事务最终被所有服务器都提交。比如leader发起提议p1,并收到半数以上follower关于p1的ack后，在广播commit消息之前宕机了，选举产生的新leader之前是follower，未收到关于p1的commit消息，内存中是没有p1的数据。而ZAB协议的设计是需要保证选主后，p1是需要应用到集群中的。这块的逻辑是通过选主后的数据同步来弥补。

选主后，节点需要切换状态，leader切换成LEADING状态后的流程如下：

重新加载本地磁盘上的数据快照至内存，并从日志文件中取出快照之后的所有事务操作，逐条应用至内存，并添加到已提交事务缓存commitedProposals。这样能保证日志文件中的事务操作，必定会应用到leader的内存数据库中。
获取learner发送的FOLLOWERINFO/OBSERVERINFO信息，并与自身commitedProposals比对，确定采用哪种同步方式，不同的learner可能采用不同同步方式（DIFF同步、TRUNC+DIFF同步、SNAP同步）。这里是拿learner内存中的zxid与leader内存中的commitedProposals（min、max）比对，如果zxid介于min与max之间，但又不存在于commitedProposals中时，说明该zxid对应的事务需要TRUNC回滚；如果 zxid 介于min与max之间且存在于commitedProposals中，则leader需要将zxid+1~max 间所有事务同步给learner，这些内存缺失数据，很可能是因为leader切换过程中造成commit消息丢失，learner只完成了事务日志写入，未完成提交事务，未应用到内存。
leader主动向所有learner发送同步数据消息，每个learner有自己的发送队列，互不干扰。同步结束时，leader会向learner发送NEWLEADER指令，同时learner会反馈一个ack。当leader接收到来自learner的ack消息后，就认为当前learner已经完成了数据同步，同时进入“过半策略”等待阶段。当leader统计到收到了一半已上的ack时，会向所有已经完成数据同步的learner发送一个UPTODATE指令，用来通知learner集群已经完成了数据同步，可以对外服务了。

2、事务操作：ZAB协议对于事务操作的处理是一个类似于二阶段提交过程。针对客户端的事务请求，leader服务器会为其生成对应的事务proposal，并将其发送给集群中所有follower机器，然后收集各自的选票，最后进行事务提交。流程如下图：

ZAB协议的二阶段提交过程中，移除了中断逻辑（事务回滚），所有follower服务器要么正常反馈leader提出的事务proposal，要么就抛弃leader服务器。follower收到proposal后的处理很简单，将该proposal写入到事务日志，然后立即反馈ack给leader，也就是说如果不是网络、内存或磁盘等问题，follower肯定会写入成功，并正常反馈ack。leader收到过半follower的ack后，会广播commit消息给所有learner，并将事务应用到内存；learner收到commit消息后会将事务应用到内存。

五、参考文献

1.https://segmentfault.com/a/1190000016349824
2.https://juejin.im/post/5b949d595188255c6a041c22
3.https://www.cnblogs.com/hongdada/p/8145075.html
4.https://blog.csdn.net/zhengzhihust/article/details/53456371
5.https://zhuanlan.zhihu.com/p/25594630

Flink命令行启动Job任务平凡的运维之路 linux 程序人生
Flink非交互式运行Job任务Flink命令行启动Job任务具体命令flink参数说明-c,--class-d,--detached后台运行-p,--parallelism并行度[test@xxx~]$flinkrun-d-cclass_nameJob-p3./flink-statics-1.0.jar-zookeeper"10.130.41.51:2181,10.130.41.52:2181,
zookeeper&nacos&kafka之间的联系 Gold Steps. 技术博文分享 zookeeper kafka 微服务服务发现
一、ZooKeeper与Kafka的协同工作原理1.核心关系：Kafka对ZooKeeper的依赖在Kafka2.8版本之前，ZooKeeper是Kafka集群的“大脑”，负责管理集群元数据、协调节点状态和故障恢复。两者的协同主要通过以下关键机制实现：Broker注册与心跳KafkaBroker启动时会在ZooKeeper的/brokers/ids路径下注册临时节点（EphemeralNode），
Hadoop相关面试题努力的搬砖人. java 面试 hadoop
以下是150道Hadoop面试题及其详细回答，涵盖了Hadoop的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面，每道题目都尽量详细且简单易懂：Hadoop基础概念类1.什么是Hadoop？Hadoop是一个由Apache基金会开发的开源分布式计算框架，主要用于处理和存储大规模数据集。它提供了高容错性和高扩展性的分布式存
Kafka 数据写入问题喝醉酒的小白 DBA kafka 分布式
目录标题分析思路1.**生产者配置问题**：Kafka生产者的配置参数生产者和消费者的处理确定并优化2.**网络问题**：3.**Kafka集群配置问题**：unclean.leader.election.enable4.**Zookeeper配置问题**：5.**JVM参数调优**：6.**副本因子和同步复制**：分析思路针对您提到的Kafka数据写入问题，以下是一些具体的原因和排查命令：1.生
Storm实战常见问题及解决方案 Lzy失控的 storm-分布式流式计算 bigdata-大数据
原文seehttp://blog.sina.com.cn/s/blog_8c243ea30101k0k1.html1关于Storm集群1.1关于storm集群的环境变量配置问题安装好JDK后，需要配置环境变量，通常情况下出于经验，我们往往会修改/etc/profile的值进行环境变量配置，但这在安装JDK以及后面安装的storm集群、zookeeper集群以及metaq集群时会出问题，这时候我们需
ubuntu20.04系统安装zookeeper简单教程楼下创了电瓶车 zookeeper 分布式云原生
Ubuntu系统中安装和配置Zookeeper的完整指南ApacheZookeeper是一个开源的分布式协调服务，广泛用于分布式应用程序中管理配置、提供命名服务、分布式同步以及组服务等。在本教程中，我们将详细介绍如何在Ubuntu系统中安装Zookeeper，并进行相关配置，使其能够正常运行。环境准备在开始之前，请确保你的Ubuntu系统版本为18.04或更高版本。此外，Zookeeper依赖于J
linux zk服务关闭_linux – 如何在Ubuntu上停止ZooKeeper？童广 linux zk服务关闭
我按照建议here在ubuntu14.04上安装了zookeeperd：不幸的是,这个过程在某种程度上是不可停止的.我甚至试过杀了-9user@node1:/opt/zookeeper-3.4.6$ps-ef|grepzookeeperzookeep+40081801:07?00:00:00/usr/bin/java-cp/etc/zookeeper/conf:/usr/share/java/jl
ubuntu20.04 zookeeper安装 Yue9v zookeeper linux 分布式
安装ZooKeeper之前，请确保你已经安装了Java，因为ZooKeeper需要Java运行环境。java安装sudoapt-getupdatesudoapt-get-yinstallopenjdk-11-jdkjava--version设置JAVA_HOME环境变量gedit~/.bashrc添加如下行来设置JAVA_HOME：exportJAVA_HOME=/usr/lib/jvm/java
Spark集群启动与关闭陈沐 spark spark hadoop big data
Hadoop集群和Spark的启动与关闭Hadoop集群开启三台虚拟机均启动ZookeeperzkServer.shstartMaster1上面执行启动HDFSstart-dfs.shslave1上面执行开启YARNstart-yarn.shslave2上面执行开启YARN的资源管理器yarn-daemon.shstartresourcemanager(如果nodeManager没有启动(正常情况
Spring Boot 动态配置管理：ZooKeeper 集成与 Redis 配置覆盖实践 weixin_43833540 java-zookeeper spring boot zookeeper
一、引言在微服务架构中，配置管理的动态性与灵活性至关重要。传统通过application.properties/application.yml进行静态配置的方式，已难以满足实时更新需求。本文将详细介绍如何通过ZooKeeper实现SpringBoot应用的Redis配置动态管理，并支持配置热刷新。二、核心实现方案1整体架构设计ZooKeeper作为配置中心存储Redis配置SpringBoot应用
Zookeeper（111）Zookeeper的事务ID（zxid）是如何生成的？辞暮尔尔-烟火年年微服务 zookeeper linux 分布式
在ZooKeeper中，事务ID（zxid，ZooKeeperTransactionID）是一个全局唯一的标识符，用于标识每个事务操作。它不仅用于标识事务顺序，还用于实现一致性协议。每个事务操作（如创建、删除、更新ZNode）都会生成一个唯一的zxid，并且zxid是递增的。1.zxid的结构zxid是一个64位的长整型数，其中高32位表示纪元（epoch），低32位表示事务计数器（counter
Liunx启动kafka并解决kafka时不时挂掉的问题 RyFit linux kafka
kafka启动步骤先启动zookeeper，启动命令如下nohup./zookeeper-server-start.sh/home/kafka/kafka/config/zookeeper.properties>/home/kafka/kafka/zookeeper.log2>&1&再启动kafka，启动命令如下nohup./kafka-server-start.sh/home/kafka/kaf
springboot kafka spring boot搭建单机集群集成入门木秀林环境配置 kafka spring boot docker
搭建kafka(单机版)使用虚拟机+docker参考https://blog.csdn.net/qq_35394891/article/details/84349955https://www.cnblogs.com/xiaohanlin/p/10078865.html拉取镜像(kafka依赖zookeeper,所有两个都要)dockerpullwurstmeister/zookeeperdocke
Java面试精选：Kafka+Zookeeper+redis+JVM+RabbitMQ，最全总结我叫小迁W：bjmsb2019 Java 架构面试数据库 java redis mysql 分布式
大家开始准备金九银十了吗？不知是跳槽还是找工作的朋友，趁现在增进一下自己的技术何尝不是一件好事呢？一、RabbitMQ1.rabbitmq的使用场景有哪些？2.rabbitmq有哪些重要的角色？3.rabbitmq有哪些重要的组件？4.rabbitmq中vhost的作用是什么？5.rabbitmq的消息是怎么发送的？6.rabbitmq怎么保证消息的稳定性？7.rabbitmq怎么避免消息丢失？8
CAP 公理解析：分布式系统中的一致性、可用性与分区容错性 Vitalia 系统设计分布式系统 CAP
文章目录1.CAP公理的核心概念1.1一致性（Consistency）1.2可用性（Availability）1.3分区容错性（PartitionTolerance）2.CAP公理的三种选择2.1CA（一致性+可用性）2.2CP（一致性+分区容错性）2.3AP（可用性+分区容错性）3.CAP公理的实际应用3.1CP系统（一致性+分区容错性）示例1：ZooKeeper示例2：etcd3.2AP系统（
RabbitMQ实战（二）-消息持久化策略、事务以及Confirm消息确认方式 Java思享汇 RabbitMQ学习 RabbitMQ 消息持久化事务 confirm ack
「扫码关注我，面试、各种技术（mysql、zookeeper、微服务、redis、jvm）持续更新中～」RabbitMQ学习列表：RabbitMQ实战（一）-消息通信基本概念·在上一篇学习完RabbitMQ通信的基本概念后，我们来继续学习消息的持久化以及代码实现RabbitMQ通信。在正常生产环境运维过程中无法避免RabbitMQ服务器重启，那么，如果RabbitMQ重启之后，那些队列和交换器就会
Zookeeper性能优化与调优技巧精讲 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Zookeeper性能优化与调优技巧精讲1.背景介绍1.1什么是Zookeeper?ApacheZooKeeper是一个开源的分布式协调服务,为分布式应用程序提供高可用性和强一致性的协调服务。它主要用于解决分布式环境中的数据管理问题,如统一命名服务、配置管理、分布式锁、集群管理等。ZooKeeper的设计目标是构建一个简单且高效的核心,以确保最大程度的可靠性和可扩展性。1.2Zookeeper的应
关于虚拟机的VMware和Ubuntu18之间的网络问题海洋猿 ubuntu linux 运维网络
在这里我记录一下最近遇到的问题，因为最近在虚拟机上配置了zookeeper集群，并且使用的网络是桥接网络。由于我的宿主机是通过手机热点连接的，这可能在桥接模式下导致了我的ip分配的网段发生改变，经过一番百度之后，决定改用nat模式网络。这是他们之间的区别，简单来说，我想要虚拟机的ip恢复到之前的，而不用我再去修改zookeeper的一堆配置，也不用我去考虑宿主机和虚拟机不在相同的网段下。一、桥接模
Zookeeper（103）如何在生产环境中使用Zookeeper的命令行工具？辞暮尔尔-烟火年年微服务 zookeeper 分布式云原生
在生产环境中使用ZooKeeper的命令行工具是管理和调试ZooKeeper集群的重要手段。ZooKeeper提供了一个名为zkCli.sh的命令行工具，可以用来执行各种操作，如创建节点、读取数据、设置ACL等。以下是详细的步骤和代码示例，展示如何使用ZooKeeper的命令行工具。连接到ZooKeeper首先，确保你已经安装了ZooKeeper并且ZooKeeper服务正在运行。你可以使用Zoo
Zookeeper（102）如何在生产环境中设置Zookeeper的ACL？辞暮尔尔-烟火年年微服务 zookeeper debian 分布式
在生产环境中设置ZooKeeper的访问控制列表（ACL）是确保数据安全和访问控制的关键步骤。ACL允许你定义谁可以访问ZooKeeper节点以及他们可以执行的操作。以下是设置ZooKeeperACL的详细步骤和代码示例。ACL基础知识ZooKeeper支持以下几种权限：CREATE：允许创建子节点。READ：允许读取节点数据和获取子节点列表。WRITE：允许设置节点数据。DELETE：允许删除子
本地docker安装zookeeper,kafka,flink a724952091 flink kafka docker
首先安装zookeeper这里zookeeper的安装是为了去使用kafka这里我们安装的是wurstmeister的kafka和zookeeper镜像也是在hub.docker.com网站上，Star最多的kafka镜像直接在cmd执行run命令（前提是有本地docker。。。）第一次使用因为本地没有此镜像会去下载dockerrun-d--namezookeeper-p2181-twurstme
Docker-compose编排部署Kafka伪分布式集群(为后续实验搭建基础环境) F_Hello_World Kafka kafka docker
本实验参照官网http://kafka.apache.org/documentation/构建,为后续了解kafka应用做环境准备。搭建环境：MAC10.15docker19.03.4docker-composeversion1.24.1jdk1.8以上(对于kafka2.x以上版本已遗弃对jdk1.7的支持)zookeeper-3.4.14(这里没使用kafka自带zk,而使用外置zk,这里zk
使用Spring Boot集成Kafka开发：接收Kafka消息的Java应用 YazIdris java spring boot kafka
Kafka是一个分布式的流处理平台，它具有高吞吐量、可扩展性和容错性的特点。SpringBoot提供了与Kafka集成的便捷方式，使得开发者可以轻松地创建Kafka消息接收应用。本文将介绍如何使用SpringBoot集成Kafka开发，以及如何编写Java代码来接收Kafka消息。首先，确保你已经安装了Kafka和Zookeeper，并启动了它们。接下来，创建一个新的SpringBoot项目，并添
搭建分布式Hive集群逸曦玥泱大数据运维分布式 hive hadoop
title:搭建分布式Hive集群date:2024-11-2923:39:00categories:-服务器tags:-Hive-大数据搭建分布式Hive集群本次实验环境：Centos7-2009、Hadoop-3.1.4、JDK8、Zookeeper-3.6.3、Mysql-5.7.38、Hive-3.1.2功能规划方案一（本地运行模式）Master主节点（Mysql+Hive）192.168
zookeeper程序员指南 weixin_30326741 java 运维 shell
1简介本文是为想要创建使用ZooKeeper协调服务优势的分布式应用的开发者准备的。本文包含理论信息和实践信息。本指南的前四节对各种ZooKeeper概念进行较高层次的讨论。这些概念对于理解ZooKeeper是如何工作的，以及如何使用ZooKeeper来进行工作都是必要的。这几节没有代码，但却要求读者对分布式计算相关的问题较为熟悉。本文的大多数信息以可独立访问的参考材料的形式存在。但是，在编写第一
ZooKeeper学习总结（1）——ZooKeeper入门介绍一杯甜酒 ZooKeeper学习总结 Zookeeper
1.概述Zookeeper是Hadoop的一个子项目，它是分布式系统中的协调系统，可提供的服务主要有：配置服务、名字服务、分布式同步、组服务等。它有如下的一些特点：简单Zookeeper的核心是一个精简的文件系统，它支持一些简单的操作和一些抽象操作，例如，排序和通知。丰富Zookeeper的原语操作是很丰富的，可实现一些协调数据结构和协议。例如，分布式队列、分布式锁和一组同级别节点中的“领导者选举
Zookeeper+kafka学习笔记 CHR_YTU Zookeeper
Zookeeper是Apache的一个java项目，属于Hadoop系统，扮演管理员的角色。配置管理分布式系统都有好多机器，比如我在搭建hadoop的HDFS的时候，需要在一个主机器上（Master节点）配置好HDFS需要的各种配置文件，然后通过scp命令把这些配置文件拷贝到其他节点上，这样各个机器拿到的配置信息是一致的，才能成功运行起来HDFS服务。Zookeeper提供了这样的一种服务：一种集
Zookeeper【概念（集中式到分布式、什么是分布式、CAP定理、什么是Zookeeper、应用场景、为什么选择Zookeeper 、基本概念）】(一)-全面详解（学习总结---从入门到深化）童小纯中间件大全---全面详解 zookeeper 分布式
作者简介：大家好，我是小童，Java开发工程师，CSDN博客博主，Java领域新星创作者系列专栏：前端、Java、Java中间件大全、微信小程序、微信支付、若依框架、Spring全家桶如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步如果感觉博主的文章还不错的话，请三连支持一下博主哦博主正在努力完成2023计划中：以梦为马，扬帆起航，2023追梦人目录Zookeeper概念_集中式到分布
Zookeeper与Kafka学习笔记上海研博数据 zookeeper kafka 学习
一、Zookeeper核心要点1.核心特性分布式协调服务，用于维护配置/命名/同步等元数据采用层次化数据模型（Znode树结构），每个节点可存储<1MB数据典型应用场景：HadoopNameNode高可用HBase元数据管理Kafka集群选举与状态管理2.设计限制内存型存储，不适合大数据量场景数据变更通过版本号（Version）控制，实现乐观锁机制采用ZAB协议保证数据一致性二、Kafka核心架构
Zookeeper学习种豆走天下 zookeeper 学习分布式
Zookeeper是一个开源的分布式协调框架，它主要用于处理分布式系统中的一些常见问题，如同步、配置管理、命名服务和集群管理等。Zookeeper是由Apache提供的，并且广泛应用于各种分布式应用中，特别是在高可用、高可靠性和高性能的系统中。Zookeeper的主要功能分布式协调：Zookeeper提供了协调多个节点（服务器）间行为的机制。例如，分布式锁、选举、配置管理等。命名服务：Zookee
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

死磕Zookeeper Leader选举算法

文章目录

摘要

一、引言

二、背景知识

1、Zookeeper 集群角色

2、Zookeeper 集群服务器（Server）的状态

3、术语定义

4、算法简介

算法流程如下：

算法流程如下：

B.算法实现

三、Zookeeper Leader选举过程

1、何时选举Leader

2、为何选举Leader

3、如何选举Leader

服务器初始化启动时期Leader选举：

服务器运行期间无法和Leader保持连接：

四、Zookeeper 一致性协议与数据同步

五、参考文献

你可能感兴趣的:(ZooKeeper)