小凯Alex

Zookeeper学习记录

Study Material

zooKeeper全网资源总结

zooKeeper底层原理&应用总结强烈推荐!全网最强zk学习资料

zk的应用场景与原理总结

zk是什么?

官方说法:解决分布式应用的数据管理问题.
如:统一命名服务,状态同步服务(分布式锁),集群的管理,分布式应用配置项的管理.

zk提供了什么?

zookeeper: 文件系统+通知机制

文件系统

zk维护一个类似于文件系统的数据结构,每一个子目录项为一个Znode,提供对数据的内存型KV存储.

* 通知系统

客户端通过注册监听(watch)它关心的目录节点,当目录节点发生变化的时候,zk会通知客户端.

zookeeper能用来干什么

命名服务
在zk的文件系统里创建一个目录,即有一个唯一的路径，
Zk可以通过顺序节点的特性来生成全局唯一ID，从而对分布式系统提供命名服务。
可用于文件搜索与发现.
配置管理

假如现在有四台机器运行着四个相同的客户端程序,程序有很多配置,假如要修改配置的话,逐个修改很麻烦对吧.我们不如把配置都放在zk上,保存在zk的某个目录节点当中,然后所有相关应用程序对这个目录节点进行监听.一旦配置发生变化,那么每个程序都会收到zk的通知。

具体做法是通过Watcher机制实现数据的发布和订阅，客户端节点可以对某个ZNode注册监听，之后如果要统一修改客户端的配置，只要直接把新的配置写入该ZNode，所有服务节点就可以收到这个事件。

集群管理

两点:是否有机器退出或者加入/master的选举

对于管理集群机器的加入与退出问题:

所有机器可以约定在父目录GroupMembers下创建临时目录节点,然后监听父目录节点的子节点变化消息.

一旦有机器挂掉,这个机器与zk的链接断开.其所创建的临时目录节点会被删除,所有其他机器都会收到通知:这个机器已经退出了.

机器新加入也是类似的.

对于master选举问题:
每个机器对应一个目录节点,那么我们可以对目录节点做编号,根据编号选master即可.

分布式锁

锁服务分为两类,一个是保持独占,另一个是控制时序.

对于第一类,把zk上的一个znode看作是一把锁,通过createznode的方式来实现.所有客户端都去创建/distribute lock节点,最终成功创建的客户端即拥有这个锁,用完之后就要删除自己创建的锁

对于第二类
/distribute_lock已经预先存在,所有客户端都要在其下面创建临时顺序来对目录节点做编号,与选master一样,编号最小的就获得锁.

Master选举
Zk可以让所有节点区竞争创建同一个ZNode，因为Zookeeper不能有路径相同的ZNode，所以必然只有一个服务节点能够创建成功，创建成功的节点就是Master节点。

zk基本概念

角色
角色可以分为三类

ZooKeeper工作原理

zk的核心是原子广播,这个机制保证了各个Server之间的同步.背后是Zab协议

Zab协议有两种模式:
1.恢复模式:用于选主
2.广播模式:用于同步

当服务启动或者领导者崩溃的时候,Zab进入恢复模式,选出新的领导者.然后直到大多数server完成了对leader状态的同步.

ZooKeeper 还会为每一个 ZooKeeper 事务赋予名为 ZXID 的 64 位唯一 ID 进行标识，其中低 32 位为该事务在此次任期中的序列号，高 32 位为当前 Leader 所属任期的 epoch 值，用于区分不同 Leader 发来的消息。

选主与同步的具体流程可参考:
zk原理解析

具体应用场景

消息队列/数据发布和订阅

索引信息和集群中机器节点状态存放在zk的一些指定节点，供各个客户端订阅使用。

系统日志（经过处理后的）存储，这些日志通常2-3天后被清除。
应用中用到的一些配置信息集中管理，在应用启动的时候主动来获取一次，并且在节点上注册一个Watcher，以后每次配置有更新，实时通知到应用，获取最新配置信息。
消息中间件的消息队列通常有个offset，这个offset存放在zk上，这样集群中每个发送者都能知道当前的发送进度。(如Kafka就是依赖zk来运行的)

分布式命名服务
利用Znode的树架构,可以创建一个全局唯一的path
分布式通知/协调来解耦

ZooKeeper 中特有watcher注册与异步通知机制，能够很好的实现分布式环境下不同系统之间的通知与协调，实现对数据变更的实时处理。使用方法通常是不同系统都对 ZK上同一个znode进行注册，监听znode的变化（包括znode本身内容及子节点的），其中一个系统update了znode，那么另一个系统能够收到通知，并作出相应处理。

另一种心跳检测机制：检测系统和被检测系统之间并不直接关联起来，而是通过zk上某个节点关联，大大减少系统耦合。

另一种系统调度模式：某系统有控制台和推送系统两部分组成，控制台的职责是控制推送系统进行相应的推送工作。管理人员在控制台作的一些操作，实际上是修改了ZK上某些节点的状态，而zk就把这些变化通知给他们注册Watcher的客户端，即推送系统，于是，作出相应的推送任务。

另一种工作汇报模式：一些类似于任务分发系统，子任务启动后，到zk来注册一个临时节点，并且定时将自己的进度进行汇报（将进度写回这个临时节点），这样任务管理者就能够实时知道任务进度。

总之，使用zookeeper来进行分布式通知和协调能够大大降低系统之间的耦合。

以下来自原论文

Zookeeper 本质

提供分布式系统协调服务，提供一些基本原语API来辅助上层分布式应用实现进程间的协调．

从功能上来看，ZooKeeper提供了一个基于目录树结构的内存型ＫＶ存储．

数据统一以ZNode的形式保存在各个ZooKeeper节点的内存中，数据的变更由Leader节点通过Zab协议同步给所有的follower节点．

注：Zab协议是类似于Raft的分布式同步协议.

工作流程:

使用ZooKeeper服务时候,客户端只需要与ZooKeeper集群任一节点建立连接即可,客户端所有读写请求都会由这个节点来负责处理.
如果是读请求,节点会使用自身保存的数据直接返回结果
写请求,会转发给Leader节点进行处理

写操作流程

写操作可以分为三步:
1.Leader对写操作进行预处理,转换为等价ZooKeeper事务

在预处理阶段，Leader 首先会将客户端发来的写请求转换为等价的幂等 ZooKeeper 事务。每个事务都明确的表明了其执行前的期望状态和执行完成后的结果状态。考虑到 Leader 永远持有最新的数据，Leader 是最适合使用自身保存的数据来计算对应的 ZooKeeper 事务的

什么叫做幂等性?
用户对同一操作发起的一次请求或者多个请求的结果是一致的

2.Leader通过Zab协议向所有Follower节点Propose该事务

事务的幂等性还为 Zab 的实现带来的便利，使得 Zab 无论是在正常的数据传递还是节点恢复时都不需要保证消息传递的 exactly-once 语义，只需要保证消息传递的顺序以及 at-least-once 投递即可

3.Leader收到大多数Follower的ACK信息,对事务进行commit,持久化到存储当中

快照与数据恢复

为了应对节点失效,ZooKeeper会对保存的数据周期性地保存在磁盘中以生成快照,以便在节点失效重启后能够快速从最近的快照中恢复数据状态.

生成数据快照与客户端请求处理并发进行,这意味着ZooKeeper生成的数据快照可能不会对应ZooKeeper在任意一个时间点上的实际状态.

ZooKeeper的ZAB协议

ZAB　Zookeeper原子广播协议
提供高效而且可靠的分布式协调服务
ZAB协议是为分布式协调服务Zookeeper专门设计的支持崩溃恢复和原子广播协议
Zookeeper实现了一种主备模式的系统架构来保持集群中各个副本之间的数据一致性

主写读从

与Raft类似的是,ZAB通过主写读从来实现数据的同步(都是由主节点同步到从节点)

两种状态:消息广播与崩溃恢复 zk就来回在这两种状态中切换

消息广播:

类似于一个2PC，在整个消息的广播过程中，Leader 服务器会每个事务请求生成对应的 Proposal，并为其分配一个全局唯一的递增的事务 ID(ZXID)，之后再对其进行广播

1.主节点把数据复制到follower过程中
2.等待follower回应Ack,最低超过半数即成功

3.超过半数则成功回应，执行commit，同时提交自己

崩溃恢复:

崩溃指Leader与过半的Follower失去联系

ZAB设计的选举算法:
能够确保提交被Leader提交事务，同时丢弃没有被leader提交的事务．
具体做法是选举算法要保证选出来的leader拥有最大的ZXID．
那么这个新选出来的leader一定会具有所有已经提交的提案
假设1：Leader 在复制数据给所有 Follwer 之后，没有发送commit之前，怎么办？
假设2：Leader 在收到 Ack 并提交了自己，同时发送了部分 commit 出去之后崩溃怎么办？

解决1: 最终会丢弃那些没有提交的数据
解决2: 最终会同步所有服务器的数据(选举出来的leader肯定会拥有最新最全的数据)

一、什么情况下zab协议会进入崩溃恢复模式？

1、当服务器启动时

2、当leader 服务器出现网络中断，崩溃或者重启的情况

3、当集群中已经不存在过半的服务器与Leader服务器保持正常通信。

二、zab协议进入崩溃恢复模式会做什么？

1、当leader出现问题，zab协议进入崩溃恢复模式，并且选举出新的leader。当新的leader选举出来以后，如果集群中已经有过半机器完成了leader服务器的状态同（数据同步），退出崩溃恢复，进入消息广播模式。

2、当新的机器加入到集群中的时候，如果已经存在leader服务器，那么新加入的服务器就会自觉进入崩溃恢复模式，找到leader进行数据同步。

三、特殊情况下需要解决的两个问题：
1、已经被处理的事务请求（proposal）不能丢（commit的）

 2、没被处理的事务请求（proposal）不能再次出现

什么时候会出现事务请求被丢失呢？

当 leader 收到合法数量 follower 的 ACKs 后，就向各个 follower 广播 COMMIT 命令，同时也会在本地执行 COMMIT 并向连接的客户端返回「成功」。但是如果在各个 follower 在收到 COMMIT 命令前 leader 就挂了，导致剩下的服务器并没有执行都这条消息。

如何解决已经被处理的事务请求（proposal）不能丢（commit的）呢？

1、选举拥有 proposal 最大值（即 zxid 最大）的节点作为新的 leader：由于所有提案被 COMMIT 之前必须有合法数量的 follower ACK，即必须有合法数量的服务器的事务日志上有该提案的 proposal，因此，zxid最大也就是数据最新的节点保存了所有被 COMMIT 消息的 proposal 状态。
2、新的 leader 将自己事务日志中 proposal 但未 COMMIT 的消息处理。
3、新的 leader 与 follower 建立先进先出的队列，先将自身有而 follower 没有的 proposal 发送给 follower，再将这些 proposal 的 COMMIT 命令发送给 follower，以保证所有的 follower 都保存了所有的 proposal、所有的 follower 都处理了所有的消息。通过以上策略，能保证已经被处理的消息不会丢。

问题二出现的场景是：

当 leader 接收到消息请求生成 proposal 后就挂了，其他 follower 并没有收到此 proposal，因此经过恢复模式重新选了 leader 后，这条消息是被跳过的。 此时，之前挂了的 leader 重新启动并注册成了 follower，他保留了被跳过消息的 proposal 状态，与整个系统的状态是不一致的，需要将其删除。

解决方案是：

Zab 通过巧妙的设计 zxid 来实现这一目的。一个 zxid 是64位，高 32 是纪元（epoch）编号，每经过一次 leader 选举产生一个新的 leader，新 leader 会将 epoch 号 +1。低 32 位是消息计数器，每接收到一条消息这个值 +1，新 leader 选举后这个值重置为 0。这样设计的好处是旧的 leader 挂了后重启，它不会被选举为 leader，因为此时它的 zxid 肯定小于当前的新 leader。当旧的 leader 作为 follower 接入新的 leader 后，新的 leader 会让它将所有的拥有旧的 epoch 号的未被 COMMIT 的 proposal 清除。

数据同步

崩溃恢复之后要进行数据同步．Leader首先确认事务是否都已经被过半的Follower提交了．目的是完成保持数据一致

当 Follower 链接上 Leader 之后，Leader 服务器会根据自己服务器上最后被提交的 ZXID 和 Follower 上的 ZXID 进行比对，比对结果要么回滚，要么和 Leader 同步。

zookeeper节点类型？

leader
follower 参与投票
observer 不参与投票

zookeeper选举机制？

基于的ID信息：

1.服务器ID
编号越大，选举的优先级越大

2.Zxid:数据ID
服务器中存放的最大数据ID，值越大说明数据越新，在选举算法中数据越新权重越大

3.Epoch 逻辑时钟
相当于记录选举的轮数，每一轮都会加1

4.Server状态

选举流程：

一：开始选举，每个服务器读取自身的数据ID

二：发送投票信息
a.每个Server第一轮都会投给自己
b.投票信息包括所选举leader的服务器ID，数据ID(zxid)，epoch

三：接受投票信息
假设服务器B接收到来自服务器A的数据

1.服务器A处于选举状态

1）首先要判断epoch逻辑时钟值:

a）如果发送过来的Epoch大于目前的Epoch，那么首先要更新本逻辑时钟Epoch,同时清空本轮逻辑时钟收集到的其他server选举数据

然后根据zxid最大值和leader serverid最大值来判断是否需要更新当前自己的选举leader:

先看zxid,zxid大的先胜出

然后再判断leader serverid,leader serverid大的胜出

然后再把自己最新的选举结果广播给其他server

b）如果发送过来的逻辑时钟小于目前时钟，说明对方的server处在一个较早的epoch，因此需要把目前本地的最新epoch发送回去

c) 如果发送过来的逻辑时钟Epoch等于目前的逻辑时钟。再根据上述判断规则rules judging来选举leader ，然后再将自身最新的选举结果(也就是上面提到的三种数据（leader Serverid，Zxid，Epoch）广播给其他server)

2）

其次，判断服务器是不是已经收集到了所有服务器的选举状态：若是，根据选举结果设置自己的角色(FOLLOWING还是LEADER)，退出选举过程就是了。

最后，若没有收到没有收集到所有服务器的选举状态：也可以判断一下根据以上过程之后最新的选举leader是不是得到了超过半数以上服务器的支持,如果是,那么尝试在200ms内接收一下数据,如果没有新的数据到来,说明大家都已经默认了这个结果,同样也设置角色退出选举过程。

zookeeper主节点故障，如何重新选举？

Ref

Hadoop权威指南
https://mr-dai.github.io/zookeeper/
http://nil.csail.mit.edu/6.824/2018/papers/zookeeper.pdf
非常详细的总结
https://www.cnblogs.com/shuaiandjun/p/9383655.html

Kafka Controller 元数据解析与故障恢复实战指南磐基Stack专业服务团队 Kafka kafka linq 分布式
#作者：张桐瑞文章目录1生产案例：Controller选举在故障恢复中的关键作用1.1问题背景1.2核心操作原理：2Controller元数据全景：从ZooKeeper到内存的数据镜像2.1元数据核心载体：ControllerContext类2.2核心元数据深度解析1生产案例：Controller选举在故障恢复中的关键作用1.1问题背景某Kafka集群部分核心主题分区一直处于“不可用”状态，通过k
Zookeeper异常ConnectionLossException: KeeperErrorCode = ConnectionLoss for / 问题解决大全 takmehand Java java zookeeper
zookeeper报ConnectionLossException:KeeperErrorCode=ConnectionLossfor异常我的开发环境是Windows开发zookeeper客户端程序,zookeeper集群安装在本地虚拟机上centos7经过自己踩坑和查找博客,发现报此异常有三种原因一是:zookeeper服务没有启动,这是最low的错误二是:centos防火墙未关闭,导致连接不上
【Note】《Kafka: The Definitive Guide》第二章 Installing Kafka：Kafka 安装与运行
《Kafka:TheDefinitiveGuide》第二章InstallingKafka：Kafka安装与运行本章核心目标是教读者如何在本地搭建Kafka，包括依赖安装、启动服务、测试运行等操作。一、Kafka的依赖与基本结构1.Kafka的核心组成Kafka并不是一个单独运行的进程，它依赖以下两个核心组件：组件作用ZooKeeperKafka用于存储元数据（如broker注册信息、control
利用已有的 PostgreSQL 和 ZooKeeper 服务，启动dolphinscheduler-standalone-server3.1.9 镜像云游大数据平台 zookeeper docker postgresql 工作流任务调度
ApacheDolphinScheduler是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景，提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。ApacheDolphinScheduler旨在解决复杂的大数据任务依赖关系，并为应用程序提供数据和各种OPS编排中的关系。解决数据研发ETL依赖错综复杂，无法监控任务健康状态的问题。DolphinSchedule
RPC--zookeeper服务提供类
ZKServiceProviderImpl实现类：下面三个属性，第一个serviceMap，key是服务名称，value是Object也就是服务对象，用于快速查找服务实例第二个registeredService，是已经注册的服务名称，防止重复注册服务第三个serviceRegistry是一个服务注册组件，负责将服务元数据写入Zookeeper接口方法：添加服务、获取服务、发布服务1、addServ
解决Windows下C++编译ZooKeeper时的`__imp_zookeeper_init`错误
本文还有配套的精品资源，点击获取简介：在Windows环境中使用C++编译ZooKeeper客户端库时，可能会遇到__imp_zookeeper_init错误，这通常是由于动态链接库（DLL）导入问题导致的。文章解释了如何处理这个错误，包括获取ZooKeeper开发库、配置编译器、链接ZooKeeper库、拷贝DLL文件以及正确使用API。此外，也提到了如何从源代码编译ZooKeeper，以确保所
ZooKeeper应用场景和实现方案详解：从分布式协调到微服务架构的全场景实践一切皆有迹可循微服务注册中心分布式技术分布式架构 zookeeper 后端云原生微服务 java
前言在分布式系统中，协调与一致性是构建可靠服务的核心挑战。ApacheZooKeeper作为高性能分布式协调服务，提供了一套通用的分布式原语，被广泛应用于服务注册发现、分布式锁、配置管理等关键场景。本文将深入解析ZooKeeper的典型应用场景，结合具体代码示例展示实现方案，帮助开发者快速掌握其核心用法。一、服务注册与发现：构建弹性微服务架构1.1场景需求微服务架构中，服务实例动态上下线，需要一个
SpringBoot教程（二十二） | SpringBoot实现分布式定时任务之elastic-job Slow菜鸟 #SpringBoot学习篇 spring boot 分布式后端
SpringBoot教程（二十二）|SpringBoot实现分布式定时任务之elastic-job简介适用场景前置条件：需要ZooKeeper配合1、引入相关依赖2、application.yml中配置注册中心和作业调度巨坑（配置修改无效）3、job实例4、ElasticJob-UI监控平台（相当于管理端页面）参考文章：【1】SpringBoot整合分布式任务调度Elastic-Job【2】Ela
分布式作业: Elastic-Job 赤橙红的黄 Spring 分布式
1.背景介绍Spring框架自带的定时任务scheduled如果部署多台机器时，同一个任务会执行多次，比如给用户计算收益定时任务，每天定时给用户计算收益，如果部署了多台，同一个用户将重复计算多次收益（业务错误），但如果只部署一台机器，无法保证高可用性，如果定时任务机器宕机，无法故障转移；Elastic-Job基于Zookeeper、Quartz开发的Java分布式定时任务解决方案。2.优点高可用性
分布式定时任务：Elastic-Job-Lite
Elastic-Job-Lite是一款由Apache开源的轻量级分布式任务调度框架，属于ShardingSphere生态体系的一部分。它专注于分布式任务调度，支持弹性伸缩、分片处理、高可用等特性，且不依赖中心化架构。一、基础（一）核心特性分布式协调通过ZooKeeper实现作业的分布式调度和协调，确保任务在集群环境中不重复、不遗漏地执行。分片机制支持将任务拆分为多个分片（Sharding）并行执行
【Java面试】RocketMQ的设计原理用心分享技术 Java面试题 java 面试 rocketmq
一、核心架构设计原因NameServer轻量级无状态问题：传统注册中心（如ZooKeeper）强一致性（CP）设计复杂，且在高并发场景下性能瓶颈明显。解决：NameServer采用无状态+最终一致性（AP），节点间不通信，仅通过Broker心跳（30s/次）更新路由，降低复杂度并提升吞吐量。容忍分钟级不一致（如Broker宕机需120s剔除），适合消息路由这种非强一致场景。Broker主从架构与文
基于 SASL/SCRAM 让 Kafka 实现动态授权认证 zlt2000 Java java springboot kafka
一、说明在大数据处理和分析中ApacheKafka已经成为了一个核心组件。然而在生产环境中部署Kafka时，安全性是一个必须要考虑的重要因素。SASL（简单认证与安全层）和SCRAM（基于密码的认证机制的盐化挑战响应认证机制）提供了一种方法来增强Kafka集群的安全性。本文将从零开始部署ZooKeeper和Kafka并通过配置SASL/SCRAM和ACL（访问控制列表）来增强Kafka的安全性。二
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二) 争取不加班！ hadoop hbase zookeeper 大数据运维
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
Nacos与Eureka、ZooKeeper的区别？ leijmdas java
Nacos、Eureka和ZooKeeper是分布式系统中常用的服务注册与发现组件，但它们在功能定位、一致性模型、性能特性及适用场景上存在显著差异。以下从核心维度进行对比分析：一、功能定位对比特性NacosEurekaZooKeeper核心功能服务注册发现+动态配置管理仅服务注册发现分布式协调（含服务发现）健康检查多模式（心跳+服务端主动探测）仅客户端心跳临时节点会话机制管理界面功能丰富，支持配置
JT808教程：设置/查询终端参数
REDISANT提供互联网与物联网开发测试套件#互联网与中间件：RedisAssistantZooKeeperAssistantKafkaAssistantRocketMQAssistantRabbitMQAssistantPulsarAssistantHBaseAssistantNoSqlAssistantEtcdAssistantGarnetAssistant工业与物联网：MQTTAssist
深入了解大数据领域Zookeeper的ACL权限管理 AGI大模型与大数据研究院大数据 zookeeper wpf ai
深入了解大数据领域Zookeeper的ACL权限管理关键词：Zookeeper、ACL权限管理、大数据安全、分布式系统、访问控制、权限模型、数据保护摘要：本文深入探讨了Zookeeper中的ACL(AccessControlList)权限管理系统。作为分布式协调服务的核心组件，Zookeeper的ACL机制对于保障大数据环境中的数据安全至关重要。文章将从基础概念出发，详细解析ZookeeperAC
Dubbo与Zookeeper核心解析 Java开发廖志伟 Java场景面试宝典 Dubbo Service Discovery Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
.net基于数据库实现分布式锁
.NET基于数据库实现分布式锁全解析前言在分布式系统中，分布式锁是保证数据一致性和避免并发问题的重要手段。在.NET环境下，除了使用Redis、Zookeeper等专业工具实现分布式锁，我们还可以基于数据库来实现。本文将深入探讨如何在.NET中利用数据库实现分布式锁，并分析其优缺点和注意事项。实现思路基于数据库实现分布式锁的核心思路是利用数据库的事务和唯一性约束。我们可以创建一个专门的表来存储锁的
Zookeeper集群永旗狍子 Linux java zookeeper 分布式
目录Zookeeper集群架构图Zookeeper集群中节点的角色Zookeeper数据同步Zookeeper选举搭建Zookeeper集群Java连接Zookeeper集群Zookeeper集群架构图Zookeeper集群中节点的角色Leader(Master)：事务请求的唯一处理者，也可以处理读请求。Follower(Slave)：可以直接处理客户端的读请求，并向客户端响应；但其不会处理事务请
ZooKeeper深度面试指南二搬砖的小熊猫 zookeeper 面试分布式
一、Chroot特性：多租户隔离的命名空间功能原理Chroot（ChangeRoot）是ZooKeeper3.2.0引入的关键特性，允许客户端将操作限制在指定子树下。客户端连接时通过路径后缀（如127.0.0.1:2181/app1）设置命名空间，所有操作（如创建节点/config）实际映射为/app1/config，实现物理集群内的逻辑隔离。应用场景多应用共享集群：不同业务（支付/订单）共用Zo
zookeeper Curator(5):集群架构和集群搭建后会无期77 zookeeper Curator zookeeper 架构分布式
文章目录一、集群架构：Leader-Follower模式二、核心机制：ZAB协议三、Leader选举机制四、集群部署要点五、优势与挑战Zookeeper集群是一个由多个Zookeeper服务实例组成的分布式协调服务系统，通过奇数个节点（通常3、5、7个）的协作，提供高可用性、容错性和数据一致性，适用于分布式环境下的配置管理、命名服务、分布式锁等场景。以下从架构、核心机制、选举机制、数据模型、应用场
ZooKeeper的使用和基于Curator的JavaAPI操作 Ruined_ofJoker java-zookeeper zookeeper 数据库
Docker下使用ZooKeeper在/usr/local/zookeeper目录下保存ZooKeeper数据与数据卷卷cd/usr/local&&mkdirzookeeper&&cdzookeepermkdirdata开始部署部署命令dockerrun-d-eTZ="Asia/Shanghai"-p2181:2181-v$PWD/data:/data--namezookeeper--restar
zookeeper总是重启失败千百元工具 zookeeper linux 分布式
为什么只有kill-910422后，才能把zookeeper重启成功？问题分析根据你提供的信息，Zookeeper服务在启动时失败，并且只有在使用kill-910422命令终止某个进程（PID为10422）后，才能成功重启Zookeeper。这通常表明PID为10422的进程占用了Zookeeper所需的资源（如端口、文件句柄等），导致Zookeeper无法正常启动。进程10422占用资源原因：端
头歌 ZooKeeper之分布式环境搭建（新）敲代码的苦13 头歌分布式 zookeeper 云原生
任务描述本关任务：了解ZooKeeper，掌握ZooKeeper分布式安装。相关知识为了完成本关任务，你需要掌握：1.ZooKeeper分布式安装配置ZooKeeper介绍standlone模式运行ZooKeeper，便于评估，开发，测试和学习。但是在实际生产中，使用ZooKeeper均以仲裁模式（quorummode）运行，quorummode具有一组ZooKeeper服务器，这一组服务器同时服
深入理解Dubbo与Zookeeper在Java分布式架构中的应用 Aurora曙光
本文还有配套的精品资源，点击获取简介：本文详细解析了Dubbo与Zookeeper在分布式系统构建中的应用，包括如何通过这两个工具实现服务注册、发现、负载均衡和容错处理等核心功能，以及如何将它们集成以提高系统灵活性和可扩展性。文章还提供了使用Dubbo与Zookeeper的实例文档和项目代码，帮助开发者深入理解这两项技术。1.Dubbo与Zookeeper在分布式系统中的应用1.1分布式系统简介与
Dubbo与Zookeeper技术解析 AIHacksCash Java场景面试宝典 Dubbo Microservices Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
互联网大数据求职面试：从Zookeeper到Flink的技术探讨
场景：互联网大数据求职面试在一个阳光明媚的下午，小白来到了知名互联网公司，准备接受他人生中最重要的一次面试。他的面试官是以严肃和专业著称的老黑。第一轮提问：分布式系统与协调老黑：小白，你能解释一下Zookeeper在分布式系统中的作用吗？小白：哦，这个简单，Zookeeper是一个分布式协调服务，主要用来解决分布式系统中数据一致性问题，比如选主、配置管理和命名服务。老黑：不错，那你知道Yarn是如
揭秘互联网大数据求职面试：从Zookeeper到数据挖掘小葛呀大数据面试宝典互联网大数据 Zookeeper Yarn Redis Kafka HDFS
场景：互联网大数据求职者面试角色介绍：面试官老黑:严肃而专业，技术深入，擅长引导候选人展示自己。程序员小白:搞笑且略显紧张，对基础问题能应付自如，但面对复杂问题时经常词穷。第一轮提问：老黑:"小白，你对Zookeeper的理解是什么？它在分布式系统中扮演什么角色？"小白:"Zookeeper...是个协调者，负责管理配置和同步数据...就像一个团队的协调员，确保每个节点都知道该做什么。"老黑:"没
在大数据求职面试中如何回答分布式协调与数据挖掘问题
在大数据求职面试中如何回答分布式协调与数据挖掘问题场景：小白的大数据求职面试小白是一名初出茅庐的程序员，今天他来到一家知名互联网公司的面试现场，面试官是经验丰富的老黑。以下是他们之间的对话：第一轮提问：分布式与数据采集老黑：小白，你对Zookeeper有了解吗？小白：当然，Zookeeper是一个分布式协调服务，主要用于分布式应用程序中的同步服务、命名服务和配置管理。老黑：不错，你能说说Flume
使用Java语言实现基于Zookeeper实现分布式锁夜影风微服务架构 Java应用分布式 java-zookeeper java
前期，我们介绍了什么是分布式锁及分布式锁应用场景，并分享了基于Redis方案实现的分布式锁，今天我们基于Zookeeper方案来实现分布式锁的应用。一.方案概述1.1.实现原理：临时顺序节点：每个客户端请求锁时，在ZooKeeper的指定节点下创建一个临时顺序节点。锁竞争机制：客户端创建节点后，获取所有子节点列表并排序如果自己创建的节点是序号最小的节点，则获得锁否则，监听前一个节点的删除事件，进入
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc