挖坑埋你

什么？Zookeeper | 典型应用场景

　　ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。
　　值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利用其提供的一系列API接口（或者称为原语集），摸索出来的典型使用方法。因此，也非常欢迎读者分享你在ZK使用上的奇技淫巧。

ZooKeeper数据模型

Zookeeper 会维护一个具有层次关系的数据结构，它非常类似于一个标准的文件系统，如下图：

Zookeeper 这种数据结构有如下这些特点：

每个子目录项如 NameService 都被称作为 znode，这个 znode 是被它所在的路径唯一标识，如 Server1 这个 znode 的标识为 /NameService/Server1；
znode 可以有子节点目录，并且每个 znode 可以存储数据，注意 EPHEMERAL 类型的目录节点不能有子节点目录；
znode 是有版本的，每个 znode 中存储的数据可以有多个版本，也就是一个访问路径中可以存储多份数据；
znode 可以是临时节点，一旦创建这个 znode 的客户端与服务器失去联系，这个 znode 也将自动删除，Zookeeper 的客户端和服务器通信采用长连接方式，每个客户端和服务器通过心跳来保持连接，这个连接状态称为 session，如果 znode 是临时节点，这个 session 失效，znode 也就删除了；
znode 的目录名可以自动编号，如 App1 已经存在，再创建的话，将会自动命名为 App2；
znode 可以被监控，包括这个目录节点中存储的数据的修改，子节点目录的变化等，一旦变化可以通知设置监控的客户端，这个是 Zookeeper 的核心特性，Zookeeper 的很多功能都是基于这个特性实现的。

ZooKeeper的应用场景

Zookeeper 总体结构

Zookeeper 服务自身组成一个集群(2n+1个服务允许n个失效)。Zookeeper 服务有两个角色，一个是 leader，负责写服务和数据同步，剩下的是 follower，提供读服务，leader 失效后会在 follower 中重新选举新的 leader。Zookeeper 逻辑图如下：

ZooKeeper 的客户端-服务器架构

集群特性：

客户端可以连接到每个server，每个server的数据完全相同。
每个follower都和leader有连接，接受leader的数据更新操作。
Server记录事务日志和快照到持久存储。
大多数server可用，整体服务就可用。

Zookeeper特点：

顺序一致性：按照客户端发送请求的顺序更新数据。
原子性：更新要么成功，要么失败，不会出现部分更新。
单一性：无论客户端连接哪个server，都会看到同一个视图。
可靠性：一旦数据更新成功，将一直保持，直到新的更新。
及时性：客户端会在一个确定的时间内得到最新的数据。

Zookeeper运用场景：

下面分别介绍这些应用场景。

场景一：数据发布与订阅（配置中心）

典型场景描述（ZK特性，使用方法）

发布与订阅模型，即所谓的配置中心，顾名思义就是发布者将数据发布到ZK节点上，供订阅者动态获取数据，实现配置信息的集中式管理和动态更新。例如全局的配置信息，服务式服务框架的服务地址列表等就非常适合使用。

具体使用

1、应用中用到的一些配置信息放到ZK上进行集中管理

这类场景通常是这样：应用在启动的时候会主动来获取一次配置，同时，在节点上注册一个Watcher，这样一来，以后每次配置有更新的时候，都会实时通知到订阅的客户端，从来达到获取最新配置信息的目的。

2、分布式搜索服务

分布式搜索服务中，索引的元信息和服务器集群机器的节点状态存放在ZK的一些指定节点，供各个客户端订阅使用。

3、分布式日志收集系统

这个系统的核心工作是收集分布在不同机器的日志。收集器通常是按照应用来分配收集任务单元，因此需要在ZK上创建一个以应用名作为path的节点P，并将这个应用的所有机器ip，以子节点的形式注册到节点P上，这样一来就能够实现机器变动的时候，能够实时通知到收集器调整任务分配。

4、系统中有些信息需要动态获取

系统中有些信息需要动态获取，并且还会存在人工手动去修改这个信息的发问。通常是暴露出接口，例如JMX接口，来获取一些运行时的信息。引入ZK之后，就不用自己实现一套方案了，只要将这些信息存放到指定的ZK节点上即可。

注意：在上面提到的应用场景中，有个默认前提是：数据量很小，但是数据更新可能会比较快的场景。

应用举例

例如：同一个应用系统需要多台 PC Server 运行，但是它们运行的应用系统的某些配置项是相同的，如果要修改这些相同的配置项，那么就必须同时修改每台运行这个应用系统的 PC Server，这样非常麻烦而且容易出错。将配置信息保存在 Zookeeper 的某个目录节点中，然后将所有需要修改的应用机器监控配置信息的状态，一旦配置信息发生变化，每台应用机器就会收到 Zookeeper 的通知，然后从 Zookeeper 获取新的配置信息应用到系统中。ZooKeeper配置管理服务如下图所示：

配置管理结构图

Zookeeper 很容易实现这种集中式的配置管理，比如将所需要的配置信息放到 /Configuration 节点上，集群中所有机器一启动就会通过Client对 /Configuration 这个节点进行监控【zk.exist("/Configuration″,true)】，并且实现 Watcher 回调方法process()，那么在 zookeeper 上 /Configuration 节点下数据发生变化的时候，每个机器都会收到通知，Watcher 回调方法将会被执行，那么应用再取下数据即可【zk.getData("/Configuration″,false,null)】。

场景二：负载均衡

典型场景描述（ZK特性，使用方法）

这里说的负载均衡是指软负载均衡。在分布式环境中，为了保证高可用性，通常同一个应用或同一个服务的提供方都会部署多份，达到对等服务。而消费者就须要在这些对等的服务器中选择一个来执行相关的业务逻辑，其中比较典型的是消息中间件中的生产者，消费者负载均衡。

具体使用

消息中间件中发布者和订阅者的负载均衡。linkedin开源的 KafkaMQ 和阿里开源的 metaq 都是通过 zookeeper 来做到生产者、消费者的负载均衡。这里以 metaq 为例如讲下：

生产者负载均衡

metaq 发送消息的时候，生产者在发送消息的时候必须选择一台 broker上的一个分区来发送消息，因此 metaq 在运行过程中，会把所有 broker 和对应的分区信息全部注册到 ZK 指定节点上，默认的策略是一个依次轮询的过程，生产者在通过 ZK 获取分区列表之后，会按照 brokerId 和 partition 的顺序排列组织成一个有序的分区列表，发送的时候按照从头到尾循环往复的方式选择一个分区来发送消息。

消费负载均衡

在消费过程中，一个消费者会消费一个或多个分区中的消息，但是一个分区只会由一个消费者来消费。MetaQ 的消费策略是：

每个分区针对同一个 group 只挂载一个消费者；
如果同一个 group 的消费者数目大于分区数目，则多出来的消费者将不参与消费；
如果同一个 group 的消费者数目小于分区数目，则有部分消费者需要额外承担消费任务。

在某个消费者故障或者重启等情况下，其他消费者会感知到这一变化（通过 zookeeper watch 消费者列表），然后重新进行负载均衡，保证所有的分区都有消费者进行消费。

场景三：统一命名服务(Naming Service)

典型场景描述（ZK特性，使用方法）

分布式应用中，通常需要有一套完整的命名规则，既能够产生唯一的名称又便于人识别和记住，通常情况下用树形的名称结构是一个理想的选择，树形的名称结构是一个有层次的目录结构，既对人友好又不会重复。说到这里你可能想到了 JNDI，没错 Zookeeper 的 Name Service 与 JNDI 能够完成的功能是差不多的，它们都是将有层次的目录结构关联到一定资源上，但是 Zookeeper 的 Name Service 更加是广泛意义上的关联，也许你并不需要将名称关联到特定资源上，你可能只需要一个不会重复名称，就像数据库中产生一个唯一的数字主键一样。

具体使用

在分布式系统中，通过使用命名服务，客户端应用能够根据指定的名字来获取资源服务的地址，提供者等信息。被命名的实体通常可以是集群中的机器，提供的服务地址，进程对象等等，这些我们都可以统称他们为名字（Name）。其中较为常见的就是一些分布式服务框架中的服务地址列表。通过调用ZK提供的创建节点的API，能够很容易创建一个全局唯一的path，这个path就可以作为一个名称。Name Service 已经是Zookeeper 内置的功能，你只要调用 Zookeeper 的 API 就能实现。如调用 create 接口就可以很容易创建一个目录节点。

应用举例

阿里巴巴集团开源的分布式服务框架 Dubbo 中使用 ZooKeeper 来作为其命名服务，维护全局的服务地址列表，点击这里查看Dubbo开源项目。在Dubbo实现中：

　　服务提供者在启动的时候，向 ZK 上的指定节点/dubbo/${serviceName}/providers目录下写入自己的URL地址，这个操作就完成了服务的发布。服务消费者启动的时候，订阅/dubbo/${serviceName}/providers目录下的提供者URL地址，并向/dubbo/${serviceName} /consumers目录下写入自己的URL地址。

注意，所有向 ZK 上注册的地址都是临时节点，这样就能够保证服务提供者和消费者能够自动感应资源的变化。

另外，Dubbo还有针对服务粒度的监控，方法是订阅/dubbo/${serviceName}目录下所有提供者和消费者的信息。

场景四：分布式通知/协调（Distribution of notification/coordination）

典型场景描述（ZK特性，使用方法）

ZooKeeper中特有watcher注册与异步通知机制，能够很好的实现分布式环境下不同系统之间的通知与协调，实现对数据变更的实时处理。使用方法通常是不同系统都对 ZK 上同一个 znode 进行注册，监听 znode 的变化（包括 znode 本身内容及子节点的），其中一个系统 update 了 znode，那么另一个系统能够收到通知，并作出相应处理

具体使用

1、另一种心跳检测机制

检测系统和被检测系统之间并不直接关联起来，而是通过zk上某个节点关联，大大减少系统耦合。

2、另一种系统调度模式

某系统有控制台和推送系统两部分组成，控制台的职责是控制推送系统进行相应的推送工作。管理人员在控制台作的一些操作，实际上是修改了ZK上某些节点的状态，而ZK就把这些变化通知给他们注册Watcher的客户端，即推送系统，于是，作出相应的推送任务。

3、另一种工作汇报模式

一些类似于任务分发系统，子任务启动后，到 zk 来注册一个临时节点，并且定时将自己的进度进行汇报（将进度写回这个临时节点），这样任务管理者就能够实时知道任务进度。

总之，使用 zookeeper 来进行分布式通知和协调能够大大降低系统之间的耦合。

场景五：集群管理与Master选举

典型场景描述（ZK特性，使用方法）

1、集群机器监控

这通常用于那种对集群中机器状态，机器在线率有较高要求的场景，能够快速对集群中机器变化作出响应。这样的场景中，往往有一个监控系统，实时检测集群机器是否存活。过去的做法通常是：监控系统通过某种手段（比如ping）定时检测每个机器，或者每个机器自己定时向监控系统汇报“我还活着”。这种做法可行，但是存在两个比较明显的问题：

集群中机器有变动的时候，牵连修改的东西比较多；
有一定的延时。

利用ZooKeeper的两个特性，就可以实施另一种集群机器存活性监控系统：

客户端在节点 x 上注册一个Watcher，那么如果 x 的子节点变化了，会通知该客户端；
创建EPHEMERAL类型的节点，一旦客户端和服务器的会话结束或过期，那么该节点就会消失。

例如，监控系统在 /clusterServers 节点上注册一个Watcher，以后每动态加机器，那么就往 /clusterServers 下创建一个 EPHEMERAL 类型的节点：/clusterServers/{hostname}。这样，监控系统就能够实时知道机器的增减情况，至于后续处理就是监控系统的业务了。

2、Master 选举则是 zookeeper 中最为经典的应用场景了

在分布式环境中，相同的业务应用分布在不同的机器上，有些业务逻辑（例如一些耗时的计算，网络I/O处理），往往只需要让整个集群中的某一台机器进行执行，其余机器可以共享这个结果，这样可以大大减少重复劳动，提高性能，于是这个 master 选举便是这种场景下的碰到的主要问题。

利用ZooKeeper中两个特性，就可以实施另一种集群中Master选举：

利用ZooKeeper的强一致性，能够保证在分布式高并发情况下节点创建的全局唯一性，即：同时有多个客户端请求创建 /currentMaster 节点，最终一定只有一个客户端请求能够创建成功。利用这个特性，就能很轻易的在分布式环境中进行集群选取了。
另外，这种场景演化一下，就是动态 Master 选举。这就要用到 EPHEMERAL_SEQUENTIAL 类型节点的特性了。

上文中提到，所有客户端创建请求，最终只有一个能够创建成功。在这里稍微变化下，就是允许所有请求都能够创建成功，但是得有个创建顺序，于是所有的请求最终在 ZK 上创建结果的一种可能情况是这样：/currentMaster/{sessionId}-1 ,/currentMaster/{sessionId}-2 ,/currentMaster/{sessionId}-3 ….. 每次选取序列号最小的那个机器作为 Master，如果这个机器挂了，由于他创建的节点会马上消失，那么之后最小的那个机器就是 Master 了。

应用举例

1、集群监控

应用集群中，我们常常需要让每一个机器知道集群中或依赖的其他某一个集群中哪些机器是活着的，并且在集群机器因为宕机，网络断链等原因能够不在人工介入的情况下迅速通知到每一个机器，Zookeeper 能够很容易的实现集群管理的功能，如有多台 Server 组成一个服务集群，那么必须要一个”总管”知道当前集群中每台机器的服务状态，一旦有机器不能提供服务，集群中其它集群必须知道，从而做出调整重新分配服务策略。同样当增加集群的服务能力时，就会增加一台或多台 Server，同样也必须让”总管”知道，这就是ZooKeeper的集群监控功能。

比如我在zookeeper服务器端有一个znode叫/Configuration，那么集群中每一个机器启动的时候都去这个节点下创建一个EPHEMERAL类型的节点，比如server1创建/Configuration /Server1，server2创建/Configuration /Server2，然后Server1和Server2都watch /Configuration 这个父节点，那么也就是这个父节点下数据或者子节点变化都会通知对该节点进行watch的客户端。因为EPHEMERAL类型节点有一个很重要的特性，就是客户端和服务器端连接断掉或者session过期就会使节点消失，那么在某一个机器挂掉或者断链的时候，其对应的节点就会消失，然后集群中所有对/Configuration进行watch的客户端都会收到通知，然后取得最新列表即可。

2、Master选举

Zookeeper 不仅能够维护当前的集群中机器的服务状态，而且能够选出一个”总管”，让这个总管来管理集群，这就是 Zookeeper 的另一个功能 Leader Election。Zookeeper 如何实现 Leader Election，也就是选出一个 Master Server。和前面的一样每台 Server 创建一个 EPHEMERAL 目录节点，不同的是它还是一个 SEQUENTIAL 目录节点，所以它是个 EPHEMERAL_SEQUENTIAL 目录节点。之所以它是 EPHEMERAL_SEQUENTIAL 目录节点，是因为我们可以给每台 Server 编号，我们可以选择当前是最小编号的 Server 为 Master，假如这个最小编号的 Server 死去，由于是 EPHEMERAL 节点，死去的 Server 对应的节点也被删除，所以当前的节点列表中又出现一个最小编号的节点，我们就选择这个节点为当前 Master。这样就实现了动态选择 Master，避免了传统意义上单 Master 容易出现单点故障的问题。

具体使用

1、搜索系统

在搜索系统中，如果集群中每个机器都生成一份全量索引，不仅耗时，而且不能保证彼此之间索引数据一致。因此让集群中的Master来进行全量索引的生成，然后同步到集群中其它机器。另外，Master选举的容灾措施是，可以随时进行手动指定master，就是说应用在zk无法获取master信息时，可以通过比如http方式，向一个地方获取master。

2、Hbase

在Hbase中，也是使用ZooKeeper来实现动态HMaster的选举。在 Hbase 实现中，会在 ZK 上存储一些 ROOT 表的地址和 HMaster 的地址，HRegionServer 也会把自己以临时节点（Ephemeral）的方式注册到 Zookeeper 中，使得 HMaster 可以随时感知到各个 HRegionServer 的存活状态，同时，一旦 HMaster 出现问题，会重新选举出一个 HMaster 来运行，从而避免了 HMaster 的单点问题。

场景六：分布式锁（Distribute Lock）

典型场景描述（ZK特性，使用方法）

分布式锁，这个主要得益于 ZooKeeper 为我们保证了数据的强一致性，即用户只要完全相信每时每刻，zk集群中任意节点（一个zk server）上的相同znode的数据是一定是相同的。锁服务可以分为两类，一个是保持独占，另一个是控制时序。

1、保持独占

所谓保持独占，就是所有试图来获取这个锁的客户端，最终只有一个可以成功获得这把锁。通常的做法是把 zk 上的一个 znode 看作是一把锁，通过create znode的方式来实现。所有客户端都去创建 /distribute_lock 节点，最终成功创建的那个客户端也即拥有了这把锁。

2、控制时序

控制时序，就是所有试图来获取这个锁的客户端，最终都是会被安排执行，只是有个全局时序了。做法和上面基本类似，只是这里 /distribute_lock 已经预先存在，客户端在它下面创建临时有序节点（这个可以通过节点的属性控制：CreateMode.EPHEMERAL_SEQUENTIAL来指定）。Zk 的父节点（/distribute_lock）维持一份sequence，保证子节点创建的时序性，从而也形成了每个客户端的全局时序。

应用举例

共享锁在同一个进程中很容易实现，但是在跨进程或者在不同 Server 之间就不好实现了。Zookeeper 却很容易实现这个功能，实现方式也是需要获得锁的 Server 创建一个 EPHEMERAL_SEQUENTIAL 目录节点，然后调用 getChildren 方法获取当前的目录节点列表中最小的目录节点是不是就是自己创建的目录节点，如果正是自己创建的，那么它就获得了这个锁，如果不是那么它就调用 exists(String path, boolean watch) 方法并监控 Zookeeper 上目录节点列表的变化，一直到自己创建的节点是列表中最小编号的目录节点，从而获得锁，释放锁很简单，只要删除前面它自己所创建的目录节点就行了。

场景七：分布式队列

典型场景描述（ZK特性，使用方法）

Zookeeper 可以处理两种类型的队列：

当一个队列的成员都聚齐时，这个队列才可用，否则一直等待所有成员到达，这种是同步队列。
队列按照 FIFO 方式进行入队和出队操作，例如实现生产者和消费者模型。

同步队列用 Zookeeper 实现的实现思路如下：

创建一个父目录 /synchronizing，每个成员都监控（Set Watch）标志位目录 /synchronizing/start 是否存在，然后每个成员都加入这个队列，加入队列的方式就是创建 /synchronizing/member_i 的临时目录节点，然后每个成员获取 /synchronizing 目录的所有目录节点，也就是 member_i。判断 i 的值是否已经是成员的个数，如果小于成员个数等待 /synchronizing/start 的出现，如果已经相等就创建 /synchronizing/start。

用下面的流程图更容易理解：

FIFO 队列用 Zookeeper 实现思路如下：

实现的思路也非常简单，就是在特定的目录下创建 SEQUENTIAL 类型的子目录 /queue_i，这样就能保证所有成员加入队列时都是有编号的，出队列时通过 getChildren( ) 方法可以返回当前所有的队列中的元素，然后消费其中最小的一个，这样就能保证 FIFO。

ZooKeeper 实际应用

假设我们的集群有：

20个搜索引擎的服务器：每个负责总索引中的一部分的搜索任务。
1. 搜索引擎的服务器中的15个服务器现在提供搜索服务。
2. 5个服务器正在生成索引。
一个总服务器：负责向这20个搜索引擎的服务器发出搜索请求并合并结果集。
一个备用的总服务器：负责当总服务器宕机时替换总服务器。
一个web的cgi：向总服务器发出搜索请求。

使用Zookeeper可以保证：

总服务器：自动感知有多少提供搜索引擎的服务器，并向这些服务器发出搜索请求。
备用的总服务器：宕机时自动启用备用的总服务器。
web的cgi：能够自动地获知总服务器的网络地址变化。

实现如下：

提供搜索引擎的服务器都在 Zookeeper 中创建 znode，zk.create("/search/nodes/node1", "hostname".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateFlags.EPHEMERAL);
总服务器可以从 Zookeeper 中获取一个 znode 的子节点的列表，zk.getChildren("/search/nodes", true);
总服务器遍历这些子节点，并获取子节点的数据生成提供搜索引擎的服务器列表；
当总服务器接收到子节点改变的事件信息，重新返回第二步；
总服务器在 Zookeeper 中创建节点，zk.create("/search/master", "hostname".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateFlags.EPHEMERAL);
备用的总服务器监控Zookeeper中的 “/search/master” 节点。当这个 znode 的节点数据改变时，把自己启动变成总服务器，并把自己的网络地址数据放进这个节点。
web 的 cgi 从 Zookeeper 中”/search/master”节点获取总服务器的网络地址数据，并向其发送搜索请求。
web 的 cgi 监控 Zookeeper 中的”/search/master”节点，当这个 znode 的节点数据改变时，从这个节点获取总服务器的网络地址数据,并改变当前的总服务器的网络地址。

这20个搜索引擎的服务器，经常要让正在提供搜索服务的服务器停止提供服务开始生成索引，或生成索引的服务器已经把索引生成完成可以搜索提供服务了。

你可能感兴趣的:(Zookeeper,Zookeeper,分布式,分布式锁,分布式队列,配置中心)

常用的分布式 ID 设计方案梦城忆分布式
文章目录1.UUID2.数据库自增ID3.雪花算法4.Redis生成ID5.美团Leaf1.UUID原理：UUID是由数字和字母组成的128位标识符，通过特定算法随机生成，包括时间戳、计算机网卡地址等信息。常见的版本有版本1（基于时间戳和MAC地址）、版本4（纯随机数）等。优点：生成简单，本地生成，不需要依赖额外的组件或服务，能有效减少网络开销。全球唯一，基本能保证在任何场景下不会重复。缺点：长度
浅谈常用的分布式ID的设计方案以及Snowfake是否受冬令时切换影响 24K不怕分布式分布式ID Snowfake
浅谈常用的分布式ID的设计方案以及Snowfake是否受冬令时切换影响分布式ID定义典型实现方案基于数据库自增序列的实现UUID方案Redis方案Snowflake方案Snowfake是否受冬令时切换影响分布式ID定义全局唯一：区别于单点系统的唯一，全局是要求分布式系统内唯一。有序性：通常都要保证生成的ID是有序递增的。例如，在数据库存储场景中，有序ID便于确定数据位置，往往更加高效。典型实现方案
幂等性设计原则：如何保证服务中任务不重复执行？小小小小关同学项目相关 oracle 数据库
当你疯狂点击“购买”按钮，却发现自己下了5个相同订单；或者因为服务器延迟，你的支付重复进行了好几次……是不是一不小心就可能亏大了？别怕，咱们今天就来聊聊如何用幂等性策略，让你在分布式系统或高并发场景下，稳稳地“只执行一次”！1.什么是幂等性幂等性（Idempotency）是指一个操作无论执行多少次，产生的结果都是相同的，即多次执行不会对系统状态造成额外影响。数学定义：幂等操作满足：f(f(x))=
Flume-HBase-Kafka 正在緩沖҉99% kafka Flume HBase 大数据
Flume-HBase-Kafka一、各自介绍1.Flume简介和特征2.HBase简介和特征3.Kafka简介和特征二、通过Flume读取日志文件写入到Kafka中在写入HBase各自作用一、各自介绍1.Flume简介和特征一、简介Flume是一个分布式、可靠、和高可用的海量日志聚合的系统，支持在系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方
分布式网络 Hard_pea 分布式
分布式网络（DistributedNetwork）指的是一种计算机网络架构，其中计算资源（计算、存储、数据处理等）分布在多个物理或逻辑上的节点上，而不是集中在单一的服务器或数据中心中。这种架构的主要目标是提高系统的可靠性、可扩展性和性能。1.分布式网络的特点✅去中心化（Decentralization）传统的集中式网络（如单台服务器）会有单点故障（SPOF，SinglePointofFailure
大数据环境（单机版） Flume传输数据到Kafka 凡许真大数据 flume kafka 数据采集
文章目录前言一、准备二、安装三、配置环境变量四、修改配置4.1、kafka配置4.2、Flume配置五、启动程序5.1、启动zk5.2、启动kafka5.3、启动flume六、测试6.1、启动一个kafka终端，用来消费消息6.2、写入日志其他前言flume监控指定目录，传输数据到kafka一、准备flume-1.10.1kafka_2.11-2.4.1zookeeper-3.4.13二、安装使用
大模型的实践应用30-大模型训练和推理中分布式核心技术的应用微学AI 大模型的实践应用分布式人工智能大模型
大家好，我是微学AI，今天给大家介绍一下大模型的实践应用30-大模型训练和推理中分布式核心技术的应用。本文深入探讨了大模型训练和推理中分布式核心技术的应用。首先介绍了项目背景，阐述了大模型发展对高效技术的需求。接着详细讲解了分布式技术的原理，包括数据并行、模型并行等。通过实际应用实例代码，展示了分布式技术在大模型训练和推理中的具体实现。最后展望了未来发展趋势，如更高的性能、更好的兼容性等。总之，本
Redis-分布式锁左灯右行的爱情 redis 分布式数据库
分布式锁为什么需要分布式锁核心场景举例技术原理简述项目中需要注意的优化和思考小结分布式锁的本质Redis分布式锁的实现原理?什么是Redlock算法工作流程实现Redis分布式锁的方式分布式锁实现的要点分布式锁完全可靠吗?如何安全地释放Redis分布式锁？为什么需要这样做？分布式锁如何解决锁过期问题？请设计一个可重入的分布式锁使用Redis实现一个分布式锁，包括获取锁和释放锁的逻辑为什么需要分布式
阿里云MaxCompute面试题汇总及参考答案大模型大数据攻城狮阿里云 odps 云计算机器学习大数据面试大数据面经增量数据
目录简述MaxCompute的核心功能及适用场景，与传统数据仓库的区别解释MaxCompute分层架构设计原则，与传统数仓分层有何异同MaxCompute的存储架构如何实现高可用与扩展性解析伏羲（Fuxi）分布式调度系统工作原理盘古（Pangu）分布式存储系统数据分片策略计算与存储分离架构的资源弹性扩展方案解释MaxCompute多租户资源隔离实现机制容错机制设计：Worker节点故障时的数据恢复
nacos架构图三希数据库
架构图整体架构分为用户层、业务层、内核层和插件，用户层主要解决用户使用的易用性问题，业务层主要解决服务发现和配置管理的功能问题，内核层解决分布式系统一致性、存储、高可用等核心问题，插件解决扩展性问题。用户层OpenAPI：暴露标准Rest风格HTTP接口，简单易用，方便多语言集成Console：易用控制台，做服务管理、配置管理等操作SDK：多语言SDK，目前几乎支持所有主流编程语言Agent：Si
基于HarmonyNext的跨设备分布式数据库开发实战指南 harmonyos-next
基于HarmonyNext的跨设备分布式数据库开发实战指南引言在HarmonyNext生态系统中，跨设备分布式数据库是一个极具挑战性和创新性的领域。随着数据量的爆炸式增长和跨设备协作需求的增加，如何高效地管理和访问分布式数据成为了开发者面临的挑战。本指南将深入探讨如何利用HarmonyNext的分布式能力，结合ArkTS语言，开发一个高性能的跨设备分布式数据库。我们将通过一个实际的案例，详细讲解如
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发引言在HarmonyNext生态系统中，分布式任务调度是一个关键且复杂的领域。本文将深入探讨如何使用ArkTS语言开发一个高效的分布式任务调度系统，涵盖从任务分配到负载均衡的完整流程。我们将通过一个实战案例，详细讲解如何利用HarmonyNext的分布式能力，结合ArkTS的现代语法，构建一个高效、可靠的分布式任务调度系统。1.项目
HarmonyNext实战：基于ArkTS的分布式实时日志分析系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式实时日志分析系统开发引言在HarmonyNext生态系统中，日志分析是保障系统稳定性和性能优化的重要手段。本文将深入探讨如何使用ArkTS语言开发一个分布式实时日志分析系统，重点介绍日志的收集、过滤、聚合以及可视化等核心功能的实现。我们将通过一个完整的实战案例，展示如何利用HarmonyNext的分布式能力和ArkTS的高效性能，构建一个高效、稳定
HarmonyNext实战：基于ArkTS的高性能分布式数据同步应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能分布式数据同步应用开发引言在分布式系统中，数据同步是一个核心问题，尤其是在多设备协同的场景下，如何高效、可靠地实现数据同步是开发者面临的重大挑战。HarmonyNext作为华为最新的操作系统，提供了强大的分布式能力，支持多设备间的无缝协作。本文将深入探讨如何在HarmonyNext平台上使用ArkTS开发一个高性能的分布式数据同步应用，涵盖从基础理
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发引言在HarmonyNext生态系统中，分布式能力是其核心特性之一。本文将深入探讨如何使用ArkTS语言开发一个高效的分布式数据同步应用，涵盖从数据存储到跨设备同步的完整流程。我们将通过一个实战案例，详细讲解如何利用HarmonyNext的分布式能力，结合ArkTS的现代语法，构建一个高效、可靠的分布式数据同步应用。1.项目概述1.
Zookeeper（89）Zookeeper的线性化写入是如何实现的？辞暮尔尔-烟火年年微服务 zookeeper 分布式云原生
ZooKeeper的线性化写入（LinearizableWrites）是其保证数据一致性的重要特性之一。线性化写入确保所有的写操作在全局上是有序的，即每个写操作在所有参与者看来都是以相同的顺序发生的。这种一致性模型对于分布式系统的正确性至关重要。线性化写入的原理单一Leader：ZooKeeper通过选举机制确保在集群中只有一个Leader节点。所有的写请求都必须通过Leader进行处理。事务ID
分布式锁—4.Redisson的联锁和红锁一东阳马生架构分布式锁原理与源码分布式锁 Redission
大纲1.Redisson联锁MultiLock概述2.Redisson联锁MultiLock的加锁与释放锁3.Redisson红锁RedLock的算法原理4.Redisson红锁RedLock的源码分析1.Redisson联锁MultiLock概述(1)MultiLock的简介(2)MultiLock的使用(3)MultiLock的初始化(1)MultiLock的简介一.一次性要锁定多个资源的场景
hadoop 百里自来卷 hadoop 大数据分布式
Hadoop是一个用于分布式存储和处理大规模数据的开源框架，它的架构主要由以下几个核心组件组成：1.Hadoop生态系统核心组件Hadoop的核心架构主要包括HDFS（HadoopDistributedFileSystem）和YARN（YetAnotherResourceNegotiator），以及MapReduce计算框架：1.1HDFS（分布式文件系统）HDFS负责存储大规模数据，采用主从架构
深入检索：专业知识检索的高级算法与架构策略是小旭啊架构
在检索专业知识层需要涵盖更高级的检索技术，包括工程架构和算法策略。一、工程架构工程架构在构建检索系统中决定了系统的可扩展性、高可用性和性能。比如需要考虑的基本点：分布式架构：水平扩展：采用分布式架构，将检索任务分布到多个节点上，实现水平扩展。这可以通过将索引数据分片存储在不同的节点上，并使用分布式文件系统或对象存储来存储大规模的索引数据。任务分配：设计任务调度器，负责将查询请求分配到空闲的节点上进
RabbitMQ消息队列的10种应用场景喵小狸 java RabbitMq rabbitmq 分布式
消息队列（MQ）是分布式系统中不可或缺的技术之一。刚接触MQ时，可能觉得它只是个“传话工具”，但用着用着，你会发现它简直是系统的“润滑剂”。无论是解耦、削峰，还是异步任务处理，都离不开MQ的身影。下面我结合实际场景，从简单到复杂，逐一拆解MQ的10种经典使用方式，希望对你会有所帮助。1.异步处理：让系统轻松一点场景小伙伴们是不是经常遇到这样的情况：用户提交一个操作，比如下单，然后要发送短信通知。如
十一、Redis Sentinel（哨兵）—— 高可用架构与配置指南伯牙碎琴 #Redis redis sentinel 架构
RedisSentinel（哨兵）——高可用架构与配置指南在分布式应用中，Redis主从复制（Master-Slave）虽然能提供读写分离的能力，但它无法自动故障转移（failover）。如果主节点（Master）发生故障，系统管理员需要手动将某个从节点（Slave）提升为主节点，并重新配置所有从节点，这对于高可用性要求较高的系统来说是不够的。RedisSentinel（哨兵）是Redis官方提供
#嵌入式笔面经分享#科大讯飞公司嵌入式硬件面经（第1面） 2301_79125642 java
DNS是什么DNS（DomainNameSystem）是一种用于将域名转换为IP地址的分布式命名系统。它充当7.124'40一个组产出最7.124'40一个组产出最多的是组长，是管理，这个组不正常。出一个小学数学应用题：在OSI七层模型?OSI（OpenSystemsInterconnection）七层模型是一种网络协议体系结构，用我想问一下如果我的项目是开源项目怎么办鼠鼠四非硕士，学了几个rto
INA(In-Network Aggregation)技术一只积极向上的小咸鱼人工智能
In-NetworkAggregation（网络内聚合）是大模型分布式训练或推理中优化通信效率的一种技术，核心思想是在网络传输路径中直接完成数据聚合，而非依赖终端节点处理，从而降低通信开销、提升整体效率。核心原理在传统分布式训练中，计算节点（如GPU）需要将本地计算的梯度或中间结果发送到中心节点（如参数服务器）进行聚合，这会产生大量的网络传输。In-NetworkAggregation则是通过可编
Spring Cloud 和 Dubbo 区别
SpringCloud和Dubbo是两种主流的微服务框架，它们在设计理念、技术实现和应用场景上有显著差异。以下是两者的核心区别及各自的优缺点分析：一、核心区别1.初始定位与设计理念SpringCloud：定位为微服务架构的一站式解决方案，提供完整的分布式系统开发工具链（如服务注册、配置中心、网关、熔断器等），注重微服务治理的全面性。Dubbo：起源于SOA时代，核心关注服务调用与治理（如RPC通信
为什么使用 RocketMQ？ rocketmq消息中间件
RocketMQ与其他主流消息队列（如Kafka、RabbitMQ、ActiveMQ）的优缺点对比如下：一、RocketMQ的核心优势高吞吐与低延迟吞吐量：单机可达10万级消息/秒，介于Kafka（29万/秒）与RabbitMQ（2.6万/秒）之间。延迟：毫秒级响应，适用于实时性要求较高的在线业务（如交易系统）。适用场景：大规模分布式系统，日均处理百亿级消息，尤其适合金融交易、订单处理等高并发场景
git从本地其他设备上fetch分支绛洞花主敏明 Git git
在Git中，如果你想从本地其他设备上获取分支，可以通过以下几种方式实现。不过，需要注意的是，Git本身是分布式版本控制系统，通常我们是从远程仓库（如GitHub、GitLab等）拉取分支，而不是直接从本地其他设备上操作。但如果确实需要从本地其他设备上获取分支，可以通过以下方法：方法一：将本地仓库设置为远程仓库你可以将本地其他设备上的仓库设置为当前设备上的远程仓库，然后通过gitfetch操作来获取
@Schedule定时任务+分布式环境一些踩过的坑~ 架构文摘JGWZ 分布式学习后端
定时任务的实现方式多种多样，框架也是层出不穷。“本文所谈及的是SpringBoot本身所带有的@EnableScheduling、@Scheduled实现定时任务的方式。以及采用这种方式，在分布式调度中可能会出现的问题，又针对为什么会发生这种问题？又该如何解决，做出了一些叙述。为了适合每个阶段的读者，我把前面测试的代码都贴出来啦~确保每一步都是有迹可循的，希望大家不要嫌啰嗦，感谢一、搭建基本环境基
memcached的cache机制是怎样的？思维导图代码示例（java 架构) 用心去追梦 memcached java 架构
Memcached的缓存机制Memcached的缓存机制围绕着其作为高性能分布式内存对象缓存系统的核心功能展开。以下是关于Memcached缓存机制的主要方面：1.数据存储与检索键值对存储：所有数据都以键值对的形式存储，键是唯一的字符串标识符，值可以是任意类型的数据。SlabAllocator(分配器)：Memcached使用SlabAllocator来管理内存，它将内存分割成不同大小的“slab
干掉复杂代码！ Spring Boot + CQRS 黄金组合，太优雅了！程序员蜗牛g springboot spring boot java 数据库
微服务架构的兴起放大了CQRS的必要性。在分布式系统中，服务通常需要自治和高度解耦，CQRS提供了一条清晰的路径。每个微服务都可以采用CQRS模式，确保其处理命令和查询的内部机制从其他服务中抽象出来。这也与领域驱动设计（DDD）非常吻合，其中领域事件可以触发不同微服务中的命令。潜在的陷阱虽然CQRS提供了许多好处，但它也面临着挑战：复杂性增加：引入CQRS会增加开销，尤其是在读取和写入之间的区别不
深入了解构建分布式微服务架构的利器：Spring Cloud Alibaba 和光同尘·心止架构分布式微服务 springcloud
目录分布式微服务简介SpringCloudAlibaba简介核心组件Nacos组件Ribbon组件feign组件Sentinel组件seata组件gateway组件RabbitMQ组件组件安装步骤参考链接：阿里云官方文档：https://help.aliyun.com/阿里github官方文档：https://github.com/alibaba/SpringCloudAlibaba官方文档：ht
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那