will.tsang

Kafka集群架构设计原理详解

从 Zookeeper 数据理解 Kafka 集群工作机制

这一部分主要是理解 Kafka 的服务端重要原理。但是 Kafka 为了保证高吞吐，高性能，高可扩展的三高架构，很多具体设计都是相当复杂的。如果直接跳进去学习研究，很快就会晕头转向。所以，找一个简单清晰的主线就显得尤为重要。这一部分主要是从可见的存储数据的角度来理解Kafka 的 Broker 运行机制。这对于上一章节建立的简单模型，是一个很好的细节补充。

Kafka 依赖很多的存储数据，但是，总体上是有划分的。 Kafka 会将每个服务的不同之处，也就是状态信息，保存到Zookeeper 中。通过 Zookeeper 中的数据，指导每个 Kafka 进行与其他 Kafka 节点不同的业务逻辑。而将状态信息抽离后，剩下的数据，就可以直接存在Kafka 本地，所有 Kafka 服务都以相同的逻辑运行。这种状态信息分离的设计，让Kafka 有非常好的集群扩展性。

Kafka 的 Zookeeper 元数据梳理

1 、 zookeeper 整体数据

Kafka 将状态信息保存在 Zookeeper 中，这些状态信息记录了每个 Kafka 的 Broker 服务与另外的 Broker 服务有什么不同。通过这些差异化的功能，共同体现出集群化的业务能力。这些数据，需要在集群中各个Broker之间达成共识，因此，需要存储在一个所有集群都能共同访问的第三方存储中。

Kafka 在 Zookeeper 上管理了哪些数据呢？这个问题可以先回顾一下 Kafka 的整体集群状态结构，然后再去Zookeeper上验证。

Kafka 的整体集群结构如下图。其中红色字体标识出了重要的状态信息。

Kafka 的集群中，最为主要的状态信息有两个。一个是在多个 Broker 中，需要选举出一个 Broker ，担任Controller角色。由 Controller 角色来管理整个集群中的分区和副本状态。另一个是在同一个 Topic 下的多个Partition中，需要选举出一个 Leader 角色。由 Leader 角色的 Partition 来负责与客户端进行数据交互。

这些状态信息都被 Kafka 集群注册到了 Zookeeper 中。 Zookeeper 数据整体如下图：

对于 Kafka 往 Zookeeper 上注册的这些节点，大部分都是比较简明的。比如 /brokers/ids 下，会记录集群中的所有BrokerId ， /topics 目录下，会记录当前 Kafka 的 Topic 相关的 Partition 分区等信息。下面就从这些Zookeeper的基础数据开始，来逐步梳理 Kafka 的 Broker 端的重要流程。

例如集群中每个 Broker 启动后，都会往 Zookeeper 注册一个临时节点 /broker/ids/{BrokerId} 。可以做一个试验验证一下。如果启动了Zookeeper 和 Kafka 后，服务器非正常关机，这时 Zookeeper 上的这个临时节点就不会注销。下次重新启动Kafka 时，就有可能因为无法注册上这个临时节点而报错。

2 、 Controller Broker 选举机制

在 Kafka 集群进行工作之前，需要选举出一个 Broker 来担任 Controller 角色，负责整体管理集群内的分区和副本状态。选举Controller 的过程就是通过抢占 Zookeeper 的 /controller 节点来实现的。

当一个集群内的 Kafka 服务启动时，就会尝试往 Zookeeper 上创建一个 /controller 临时节点，并将自己的brokerid写入这个节点。节点的内容如下：

Zookeeper 会保证在一个集群中，只会有一个 broker 能够成功创建这个节点。这个注册成功的 broker 就成了集群当中的Controller 节点。

当一个应用在 Zookeeper 上创建了一个临时节点后， Zookeeper 需要这个应用一直保持连接状态。如果Zookeeper长时间检测不到应用的心跳信息，就会删除临时节点。同时， Zookeeper 还允许应用监听节点的状态，当应用状态有变化时，会向该节点对应的所有监听器广播节点变化事件。

这样，如果集群中的 Controller 节点服务宕机了， Zookeeper 就会删除 /controller 节点。而其他未注册成功的Broker 节点，就会感知到这一事件，然后开始竞争，再次创建临时节点。这就是 Kafka 基于 Zookeeper的Controller 选举机制。

选举产生的 Controller 节点，就会负责监听 Zookeeper 中的其他一些关键节点，触发集群的相关管理工作。例如：

· 监听 Zookeeper 中的 /brokers/ids 节点，感知 Broker 增减变化。

· 监听 /brokers/topics ，感知 topic 以及对应的 partition 的增减变化。

· 监听 /admin/delete_topic 节点，处理删除 topic 的动作。

另外， Controller 还需要负责将元数据推送给其他 Broker 。

3 、 Leader Partition 选举机制

在 Kafka 中，一个 Topic 下的所有消息，是分开存储在不同的 Partition 中的。在使用 kafka-topics.sh 脚本创建Topic 时，可以通过 --partitions 参数指定 Topic 下包含多少个 Partition ，还可以通过 --replication-factors 参数指定每个Partition 有几个备份。而在一个 Partition 的众多备份中，需要选举出一个 Leader Partition ，负责对接所有的客户端请求，并将消息优先保存，然后再通知其他Follower Partition 来同步消息。

在理解 Leader Partition 选举机制前，需要了解几个基础的概念：

· AR: Assigned Repllicas 。表示 Kafka 分区中的所有副本 ( 存活的和不存活的 )

· ISR: 表示在所有 AR 中，服务正常，保持与 Leader 同步的 Follower 集合。如果 Follower 长时间没有向Leader发送通信请求 ( 超时时间由 replica.lag.time.max.ms 参数设定，默认 30S) ，那么这个 Follower就会被提出ISR 中。 ( 在老版本的 Kafka 中，还会考虑 Partition 与 Leader Partition 之间同步的消息差值，大于参数replica.lag.max.messages 条就会被移除 ISR 。现在版本已经移除了这个参数。 )

· OSR ：表示从 ISR 中踢出的节点。记录的是那些服务有问题，延迟过多的副本。

其中， AR 和 ISR 比较关键，可以通过 kafka-topics.sh 的 --describe 指令查看。

这个结果中， AR 就是 Replicas 列中的 Broker 集合。而这个指令中的所有信息，其实都是被记录在

Zookeeper 中的。

接下来， Kafka 设计了一套非常简单高效的 Leader Partition 选举机制。 在选举 Leader Partition 时，会按 照 AR 中的排名顺序，靠前的优先选举。只要当前 Partition 在 ISR 列表中，也就是是存活的，那么这个节点就 会被选举成为 Leader Partition 。

例如，我们可以设计一个实验来验证一下 LeaderPartiton 的选举过程。

从实验中可以看到，当 BrokerId=2 的 kafka 服务停止后， 2 号 BrokerId 就从所有 Partiton 的 ISR 列表中剔除了。然后，Partition2 的 Leader 节点原本是 Broker2 ，当 Broker2 的 Kafka 服务停止后，都重新进行了 Leader选举。Parition2 预先评估的是 Replicas 列表中 Broker2 后面的 Broker1 ， Broker1 在 ISR 列表中，所以他被最终选举成为Leader 。

当 Partiton 选举完成后， Zookeeper 中的信息也被及时更新了。

Leader Partitoin 选举机制能够保证每一个 Partition 同一时刻有且仅有一个 Leader Partition 。 但是，是不 是只要分配好了 Leader Partition 就够了呢？

4 、 Leader Partition 自动平衡机制

在一组 Partiton 中， Leader Partition 通常是比较繁忙的节点，因为他要负责与客户端的数据交互，以及向Follower同步数据。默认情况下， Kafka 会尽量将 Leader Partition 分配到不同的 Broker 节点上 ，用以保证整个集群的性能压力能够比较平均。

但是，经过 Leader Partition 选举后，这种平衡就有可能会被打破，让 Leader Partition 过多的集中到同一个Broker 上。这样，这个 Broker 的压力就会明显高于其他 Broker ，从而影响到集群的整体性能。

为此， Kafka 设计了 Leader Partition 自动平衡机制，当发现 Leader 分配不均衡时，自动进行 Leader

Partition 调整。

Kafka在进行 Leader Partition 自平衡时的逻辑是这样的：他 会认为 AR 当中的第一个节点就应该是 Leader 节点。这种选举结果成为 preferred election 理想选举结果 。 Controller 会定期检测集群的 Partition 平衡情况，在开始检测时，Controller 会依次检查所有的 Broker 。当发现这个 Broker 上的不平衡的 Partition 比例高于leader.imbalance.per.broker.percentage 阈值时，就会触发一次 Leader Partiton 的自平衡。

这是官方文档的部分截图。

这个机制涉及到 Broker 中 server.properties 配置文件中的几个重要参数：

另外，你也可以通过手动调用 kafka-leader-election.sh 脚本，触发一次自平衡。例如：

但是要注意，这样 Leader Partition 自平衡的过程是一个非常重的操作，因为要涉及到大量消息的转移与 同步。并且，在这个过程中，会有丢消息的可能 。所以在很多对性能要求比较高的线上环境，会选择将参数auto.leader.rebalance.enable设置为 false ，关闭 Kafka 的 Leader Partition 自平衡操作，而用其他运维的方式，在业务不繁忙的时间段，手动进行Leader Partiton 自平衡，尽量减少自平衡过程对业务的影响。 至于为什么会丢消息。下一章节就会给出答案。

5 、 Partition 故障恢复机制

Kafka 设计时要面对的就是各种不稳定的网络以及服务环境。如果 Broker 的服务不稳定，随时崩溃， Kafka集群要怎么保证数据安全呢？

当一组 Partition 中选举出了一个 Leader 节点后，这个 Leader 节点就会优先写入并保存 Producer 传递过来的消息，然后再同步给其他Follower 。当 Leader Partition 所在的 Broker 服务发生宕机时， Kafka 就会触发Leader Partition的重新选举。但是，在选举过程中，原来 Partition 上的数据是如何处理的呢？

Kafka 为了保证消息能够在多个 Parititon 中保持数据同步，内部记录了两个关键的数据：

· LEO(Log End Offset): 每个 Partition 的最后一个 Offset

这个参数比较好理解，每个 Partition 都会记录自己保存的消息偏移量。 leader partition 收到并记录了生产者发送的一条消息，就将LEO 加 1 。而接下来， follower partition 需要从 leader partition 同步消息，每同步到一个消息，自己的LEO 就加 1 。通过 LEO 值，就知道各个 follower partition 与 leader partition 之间的消息差距。

· HW(High Watermark): 一组 Partiton 中最小的 LEO 。

follower partition 每次往 leader partition 同步消息时，都会同步自己的 LEO 给 leader partition 。这样

leader partition 就可以计算出这个 HW 值，并最终会同步给各个 follower partition 。 leader partition 认为这个HW 值以前的消息，都是在所有 follower partition 之间完成了同步的，是安全的。这些安全的消息就可以被消费者拉取过去了。而HW 值之后的消息，就是不安全的，是可能丢失的。这些消息如果被消费者拉取过去消费了，就有可能造成数据不一致。

也就是说，在所有服务都正常的情况下，当一个消息写入到 Leader Partition 后，并不会立即让消费者感知。而是会等待其他Follower Partition 同步。这个过程中就会推进 HW 。当 HW 超过当前消息时，才会让消费者感知。比如在上图中，4 号往后的消息，虽然写入了 Leader Partition ，但是消费者是消费不到的。

当服务出现故障时，如果是 Follower 发生故障，这不会影响消息写入，只不过是少了一个备份而已。处理相对简单一点。Kafka 会做如下处理：

1. 将故障的 Follower 节点临时提出 ISR 集合。而其他 Leader 和 Follower 继续正常接收消息。

2. 出现故障的 Follower 节点恢复后，不会立即加入 ISR 集合。该 Follower 节点会读取本地记录的上一次的HW，将自己的日志中高于 HW 的部分信息全部删除掉，然后从 HW 开始，向 Leader 进行消息同步。

3. 等到该 Follower 的 LEO 大于等于整个 Partiton 的 HW 后，就重新加入到 ISR 集合中。这也就是说这个Follower的消息进度追上了 Leader 。

如果是 Leader 节点出现故障， Kafka 为了保证消息的一致性，处理就会相对复杂一点。

1. Leader 发生故障，会从 ISR 中进行选举，将一个原本是 Follower 的 Partition 提升为新的 Leader 。这时，消息有可能没有完成同步，所以新的Leader 的 LEO 会低于之前 Leader 的 LEO 。

2. Kafka 中的消息都只能以 Leader 中的备份为准。其他 Follower 会将各自的 Log 文件中高于 HW 的部分全部清理掉，然后从新的Leader 中同步数据。

3. 旧的 Leader 恢复后，将作为 Follower 节点，进行数据恢复。

在这个过程当中， Kafka 注重的是保护多个副本之间的数据一致性。但是这样，消息的安全性就得不到保障。例如在上述示例中，原本Partition0 中的 4 ， 5 ， 6 ， 7 号消息就被丢失掉了。

在这里你或许会有一个疑问，这个机制中有一个很重要的前提，就是各个 Broker 中记录的 HW 是一致的。 但是 HW 和 LEO 同样是一个分布式的值，怎么保证 HW 在多个 Broker 中是一致的呢？

6 、 HW 一致性保障 -Epoch 更新机制

有了 HW 机制后，各个 Partiton 的数据都能够比较好的保持统一。但是，实际上， HW 值在一组 Partition 里并不是总是一致的。

Leader Partition 需要计算出 HW 值，就需要保留所有 Follower Partition 的 LEO 值。

但是，对于 Follower Partition ，他需要先将消息从 Leader Partition 拉取到本地，才能向 Leader Partition上报LEO 值。所有 Follower Partition 上报后， Leader Partition 才能更新 HW 的值，然后 Follower Partition 在下次拉取消息时，才能更新HW 值。所以， Leader Partiton 的 LEO 更新和 Follower Partition 的 LEO 更新，在时间上是有延迟的。这也导致了Leader Partition 上更新 HW 值的时刻与 Follower Partition 上跟新 HW 值的时刻，是会出现延迟的。这样，如果有多个Follower Partition ，这些 Partition 保存的 HW 的值是不统一的。当然，如果服务一切正常，最终Leader Partition 还是会正常推进 HW ，能够保证 HW 的最终一致性。但是，当 Leader Partition 出现切换，所有的 Follower Partition 都按照自己的 HW 进行数据恢复，就会出现数据不 一致的情况 。

因此， Kafka 还设计了 Epoch 机制，来保证 HW 的一致性。

1. Epoch 是一个单调递增的版本号，每当 Leader Partition 发生变更时，该版本号就会更新。所以，当有多个Epoch 时，只有最新的 Epoch 才是有效的，而其他 Epoch 对应的 Leader Partition 就是过期的，无用的Leader 。

2. 每个 Leader Partition 在上任之初，都会新增一个新的 Epoch 记录。这个记录包含更新后端的 epoch 版本号，以及当前Leader Partition 写入的第一个消息的偏移量。例如 (1,100) 。表示 epoch 版本号是 1 ，当前Leader Partition写入的第一条消息是 100. Broker 会将这个 epoch 数据保存到内存中，并且会持久化到本地一个leader-epoch-checkpoint 文件当中。

3. 这个 leader-epoch-checkpoint 会在所有 Follower Partition 中同步。当 Leader Partition 有变更时，新的Leader Partition 就会读取这个 Epoch 记录，更新后添加自己的 Epoch 记录。

4. 接下来其他 Follower Partition 要更新数据时，就可以不再依靠自己记录的 HW 值判断拉取消息的起点。而可以根据这个最新的epoch 条目来判断。

这个关键的 leader-epoch-checkpoint 文件保存在 Broker 上每个 partition 对应的本地目录中。这是一个文本文件，可以直接查看。他的内容大概是这样样子的：

其中

第一行版本号

第二行表示下面的记录数。这两行数据没有太多的实际意义。

从第三行开始，可以看到两个数字。这两个数字就是 epoch 和 offset 。 epoch 就是表示 leader 的 epoch 版本。从0 开始，当 leader 变更一次 epoch 就会 +1 。 offset 则对应该 epoch 版本的 leader 写入第一条消息的offset。可以理解为用户可以消费到的最早的消息 offset 。

7 、章节总结

Kafka 其实天生就是为了集群而生，即使单个节点运行 Kafka ，他其实也是作为一个集群运行的。而 Kafka为了保证在各种网络抽风，服务器不稳定等复杂情况下，保证集群的高性能，高可用，高可扩展三高，做了非常多的设计。而这一章节，其实是从可见的Zookeeper 注册信息为入口，理解 Kafka 的核心集群机制。回头来看今天总结的这些集群机制，其实核心都是为了保持整个集群中Partition 内的数据一致性。有了这一系列的数据一致性保证，Kafka 集群才能在复杂运行环境下保持高性能、高可用、高可扩展三高特性。而这其实也是我们去理解互联网三高问题最好的经验。

pytorch 天花板级别的知识点你可以不会用但是不能不知道小赖同学啊人工智能 pytorch 人工智能 python
PyTorch的高级知识涵盖了从模型优化到分布式训练的广泛内容，适合已经掌握基础知识的开发者进一步提升技能。以下是PyTorch的高级知识点，详细且全面：1.模型优化与加速1.1混合精度训练定义：使用半精度（FP16）和单精度（FP32）混合训练，减少内存占用并加速计算。实现：使用torch.cuda.amp模块。示例：fromtorch.cuda.ampimportautocast,GradSc
Hystrix 实现限流\降级\熔断杏花春雨江南 java开发那些事儿 hystrix java 开发语言
Hystrix是一个强大的库，用于处理分布式系统中的延迟和容错问题。它提供了限流、降级和熔断等功能。下面是一个完整的Java示例，展示如何使用Hystrix实现限流、降级和熔断。1.添加依赖在pom.xml中添加Hystrix的依赖：xml复制com.netflix.hystrixhystrix-core1.5.18运行HTML2.创建Hystrix命令创建一个继承自HystrixCommand的
深入浅出分布式事务原理梵高的猪v 分布式事务
一、Seata四大事务模式详解模式实现机制事务一致性业务侵入性适用场景AT数据库本地事务+Undo日志+二阶段提交最终一致性无侵入电商、订单等高性能要求TCCTry-Confirm-Cancel强一致性强业务侵入金融支付、账户、转账等SAGA补偿事务（前进+回滚）最终一致性轻微侵入长事务，如营销活动XA标准XA协议强一致性无侵入银行、转账等二、逐个详细拆解每一种事务模式1.AT模式（Automat
微服务架构中10个常用的设计模式微服务
在当今的微服务架构中，常见的十种设计模式，分别是服务发现模式、API网关模式、断路器模式、边车模式、负载均衡模式、Saga事务模式、CQRS模式、分片模式、分布式日志跟踪模式、熔断与降级模式。其中，服务发现模式十分关键，通过自动化发现和定位服务，减少人工配置带来的不确定性，让系统可扩展性与高可用性得以更好地保障。同时，这一模式还能有效降低运维难度，在服务数量急剧增加的情况下依然保持灵活管理，提高线
MQ和ActiveMQ浅析星星都没我亮 ActiveMQ activemq
文章目录什么是JMSMQ消息中间件应用场景异步通信缓冲解耦冗余扩展性可恢复性顺序保证过载保护数据流处理常用消息队列（ActiveMQ、RabbitMQ、RocketMQ、Kafka）比较JMS中的一些角色BrokerproviderConsumerp2ppub/subPTP和PUB/SUB简单对QueueTopicConnectionFactoryConnectionDestinationSess
数据归档 - 冷热数据处理大师趣链科技区块链技术算法数据处理区块链
——Part1现状——区块链可以视作一个在分布式环境下众多可信节点共同维护的且不可篡改的账本。在区块链系统中，数据以区块作为基本单位，区块链系统利用levelDB基于Key-Value结构的数据库存取数据，通过多节点冗余存储实现账本可信，然而随着区块链运行时间的增长，区块链的存储容量将呈线性增长，且这种数据的增长速度甚至会超过存储介质容量增长的速度，因此，区块链数据存储将成为限制区块链技术发展的重
消息队列的特性与使用场景：Kafka、ActiveMQ、RabbitMQ与RocketMQ的深度剖析啊sen丶 kafka activemq rabbitmq rocketmq 分布式消息队列
在分布式系统和微服务架构中，消息队列是实现服务间通信和解耦的核心组件。Kafka、ActiveMQ、RabbitMQ和RocketMQ是当前最受欢迎的消息队列解决方案，它们各自具有独特的特性和适用场景。本文将从特性和使用场景两个维度进行对比分析，帮助读者更好地理解它们的差异，并根据实际需求选择合适的消息队列。一、特性对比（一）吞吐量与延迟-Kafka：以高吞吐量著称，适合大规模数据的批量处理。延迟
Spring Boot整合SA-Token的使用详解陈辰学长 spring boot 数据库后端
SpringBoot整合SA-Token的使用详解，涉及到SA-Token的基本介绍、整合步骤、配置、常用API以及实际使用场景等多个方面。以下将详细阐述这一过程，确保内容不少于2000字。一、SA-Token简介SA-Token是一个轻量级的Java权限认证框架，由国人开发，主要解决登录认证、权限认证、单点登录、OAuth2.0、分布式Session会话、微服务网关鉴权等一系列权限相关问题。SA
美团Leaf分布式ID生成器：使用详解与核心原理解析 Cloud_. 分布式
引言在分布式系统中，全局唯一ID是贯穿整个业务链路的关键标识，无论是订单号、用户ID、支付流水号，还是日志追踪，都需要唯一且有序的ID来保证数据的一致性。然而，传统的自增ID方案（如数据库自增主键）在分布式场景下面临单点故障、性能瓶颈、分库分表冲突等问题。美团开源的Leaf分布式ID生成器通过创新的设计解决了这些难题，成为业界广泛使用的解决方案之一。本文将深入解析Leaf的两种核心模式（号段模式与
InfluxDB写入测试 PascalMing 编程 influxdb java 读写测试
早几年测试时序库时，采集数据到kafka，然后用不同数据进行存储验证。Influxdb是花时间比较多的，它的数据建模方法、读写方法都需要使用特殊的API。时间久了自己也经常忘记，把当时的测试关键代码记录下来，也方便日后查找。代码基于java编写。1、接口数据定义，clientid+tag组合必须唯一publicclassKafkaInfo{//客户端idpublicStringclientid;/
Spring Boot中使用RabbitMQ实现简单的消息发送与接收 Takumilovexu MQ java-rabbitmq rabbitmq spring boot
文章目录环境准备1.RabbitMQ的基础配置2.实现消息发送功能3.实现消息接收功能4.总结在微服务架构和分布式系统中，消息队列是实现异步通信和解耦的重要工具。RabbitMQ作为一种常见的消息中间件，广泛应用于消息传递、任务分发等场景。本文将带你一步步实现如何在SpringBoot应用中使用RabbitMQ进行消息的发送和接收。我们将构建一个消息发送者（Publisher）和一个消息接收者（C
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发引言在HarmonyNext生态系统中，分布式任务调度是一个核心且复杂的技术领域。随着设备互联的普及，如何在多设备间高效、可靠地分配和执行任务成为开发者面临的重要挑战。本文将深入探讨如何利用ArkTS语言构建一个高性能的分布式任务调度系统，涵盖从架构设计到代码实现的完整过程。分布式任务调度系统概述分布式任务调度系统的核心目标是将任务
HarmonyNext实战：基于ArkTS的跨设备分布式计算应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的跨设备分布式计算应用开发引言随着分布式计算技术的快速发展，跨设备协同计算已成为提升应用性能的重要手段。HarmonyNext作为新一代操作系统，提供了强大的分布式能力，而ArkTS作为其开发语言，能够帮助开发者高效实现跨设备分布式计算。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个跨设备分布式计算应用。我们将从分布式计算的基本原理
如何在GitHub上Clone项目：一步步指南 Fanstay985 github
GitHub作为全球最大的代码托管平台，汇聚了无数开发者的智慧结晶。对于初学者和资深开发者来说，学会如何从GitHub上克隆（Clone）项目是一项基本且重要的技能。本文将详细介绍如何在GitHub上克隆项目的步骤，帮助你轻松将他人的代码库下载到本地进行学习和开发。一、准备工作在开始之前，请确保你已经安装了Git。Git是一个分布式版本控制系统，用于代码的版本管理。如果你还没有安装Git，可以从G
初见SpringCloud ing Camellia0212 重生之我要做开发 spring spring cloud
Consul服务注册与发现服务注册与发现服务注册：微服务在启动时，会将自己的信息（如IP地址、端口、服务名称等）注册到Consul。服务发现：其他微服务可以通过Consul查询到已注册的服务，并通过这些信息进行通信。分布式配置管理Consul可以作为配置中心，管理分布式系统的配置。SpringCloudConsul可以将配置信息存储在Consul中，并在应用启动时或者运行时动态获取和更新这些配置信
AI 大模型应用数据中心建设：高性能计算与存储架构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、高性能计算、存储架构、分布式训练、GPU加速、数据管理1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是深度学习模型的突破性进展，催生了一系列基于大规模数据训练的强大AI模型，例如GPT-3、BERT、DALL-E等。这些AI大模型在自然语言处理、计算机视觉、语音识别等领域展现出强大的应用潜力，但也对计算资源和数据存储提出了极高的要求。传统的计算架构难以满足AI大
云原生：K8s（Kubernetes）高频典型面试题汇总老舅的火箭爱扫地云原生 kubernetes 容器
1.简述etcd及其特点？答：etcd是CoreOS团队发起的开源项目，是一个管理配置信息和服务发现（servicediscovery）的项目，它的目标是构建一个高可用的分布式键值（key-value）数据库，基于Go语言实现。特点：l简单：支持REST风格的HTTP+JSONAPIl安全：支持HTTPS方式的访问l快速：支持并发1k/s的写操作l可靠：支持分布式结构，基于Raft的一致性算法，R
鸿蒙开发2024【面试题库】讲解，近期需要面试的可千万别错过！鸿蒙系统小能手Mr.Li 鸿蒙开发 harmonyos 面试鸿蒙 OpenHarmony 鸿蒙系统程序员移动开发
1.请简述鸿蒙OS与AndroidOS的主要区别是什么？设备兼容性：鸿蒙OS是一款面向各种设备的分布式操作系统，支持手机、平板电脑、智能手表、智能家居、汽车等多种设备类型，并能在这些设备之间实现无缝切换和共享数据。而Android系统则主要用于移动设备，如手机和平板电脑。系统架构：鸿蒙OS采用分布式技术架构，通过分布式技术实现多设备间的协作和数据共享，更加灵活、安全、高效。而Android则采用单
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发引言在HarmonyNext生态系统中，分布式任务调度是一个核心且复杂的技术领域。随着设备互联的普及，如何在多设备间高效、可靠地分配和执行任务成为开发者面临的重要挑战。本文将深入探讨如何利用ArkTS语言构建一个高性能的分布式任务调度系统，涵盖从架构设计到代码实现的完整过程。分布式任务调度系统概述分布式任务调度系统的核心目标是将任务
HarmonyNext实战：基于ArkTS的高性能区块链应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能区块链应用开发引言区块链技术以其去中心化、不可篡改和透明性等特点，正在金融、供应链、物联网等领域掀起革命性变革。HarmonyNext作为新一代操作系统，提供了强大的分布式计算和网络通信能力，而ArkTS作为其开发语言，能够帮助开发者高效实现高性能的区块链应用。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个区块链应用。我们将
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式数据同步应用开发引言在分布式系统中，数据同步是一个核心问题，尤其是在多设备协同的场景下。HarmonyNext作为新一代操作系统，提供了强大的分布式能力，而ArkTS作为其开发语言，能够帮助开发者高效实现分布式数据同步。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个分布式数据同步应用。我们将从分布式数据同步的基本原理入手，逐
RabbitMQ 高级特性：从 TTL 到消息分发的全面解析（下） ngioig RabbitMQ ruby 开发语言后端
RabbitMQ高级特性RabbitMQ高级特性解析：RabbitMQ消息可靠性保障（上）-CSDN博客RabbitMQ高级特性：从TTL到消息分发的全面解析（下）-CSDN博客引言RabbitMQ作为一款强大的消息队列中间件，在分布式系统中发挥着至关重要的作用。除了基本的消息收发功能外，它还具备许多高级特性，如TTL、死信队列、延迟队列、事务和消息分发等。本文将详细介绍这些高级特性。1.TTL（
ICC2 高效进阶：set_host_options 命令精解，数字后端设计必备！数字后端物理设计知识库 icc2命令每日精要后端性能优化
在数字后端物理设计的战场中，效率就是生命，而ICC2的set_host_options命令就是助力各位工程师和学子们快速提升效率的神器！今天就带大家深入探索这个命令的奥秘，让复杂的配置变得轻松简单。一、set_host_options的核心价值这个命令专注于多核处理的灵活配置，无论是多线程、分布式处理还是并行任务执行，它都能轻松驾驭。通过精准定义主机资源、核心数以及提交协议等关键参数，工程师们可以
mcp 是一种什么协议，怎么构建mcpserver,怎么实现多智能体的调用 MonkeyKing.sun MCP协议 MCP server
MCP（MessageControlProtocol）是一种用于分布式系统中多智能体通信的协议框架，特别适合于构建多智能体系统。下面我将介绍MCP协议的基本原理以及如何构建MCP服务器和实现多智能体调用。MCP协议概述MCP协议主要用于定义智能体之间如何交换消息、协调任务和共享资源。它通常包含以下核心组件：消息格式定义会话管理路由机制错误处理安全认证构建MCP服务器以下是构建基本MCP服务器的步骤
展望 AIGC 前景：通义万相 2.1 与蓝耘智算平台共筑 AI 生产力高地 accurater AIGC 人工智能神经网络深度学习
喜欢可以到主页订阅专栏引言人工智能生成内容（AIGC）技术正在重塑内容创作、影视制作、广告设计等行业的底层逻辑。作为该领域的革命性技术代表，通义万相2.1凭借其开源特性、多模态生成能力和技术突破，成为全球视频生成模型的标杆。而蓝耘智算平台则通过高性能算力支持与分布式架构优化，为AIGC技术的规模化应用提供了基础设施保障。两者的协同不仅推动了AI生产力的跃迁，更开启了从技术研发到商业落地的全链条创新
kafka生成者发送消息失败报错：RecordTooLargeException 青椒1013 kafka 分布式
kafka生成者发送消息典型案例生产者发送消息失败：Failedtosend;nestedexceptionisorg.apache.kafka.common.errors.RecordTooLargeException:Themessageis1053512byteswhenserializedwhichislargerthanthemaximumrequestsizeyouhaveconfig
Spring Boot 多级缓存实战：基于 Redis+Redisson 构建高并发解决方案 Isaac_Gao 缓存 spring boot redis
SpringBoot多级缓存实战：基于Redis+Redisson构建高并发解决方案本文适合人群：中高级Java开发工程师、系统架构师、对高并发场景优化感兴趣的技术人员一、为什么需要多级缓存？在百万级并发的电商系统中，我们曾遇到这样的性能瓶颈：本地缓存导致各节点数据不一致单纯依赖Redis造成带宽瓶颈缓存雪崩导致DB被打挂多级缓存架构通过结合本地缓存与分布式缓存的优势，实现了：热点数据纳秒级访问分
Dubbo、SpringCloud框架学习种豆走天下 dubbo spring cloud 学习
学习Dubbo和SpringCloud框架是微服务架构的一个重要部分。这两个框架在分布式系统中起着重要的作用，分别是阿里巴巴和Spring团队开发的。下面我将为你提供一些基础知识和学习路线，帮助你更好地理解和掌握这两个框架。1.Dubbo框架学习1.1什么是DubboDubbo是阿里巴巴开源的一款高性能的微服务框架。它提供了RPC（远程过程调用）、服务注册与发现、负载均衡、容错、监控等功能。Dub
k8s系统学习路径 LCY133 kubernetes 学习容器
学习Kubernetes（K8s）需要循序渐进，结合理论知识和实践操作。以下是学习Kubernetes的推荐步骤：1.先决条件•掌握容器基础：先学习Docker，理解容器化概念（镜像、容器、仓库）、Dockerfile编写和容器生命周期管理。•熟悉Linux基础：了解Linux命令行操作、网络、文件系统等。•了解云计算概念：如虚拟化、负载均衡、服务发现、分布式系统等。2.Kubernetes核心概
京准电钟：关于NTP网络时间同步系统应用方案北京华人开创公司北斗卫星授时 NTP时间同步卫星同步时钟网络大数据时间同步 NTP 网络授时授时服务卫星授时服务
京准电钟：关于NTP网络时间同步系统应用方案京准电钟：关于NTP网络时间同步系统应用方案一、背景与需求分析在现代信息化系统中，网络设备、服务器、终端设备的时间同步是保障业务连续性、数据一致性和安全审计的核心基础。时间不同步可能导致以下问题：日志记录时间混乱，影响故障排查；分布式系统事务冲突或数据不一致；安全证书验证失败或攻击行为难以追溯；工业控制、金融交易等高精度场景的时间敏感操作异常。需求目标：
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

Kafka集群架构设计原理详解

你可能感兴趣的:(kafka,分布式)