战斧

Kafka存取原理与实现分析，打破面试难关

系列文章目录

上手第一关，手把手教你安装kafka与可视化工具kafka-eagle
Kafka是什么，以及如何使用SpringBoot对接Kafka
架构必备能力——kafka的选型对比及应用场景

Kafka存取原理与实现分析，打破面试难关

系列文章目录
一、主题与分区
- 1. 模型
- 2. 消息与分发
二、分区内数据的存储
- 1. 消息的存储
- - ① 偏移量与日志文件
  - ② 索引的构成
- 2. 消息的读取
- - ① 消费偏移量的存储
  - ②Compaction策略
  - ③查找并读取消息
- 3. 快速存取实现
总结

在前面的几篇内容中，我们依次讲了Kafka的安装、与Spring Boot的结合，还有选型与应用场景。但是笔者也知道，对于很多小伙伴来说，原理及实现才算重头戏，而且也是面试热点，那么本次我们先来进行存取原理的分析，当然抱着疑问去学习才是最快的，因此在开始之前，我也先抛出一些Kafka的重点与热点问题，希望大家在学习过程中能总结印证

Kafka为什么吞吐量这么高？
Kafka的数据存与取有什么特点？

作者简介：战斧，从事金融IT行业，有着多年一线开发、架构经验；爱好广泛，乐于分享，致力于创作更多高质量内容
本文收录于 kafka 专栏，有需要者，可直接订阅专栏实时获取更新
高质量专栏云原生、RabbitMQ、Spring全家桶等仍在更新，欢迎指导
Zookeeper Redis dubbo docker netty等诸多框架，以及架构与分布式专题即将上线，敬请期待

一、主题与分区

1. 模型

我们其实在《架构必备能力——kafka的选型对比及应用场景》一文中其实讲到了Kafka的模型，我们这里再把老图拿出来用一遍

不难看出，逻辑上的源头就是主题，也即Topic，而主题又划分为多个分区。我们先来谈谈主题与分区的实现，在Kafka中，可以使用以下命令来声明一个主题并指定分区：

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 4 --topic my-topic

其中：

–create: 声明一个新的主题。
–zookeeper: 指定 ZooKeeper 的地址和端口号。
–replication-factor: 指定副本因子，即每个分区在集群中的副本数量。这里指定为1，表示每个分区只有一个副本。
–partitions: 指定分区数。这里指定为4，表示该主题有4个分区。
–topic: 指定主题名称，这里为 my-topic。
注意：如果要指定分区数量，必须在创建主题的时候指定，之后无法更改。因此，在创建主题时应该仔细考虑分区数量，以满足业务需求。

当然，如果有同学还记得前面的内容，应该知道我们在对接Spring Boot时，并没有提前建立主题而是直接使用了。其中的原因是，我们在Spring Boot中使用Kafka，如果在发送消息时指定的主题不存在，Kafka会自动创建该主题。在创建时，Kafka将使用默认的分区数量（通常为1），以及默认的副本因子（通常为1）来创建分区。

2. 消息与分发

然后当我们发布者向某个主题发送消息时，其就会被“分发”到某一个分区里

那么有小伙伴肯定会问：

Kafka的主题消息会进哪个分区是我们可以决定的吗？默认是进入哪个分区？

答案是Kafka的主题消息可以由生产者自己决定要发送到哪个分区，也可以使用Kafka提供的默认分区分配算法来自动决定消息要进入哪个分区。

指定分区：如果生产者自己决定要发送到哪个分区，可以在发送消息时指定消息要发送到的分区编号。此时，如果指定的分区编号存在，则消息会被发送到该分区；如果指定的分区编号不存在，则会抛出异常。
自动分区：如果使用默认的分区分配算法，Kafka提供了多种分配算法，例如轮询（Round-Robin）、随机（Random）、哈希（Hash）等。默认情况下，Kafka使用哈希算法将消息均匀地分配到所有可用的分区中

当然在此之前，我们可以看下KafkaTemplate前面提供的API

不难知道Kafka消息除了指明主题以外，还由以下要素组成：

消息的key：是一个可选项，用于标识消息的唯一性和分区。如果不指定key，则会随机分配一个key，并将消息发送到随机的分区。
消息的value：是消息的实际内容，也是必填项。
消息的时间戳：是可选项，用于标识消息的时间戳。Kafka可以根据时间戳来处理消息的顺序、分配和延迟。
消息的分区：指定消息应该发送到哪个分区。如果不指定分区，则使用默认的分区器来决定分区。

二、分区内数据的存储

从逻辑上来说，kafka的分区是一个消息队列，当我们发送的消息经由分区器进行分发后，就会进入某个分区并被顺序的保存下来。在实现上，Kafka的分区更像一个日志记录系统，把消息当作日志，顺序的写入磁盘

1. 消息的存储

我们需要知道，Kafka中，每个分区被组织为一组日志段（Log Segment），其中每个日志段都包含了一个连续的消息序列。当一个日志段被写满后，它将被关闭并分配一个更高的编号，新的消息将被追加到一个新的日志段中。而日志段的核心又由两个部分组成：索引文件（index file）和数据文件（data file）

数据文件: 也叫日志文件，数据文件是消息分区的核心部分，它是以追加方式写入的文件。当有新的消息写入分区时，Kafka会根据协议、消息头、消息体等信息将消息封装成字节流，然后追加写入数据文件。
索引文件: 索引文件是一个不可变的有序映射，它将消息偏移量映射到数据文件中的位置。当一个消费者读取一个分区的消息时，它会使用偏移量读取索引文件中的位置，并从该位置读取数据文件中的消息。

如下图，就是我们上期发送了一条消息，而建立的目录test_topic-0，代表该目录是test_topic主题下的 0 号分区，可以看到里面的 index文件和 log 文件

① 偏移量与日志文件

要想更深入的了解，我们必须先解释一下kafka中消息偏移量（offset） 的概念：当一条记录需要写入分区的时候，它会被追加到 log 文件的末尾，同时会被分配一个唯一的序号，称为 Offset（偏移量）。Offset 是一个递增的、不可变的数字，由 Kafka 自动维护。需要注意的是，在后续内容中，我们还会提到各种不同的偏移量，请注意区分，不要混淆了

由于Offset 初始值为 0，所以当第一条消息达到分区后，就会建立起 00000000000000000000.log 这样的文件来进行消息的存储，后续消息将会在这个文件内追加写入，直到文件大小超出限制（其默认值为1GB）

举个例子，当第170411个消息（Offset = 170410）来到时，发现 00000000000000000000.log 已经超过了 1 G，此时其就会新创建一个日志段，同时以本offset为名，新建一个日志文件，命名为 0000000000000170410.log，此时本分区就形成了两个日志段，情况如下：

② 索引的构成

我们上面讲了 .log 文件，也即数据文件的创建机制。但是还没讲段的另一个组成部分，也即索引文件。索引其实就像字典的目录，是帮助大家快速找到某条消息的工具，索引文件存储的内容主要就是 消息偏移量（offset） 与 消息存储地址（position） 的映射关系。

Kafka的索引文件由多个索引条目（index entry）组成，每个索引条目包含两个核心字段：

offset：消息的偏移量（这里是相对偏移量，每个索引文件都以0起始，其对应的真实偏移量为段初始偏移 + 本offset）；
position：消息在日志文件中的磁盘位置（相对偏移量，偏移量仅适用于对应的日志文件）

需要注意的是，不是每一条消息都会有索引。这里有参数 index.interval.bytes 的控制，其默认值为 4 KB，即表示当前分区 log 文件写入了 4 KB 数据后才会在索引文件中增加一个索引条目

2. 消息的读取

现在我们已经存储了一些数据，下面就要开始读取了，我们目前掌握了这些文件，那么怎么才能找到并读取消息呢？

① 消费偏移量的存储

我们不难理解，每个消费者负责需要消费分配给它的分区上的消息，并记录自己在每个分区上消费的最新偏移量。对于消费者而言，怎么知道自己应该要消费哪个offset的消息？消费者可以通过以下两种方式记录消费的偏移量：

手动提交偏移量：消费者在消费消息时，可以手动调用 consumer.commitSync() 或 consumer.commitAsync() 方法将消费的偏移量提交到 Kafka 中。该方法接收的参数表示要提交的偏移量的值，提交后，Kafka 会将该偏移量记录到内部的偏移量管理器中。
自动同步提交偏移量：消费者可以将 enable.auto.commit 参数设置为 true，开启自动提交偏移量的功能。启用该功能后，Kafka 会自动记录消费者消费过的最新偏移量，并定期将其定期提交到 Kafka 中。

但不管怎么样，这个消费的偏移量最终都是由kafka来进行保存的，那么其具体的存储是怎么实现的呢？Kafka其实提供了将给定消费者组的所有偏移存储在一个叫做组协调器（group coordinator）的组件。

通过官方文档不难看出，当组协调器收到偏移量变动的请求时，会将对应数据存储在内置的主题 __consumer_offsets 中（在旧版本中偏移量是存在ZK中的），我们可以在ZK中看到这个主题的情况：

在我们的本地目录中也能看到这个 __consumer_offsets 主题一共建了50个分区（默认）：

当然它分区的个数，可以在Kafka服务器配置文件中通过参数offsets.topic.num.partitions 进行配置。

当我们以某个消费者组消费掉某条消息并提交偏移量后，偏移量会被提交到 __consumer_offsets Topic的一个特定分区，该分区由所消费的主题和消费者组的哈希值决定。在我的例子里，是被提交到了 __consumer_offsets-45，如下：

②Compaction策略

相信你会对这种存储消费位置的方式有所困惑，因为按照我们前面的说法，Kafka的内容都是以日志形式存储的，在使用的过程中，日志岂不是会越来越大？到最后找一次偏移量都很麻烦？这就不得不提到Kafka中的Compaction策略

compaction是一种保留最后N个版本的消息的消息清理策略，它保留特定键的最新值，同时删除无用的键值，从而减少存储空间。具体来说，Compaction会保留每个消息主题中最新的一组键值对，并删除所有键相同但值较旧的消息。

使用Compaction策略需要满足以下条件：

消息的键必须是唯一的
消息的键必须是可序列化的
消息必须按照键进行划分
消息的存储时间必须足够长，以便新消息可以替换旧消息

而这些消费偏移量的数据，存储的内容如下

key = group.id+topic+分区号
value= offset 的值

这样就导致某个消费组在某个分区的消费数据只会有一条，所以找起来并没有那么复杂

③查找并读取消息

上面我们讲了消费偏移量的存储，其实查找偏移量的过程也是一样的，同一个消费组会先从特定的 __consumer_offsets 拿取偏移量，拿到偏移量以后，比如偏移量是 170417，我们仍以上面的文件情况为例，那么它找到消息的逻辑如下：

首先用二分查找确定它是在哪个Segment文件中，其中0000000000000000000.index为最开始的文件，第二个文件为0000000000000170410.index（起始偏移为170410+1 = 170411），而第三个文件为0000000000000239430.index（起始偏移为239430+1 = 239431）。所以这个offset = 170417就落在第二个文件中。其他后续文件可以依此类推，以起始偏移量命名并排列这些文件，然后根据二分查找法就可以快速定位到具体文件位置。
用该offset减去索引文件的编号，即170417 - 170410 = 7，也用二分查找法找到索引文件中等于或者小于7的最大的那个编号。可以看出我们能够找到[4，476]这组数据，476即offset=170410 + 4 = 170414的消息在log文件中的偏移量。
打开数据文件（0000000000000170410.log），从位置为476的那个地方开始顺序扫描直到找到offset为170417的那条Message。

总结来说：就是通过二分法先找到index文件，然后再在index文件中通过二分法找到某一条索引条目，然后根据该索引条目给出的地址去log文件中快速定位，最后从这个定位开始，顺序扫描下去直到找到我们指定的偏移量数据

3. 快速存取实现

我们上面讲了Kafka的一大堆的奇特设计，不知道小伙伴们是否产生过疑问，比如为什么一个主题要分成多个分区 ？一个分区为什么要划成多个段？以及为什么把数据存储成日志格式 ？其实这些都是在优化性能，我们从快速存取的角度讲一下Kafka都做了哪些努力【面试重点】：

多分区负载均衡：Kafka支持将一个主题的数据分散至多个分区，不同分区位于多个broker节点上，实现了集群负载均衡，从而提高了写入和读取的性能。
分段存储：Kafka会将数据分段存储，每个段的大小和时间可以根据需求进行配置，这样可以提高读取性能并减少删除操作对IO的影响。
批量写入：Kafka允许客户端一次性写入多条消息到broker，减少了网络传输的时间。
零拷贝：Kafka使用mmap映射磁盘上的文件到虚拟内存空间，然后通过直接内存访问（Direct Memory Access）的方式将数据从磁盘读取到内存中，还使用sendfile系统调用来实现网络发送时的零拷贝，这样网络数据也可以直接从内核空间中发送，避免了数据拷贝到用户空间的过程。
异步刷盘：Kafka支持异步刷盘，即将消息写入日志后，不会立即将数据从内存刷入磁盘，而是会缓存一段时间再批量写入磁盘，减少了磁盘I/O的次数，提高了写入性能。
稀疏索引：Kafka会为每个段维护一个索引，以便在读取数据时快速定位到所需数据的位置。这样可以避免全盘扫描，提高数据读取性能。但如果每个消息都写进索引，会导致索引文件臃肿，且降低存储速度，所以采用了稀疏索引的方式

如果你按照《Kafka是什么，以及如何使用SpringBoot对接Kafka》中的动手操作过，我们可以继续来做个实现，我们先看一下log文件，如下

然后我们把发送的代码改成如下，这样一次发送1000条消息，注意，我们在这里还加上了 kafkaTemplate.flush()，因为当使用Kafka Template发送消息时，消息并不会立即发送到Kafka Broker，而是会被缓存在Kafka Template中，以减少通信次数，如果我们需要立即发送，这时候就可以使用kafkaTemplate.flush()方法来实现立即发送。

@Service
public class KafkaService {

    @Autowired
    private KafkaTemplate<String, String> kafkaTemplate;

    public void sendMessage(String message) {
        for (int i = 0; i < 1000; i++) {
            kafkaTemplate.send("another_topic2", 0,"key",message + i);
        }
        kafkaTemplate.flush();
        System.out.println("we have send message");
    }
}

但当我们发送消息，成功输出 we have send message ，并又成功接收到消息后，如图

我们却会看到 log 文件的大小没有发生变化，即便是不停的刷新目录也无济于事

然而如果我们单击并右键选中该文件，就会看到该文件被更新，且大小发生变动

这就说明了其写入硬盘的过程是异步且有延迟的，使用了操作系统的延迟写入（delayed write）机制。但其传输数据却可以脱离硬盘，使用内存缓存作为收发介质，直接实现传达

总结

今天我们详细讲解了消息在kafak中的存与取，也介绍了不少细节点，知道了Kafka采用批量传输设计减少网络访问次数，然后用分区、分段、追加日志等方案来提高吞吐量，并且利用了操作系统的零拷贝、异步刷盘等方式来减少磁盘写入的瓶颈，最终成为了一款性能优异、吞吐量极大的中间件。希望通过今天的学习，能对大家有所帮助，我们将在后面继续讲解kafka的其他实现细节。如果你对此有兴趣，可以直接订阅本 kafka 专栏

一个产品从开发到上线需要几个步骤 yqcoder javascript 前端
一、需求分析与规划1.需求收集与客户、市场团队、用户等进行沟通，收集对产品的功能、性能、外观、用户体验等方面的需求。可以通过问卷调查、用户访谈、竞品分析等方式获取需求信息。2.需求分析对收集到的需求进行详细分析，明确需求的优先级、可行性和相互关系。分析过程中要考虑技术实现难度、成本、时间等因素，确保需求合理且可实现。3.产品规划根据需求分析结果，制定产品的整体规划，包括产品的定位、目标用户群体、功
两万字探讨时间轮算法 Damon_0411 算法 java spring
1.引言1.1背景介绍随着分布式系统、微服务架构的流行以及高并发场景的广泛应用，系统中处理延时任务的需求变得愈发重要。延时任务的常见场景包括：任务调度：某些任务需要按照预定时间执行，比如每天的定时数据备份。超时控制：网络连接的超时检测、数据库锁的释放延迟等。缓存管理：缓存数据的过期清理策略。事件驱动场景：如日志系统中，只有当所有日志接收完毕并经过一定延迟后才能触发归档。延时任务的本质是系统需要管理
【JVM-9】Java性能调优利器：jmap工具使用指南与应用案例 AllenBright #JVM jvm java 开发语言
在Java应用程序的性能调优和故障排查中，jmap（JavaMemoryMap）是一个不可或缺的工具。它可以帮助开发者分析Java堆内存的使用情况，生成堆转储文件（HeapDump），并查看内存中的对象分布。无论是内存泄漏、堆内存溢出，还是对象分布不均的问题，jmap都能提供关键的数据支持。本文将详细介绍jmap的使用方法，并结合实际案例展示其应用场景。1.什么是jmap？jmap是JDK自带的一
php随机函数的使用,PHP随机函数【上】王筱婷 php随机函数的使用
随机函数应用的场景很多，比如验证码，token，订单号等。由浅入深了解常用随机函数1.rand常用的随机数字函数，默认生成[0,getrandmax()]之间的随机数(包括边界值),因性能问题已被mt_rand替换。相关函数:rand(int$min,int$max)生成$min和$max之间的数。srand(int$seed)生成时间种子,同一个时间种子下随机生成的随机值相同。getrandma
图像生成大模型：Imagen 详解转角再相遇 imagen python 深度学习计算机视觉
近年来，图像生成技术取得了显著进展，推动了计算机视觉和生成对抗网络（GAN）等领域的发展。Imagen是一个新兴的图像生成大模型，其在生成高质量、逼真图像方面表现出色。本文将详细讲解Imagen的基本原理、架构、训练流程及应用场景。1.Imagen的基本原理1.1什么是Imagen？Imagen是一种基于深度学习的图像生成模型，结合了自注意力机制（Self-attentionMechanism）和
像素空间文生图之Imagen原理详解 funNLPer AI算法 Imagen stable diffusion AIGC
论文：PhotorealisticText-to-ImageDiffusionModelswithDeepLanguageUnderstanding项目地址：https://imagen.research.google/代码（非官方）：https://github.com/deep-floyd/IF模型权重：https://huggingface.co/DeepFloyd/IF-I-XL-v1.0
Java 多线程编程：并发控制与线程安全 m0_72547478 java 开发语言
摘要：本文聚焦于Java多线程编程中的并发控制和线程安全问题。详细阐述了多线程编程的基本概念，包括线程的创建、启动与生命周期。深入探讨了在多线程环境下如何通过synchronized关键字、Lock接口等机制实现并发控制，确保共享资源的线程安全。同时，介绍了线程间的通信方式以及常见的线程池技术，为Java开发者在处理多线程任务时提供全面的理论与实践指导。一、引言随着计算机硬件性能的不断提升，多线程
【WRF后处理】基于wrf-python处理wrf运行结果wrfout_d01 WW、forever WRF模型原理及应用 WRF python
【WRF后处理】基于wrf-python处理wrf运行结果wrfout_d01wrf-python概述wrf-python安装wrf-python主要函数wrf-python和NCL总结WRF后处理（未使用wrf-python库）批量添加.nc后缀提取单个变量：以降水为例提取所有变量计算气压（pressure）气压计算原理WRF后处理-基于wrf-python参考WRF的模拟结果是按照指定的时间间
Redis学习：从基础到应用的全面探索来恩1003 Redis redis 学习数据库
Redis学习资料Redis学习资料Redis学习资料在当今数字化时代，数据处理与存储的效率成为众多应用的关键所在。Redis作为一款高性能的内存数据库，凭借其独特的优势，在众多领域发挥着不可或缺的作用。无论是高并发的Web应用、实时数据分析，还是缓存机制的构建，Redis都展现出了卓越的性能。下面将为你详细介绍Redis的学习路径，助你从入门走向精通。一、Redis初相识：基础概念与安装Redi
Rust实现内网穿透工具：从原理到实现余识- Rust从入门到精通 rust 开发语言
目录1.前言2.内网穿透原理3.丐版实现3.1share3.2server3.3client3.4测试4.项目优化4.1工作空间4.2代码合并4.3无锁优化4.4数据分离4.5错误处理4.6测试代码4.7参数解析本篇原文为：Rust实现内网穿透工具：从原理到实现更多C++进阶、rust、python、逆向等等教程，可点击此链接查看：酷程网1.前言rust是一门非常适合写命令行工具的语言，本文将结合
设置QToolBar中QAction的Qss样式表，以及如何设置动态变化属性 _DJ Qt-Study qt c++
介绍一下QT中QToolBar设置QAction的原理在Qt中，QToolBar是一个用于创建工具栏的小部件。它允许你将各种操作（QAction）组织在一起，并以按钮的形式显示在工具栏上。QToolBar类继承自QWidget类，它提供了一些方法和信号，用于管理和显示工具栏上的操作按钮。要将QAction设置为QToolBar上的按钮，可以使用QToolBar的addAction()方法将QAct
zookeeper分布式锁模拟12306买票有一个好名字 zookeeper 分布式 zookeeper 云原生
未加锁时容易出现重复买票情况代码publicclassTicket12306implementsRunnable{//票数privateintticketNums=10;@Overridepublicvoidrun(){while(true){if(ticketNums>0){System.out.println(Thread.currentThread()+"抢到了第"+ticketNums+"
Hadoop 和 Spark 的内存管理机制分析王子良. 经验分享 hadoop spark 大数据
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
《电子制作从零开始》第3章：电源电路制作请向我看齐 LeetCode leetcode
第3章：电源电路制作3.1直流电源基础直流电源的分类与工作原理分类：电池类直流电源：这是最常见的直流电源之一，如干电池、蓄电池等。干电池是通过化学能直接转换为电能，它的优点是携带方便、使用简单，像普通的碱性干电池，电压一般为1.5V，适用于小型电子设备，如遥控器、手电筒等。蓄电池则可以通过充电将电能储存起来，反复使用，例如铅酸蓄电池，常用于汽车、UPS（不间断电源）等设备中，它能够提供较大的电流和
实战千问2大模型第五天——VLLM 运行 Qwen2-VL-7B（多模态）学术菜鸟小晨千问多模型 qwen2 vl
一、简介VLLM是一种高效的深度学习推理库，通过PagedAttention算法有效管理大语言模型的注意力内存，其特点包括24倍的吞吐提升和3.5倍的TGI性能，无需修改模型结构，专门设计用于加速大规模语言模型（LLM）的推理过程。它通过优化显存管理、支持大模型的批处理推理以及减少不必要的内存占用，来提高多GPU环境下的推理速度和效率。VLLM的核心特点包括：显存高效性：VLLM能够动态管理显存，
K8S中Pod控制器之Horizontal Pod Autoscaler(HPA)控制器元气满满的热码式 kubernetes 容器云原生
HorizontalPodAutoscaler(HPA)控制器HorizontalPodAutoscaler（HPA）是Kubernetes中用于自动根据当前的负载情况，自动调整Pod数量的一种控制器。HPA能够根据CPU使用率、内存使用量或其他选择的度量指标来自动扩展Pod的数量，以确保应用的性能。HPA可以获取每个Pod利用率，然后和HPA中定义的指标进行对比，同时计算出需要伸缩的具体值，最后
使用Python实现LLM的文本生成：风格迁移与内容控制二进制独立开发 GenAI与Python 非纯粹GenAI python 开发语言人工智能自然语言处理分布式语言模型 transformer
文章目录引言1.大型语言模型（LLM）概述1.1Transformer架构1.2预训练与微调2.文本生成基础2.1无条件生成2.2条件生成3.风格迁移3.1风格迁移的基本原理3.2使用Python实现风格迁移4.内容控制4.1内容控制的基本原理4.2使用Python实现内容控制5.高级技巧与优化5.1多轮对话生成5.2生成参数优化6.应用场景与未来展望结论引言随着自然语言处理（NLP）技术的快速发
【商城系统技术选型】启山智软商城源码微信小程序小程序 java
商城系统技术选型是一个复杂但至关重要的过程，它直接关系到商城系统的性能、可扩展性、安全性以及用户体验等多个方面。以下是一些关键的技术选型考虑因素：前端技术选型框架选择：React或Vue.js等流行前端框架是不错的选择，它们具有良好的可组件化和可重用性，且社区资源丰富，有大量的插件和工具可供使用，能提高开发效率和界面的交互性。响应式设计：确保系统能自适应不同设备屏幕，如手机、平板、电脑等，提供一致
嵌入式硬件篇---PWM&电机&舵机 Ronin-Lotus 嵌入式硬件篇嵌入式硬件 c语言学习单片机 stm32 51单片机硬件工程
文章目录前言第一部分:电机1.按照工作电源分类直流电机交流电机2.按照结构原理分类同步电机异步电机有刷电机无刷电机3.按照电机的使用目的驱动电机执行电机直驱电机编码器额外小知识:第二部分：PWM1.实质2.面积等效原理3.实例舵机舵机按转动角度分1.小角度舵机（0-90°）2.中角度舵机（0-180°）3.大角度舵机（0-360°）舵机按控制方式分1.数字舵机2.模拟舵机总结前言本文简单介绍了电机
SCALA学习手册.pdf(JasonSwartz) zxfxghfd scala 学习 pdf
书:python33com(<----web)Scala概述：“Scala是‘可扩展语言’（SCAlableLanguage）的缩写，于2003年创建，为JVM平台上的函数式编程以及面向对象编程提供一个高性能开发环境。”值与变量：“值（val）是不可变、有类型的存储单元；变量（var）是可变、有类型的存储单元。”数据类型与转换：“Scala支持多种数据类型，包括Byte、Short、Int、Lon
利用双分支CycleGAN进行图像数据的高效增强 jizhi-dataset 人工智能
随着人工智能技术的快速发展，图像数据处理变得越来越重要。为了提高图像数据的质量和可用性，我们需要采用高效的数据增强方法。双分支CycleGAN网络作为一种先进的图像处理技术，为我们提供了一种全新的解决方案。本文将详细介绍双分支CycleGAN的工作原理，并展示其在图像数据增强方面的实际效果。同时，我们也将讨论在实际应用过程中可能遇到的挑战以及如何解决这些问题。，，CycleGAN是一种用于图像到图
高级java每日一道面试题-2025年01月19日-框架篇[Mybatis篇]-MyBatis 中见过什么设计模式 ? java我跟你拼了 java每日一道面试题 java mybatis 设计模式
如果有遗漏,评论区告诉我进行补充面试官:MyBatis中见过什么设计模式?我回答:1.工厂模式（FactoryPattern）定义：工厂模式是一种创建型模式，它提供了一种创建对象的最佳方式，将对象创建过程抽象化，从而提高代码的可维护性和灵活性。在MyBatis中的应用：SqlSessionFactoryBuilder和SqlSessionFactory的创建过程体现了工厂模式的应用。SqlSess
中级-面试题目整理 coder_monarch JAVA 面试 java
基础：1、抽象类和接口首先从继承角度来看，子类继承抽象类要么重写父类的全部方法，要么把自己也定义成抽象类；接口是可以实现多个的。从实例化角度看，抽象类有构造方法，但是不能实例化；接口没有构造方法，不能实例化。第二从方法观察，抽象类没有方法体，是依靠子类实现方法；接口在jdk1.7之前不能有方法的实现，在jdk1.8之后可以定义静态方法、default方法和其实现。第三从变量声明来看，抽象方法和普通
【RabbitMQ】超详细Windows系统下RabbitMQ的安装配置 m0_74823963 rabbitmq windows 分布式
RabbitMQ是一个开源的消息队列中间件，广泛用于分布式系统中的异步消息传递。它支持多种消息协议，易于扩展，功能强大。本文将详细介绍如何在Windows系统下安装和配置RabbitMQ，包括所需的依赖项、安装步骤、基本配置和常见问题解决方案。目录什么是RabbitMQ？安装前的准备2.1系统要求2.2安装ErlangRabbitMQ的安装步骤3.1下载RabbitMQ3.2安装RabbitMQ配
分布式-分布式必备理论基础：CAP和BASE 后端
一、CAP分布式系统不可能同时满足一致性（C：Consistency）、可用性（A：Availability）和分区容忍性（P：PartitionTolerance），最多只能同时满足其中两项。一致性一致性指的是多个数据副本是否能保持一致的特性，在一致性的条件下，系统在执行数据更新操作之后能够从一致性状态转移到另一个一致性状态。对系统的一个数据更新成功之后，如果所有用户都能够读取到最新的值，该系统
面试题-SpringBoot 程序员
概述说说SpringBoot和Spring的关系springboot我理解就是把springspringmvcspringdatajpa等等的一些常用的常用的基础框架组合起来，提供默认的配置，然后提供可插拔的设计，就是各种starter，来方便开发者使用这一系列的技术，套用官方的一句话，spring家族发展到今天，已经很庞大了，作为一个开发者，如果想要使用spring家族一系列的技术，需要一个一个
舵机SG90详解
舵机，也叫伺服电机，在嵌入式开发中，舵机作为一种常见的运动控制组件，具有广泛的应用。其中，SG90舵机以其高效、稳定的性能特点，成为了许多工程师和爱好者的首选，无论是航模、云台、机器人、智能小车中都有它的身影。本文将深入探讨SG90舵机的技术规格、工作原理和使用方法，为您展现SG90舵机的功能和无限可能。1.源码下载及前置阅读本文首发良许嵌入式网：https://www.lxlinux.net/e
433M无线收发模块详解
无线通信技术在现代社会中扮演着至关重要的角色，它让我们能够实现便捷的远程控制、智能家居、自动化以及各种物联网应用。无线通信技术包括WiFi、蓝牙、NFC、Zigbee、5G等等。本次我要给大家介绍无线通信技术之一的433M，从基本概念到工作原理再到实际应用。我们将逐步剖析433M模块背后的技术细节。无论您是初学者还是有一定经验的开发者，这篇文章都将为您提供全面的指导和启发，帮助您更好地了解和应用4
程序员必须掌握的消息中间件-RabbitMQ 后端
一、Rabbit概述RabbitMQ是一个开源的消息代理和队列服务器，用来通过普通协议在完全不同的应用中间共享数据，RabbitMQ是使用Erlang语言来编写的，并且RabbitMQ是基于AMQP协议的。特点：开源、性能优秀Erlang语言最初用在交换机的架构模式，这样使得RabbitMQ在Broker之间进行数据交互的性能时非常优秀的。Erlang的优点：Erlang有着和原生Socket一样
【软考速通笔记】系统架构设计师⑬——云原生架构设计理论与实践小康师兄系统架构设计师笔记系统架构云原生软考分布式容器微服务
文章目录一、前言二、云原生架构基础知识2.1定义2.2特点2.3原则三、云原生架构模式3.1服务化架构模式3.2Mesh化架构模式3.3Serverless模式3.4存储计算分离模式3.5分布式事务模式3.6可观测模式3.7事件驱动架构3.8反云原生模式四、云原生技术4.1容器技术4.2容器编排技术4.3微服务4.4无服务器技术4.5服务网格五、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

Kafka存取原理与实现分析，打破面试难关

系列文章目录

Kafka存取原理与实现分析，打破面试难关

一、主题与分区

1. 模型

2. 消息与分发

二、分区内数据的存储

1. 消息的存储

① 偏移量与日志文件

② 索引的构成

2. 消息的读取

① 消费偏移量的存储

②Compaction策略

③查找并读取消息

3. 快速存取实现

总结

你可能感兴趣的:(kafka,kafka,面试,分布式,kafka原理,kafka面试,kafka性能)