weixin_39560064

kafka多个消费者消费一个topic_Kafka 服务中消费者创建详解

与生产者对应的是消费者，应用程序可以通过 KafkaConsumer 来订阅主题，并从订阅的主题拉取消息。不过在使用 KafkaConsumer 之前需要了解消费者与消费组的概念，否则无法理解如何使用 KafkaConsumer。

一、消费者与消费组

消费者(Consumer)负责订阅主题(Topic)，并从订阅的主题上拉取消息。与其他消息中间间不同的是，再Kafka消费者观念里还有一层消费组(Consumer Group)。当消息发送到主题后，主题只会把消息发送给订阅它的消费组内的一个消费者。

kafka多个消费者消费一个topic_Kafka 服务中消费者创建详解_第1张图片

Kafka comsumer Group

按照Kafka的默认规则，

消费组A每个消费者分配到了 Kafka 这个主题的一个分区，

消费组B每个消费者分配到了 Kafka 这个主题的两个分区，两个消费组之间互不影响。即 Topic 中的一条消息，会被组A 和组B 分别消费一次。

每个消费者只能消费所分配到的分区中的消息。换言之，每一个分区只能被一个消费组中的一个消费者消费。

消费者和消费组间的关系

1、每个消费者都只有一个对应的消费组。

2、一个消费组可以包含一个或多个消费者。

主题和分区间的关系

1、一个主题可以有多个分区，也就是所有分区的消息集合就是主题的消息。

主题和消费组间的关系

1、一个主题可以被多个消费组订阅。

2、消费组中消费者的数目如果大于订阅的主题中分区的数目，则存在空闲的消费者(订阅不到分区)。

分区和消费者间的关系

1、每个分区中的消息只能被订阅其主题的消费组消费；分区中的消息只能被订阅得消费组中的一个消费者(组内)消费。

2、每个消费者只能消费所分配到的分区中的消息。

消费者和消费组的这种模型可以让整体的消费能力具备横向伸缩性，可以增加或减少消费者的个数来提高或减少整体消费能力。

分区分配策略可以通过消费者客户端的 partition.assignment.strategy 参数来设置消费者与订阅主题之间的分区分配策略。

对于消息中间件而已，一般有两种消息投递模式：

1、点对点(P2P，Point-to-Point)模式和发布/订阅(Pub/Sub)模式。点对点模式是基于队列的，生产者将消息发送到队列，消费者从队列接收消息。

2、发布/订阅模式定义了如何向一个内容节点发送和订阅消息，这个内容节点在Kafka中为主题(Topic)相当于一个中介，生产者发布消息到主题，而消费者消费所订阅的主题。

主题使消息的订阅者和发布者互相保持独立，不需要接触就可以进行消息的传递，发布/订阅模式在消息一对多广播时使用。Kafka同时支持这两种模式，正是得益于消费者和消费组模型的契合。

二、消费者客户端开发

一个正常的消费逻辑需要具备以下几个步骤：

配置消费者客户端参数及创建相应的消费者实例。
订阅主题
拉取消息并消费
提交消费位移
关闭消费者实例

默认配置是从订阅开始后，才开始消费新消息如果需要从起始位置消费那么需要修改消费者客户端参数。

2.1、必要的参数配置

在创建真正的消费者实例之前需要做参数配置，比如上节设置消费组名称、连接地址等。

1、bootstrap.servers：该参数的释义和生产者客户端 KafkaProducer 中的相同。

2、key.deserializer 和 value.deserializer：与生产者客户端 KafkaProducer 中的 key.serializer和value.serializer 参数对应。

3、group.id：消费者隶属的消费组的名称，默认为“”。如果设置为空会报异常。一般情况下，这个参数需要设置成具有一定的业务意义的名称。

2.2、订阅主题和分区

创建好消费者后，需要给该消费者订阅相应的主题。一个消费者可以订阅一个或多个主题。

对于消费者使用集合的方式来订阅主题而言，比较容易理解，订阅了什么主题就消费集合中的主题。如果两次订阅的主题不一样，那么以最后一次为准。

消费者不仅可以通过 KafkaConsumer.subscribe() 方法订阅主题，还可以指定订阅某些主题的特定分区。

既然有订阅，那么就有取消订阅，可以使用 KafkaConsumer 中的 unsubscribe() 方法取消主题的订阅。

2.3、反序列化

kafka 所提供的反序列化器有 ByteBufferDeserializer、ByteArrayDeserializer、BytesDeserializer、DoubleDeserializer、FloatDeserializer、IntegerDeserializer、LongDeserializer、ShortDeserializer、StringDeserializer，它们分别用于 ByteBuffer、ByteArray、Bytes、Double、Float、Integer、Long、Short 及 String 类型的反序列化，这些序列化器也都实现了 Deserializer 接口。

2.4、消息消费

Kafka 中的消费是基于拉取模式的。

消息的消费一般有两种模式：推送模式和拉取模式。推送模式是服务端主动将消息推送给消费者，而拉取模式是消费者从服务端拉取消息。

Kafka 中的消息消费就是一个不断轮询的过程，在轮询中重复调用 poll() 方法去拉取订阅的主题的消息。对于 poll() 方法而言，如果某些分区没有消息，那么此分区对应的消息拉取结果就为空；如果整个主题都没消息，那么poll() 方法的拉取结果是一个空的集合。

poll() 方法里还有一个超时时间参数 timeout，用来控制 poll() 方法的阻塞时间，在消费者的缓冲区里没有可用数据时会发生阻塞。

消费者消费到的每条消息类型为 ConsumerRecord(注意与 ConsumerRecords 的区别)，这个和生产者发送的消息类型 ProducerRecord 相对应。

2.5、移位提交

对于Kafka分区中的每条消息而言，都有一个 offset，用来表示消息在分区中对应的位置。对于消费者而言，也有一个 offset 概念，用来表示消费到分区中某个消息所在的位置。对于消息在分区中的位置，将 offset 称为“偏移量”，代表了分区储存层面。

在每次调用poll()方法的时候，返回的都是未被消费的消息集，要做到这一点就需要记录上一次消费时的消费位移。并且这个消费位移必须持久化，不能单单保存在内存中，否则消费者重启后就无法知晓之前的消费位移。并且，当有新的消费者加入时，那么必然会有再均衡动作，对于同一分区而言，它可能在再均衡动作之后分配给新的消费者，如果不持久化保存消费位移，新的消费者也就不会知道消费到哪里。

消费者客户端中，消费位移存储在Kafka内部的主题__consumer_offsets 中。这里把将消费位移存储起来的动作称之为“提交”，消费者客户端消费完消息后需要执行消费位移的提交。

在Kafka中默认的消费位移的提交方式是 自动提交 ，这个由消费者客户端参数 enable.auto.commit 配置，默认为 true这个默认的自动提交不是每次消费都会提交，而是定期提交，时间由客户端参数 auto.commit.interval.ms 配置，默认值为5秒。

自动提交在正常情况下不会出现数据重复和数据丢失等情况，但是在编程里异常无可避免，且自动提交也无法做的精准的位移管理。

在Kafka中还提供了 手动提交 的方式，手动提交的方式可以让开发人员根据程序的逻辑在合适的地方进行位移提交，这样可以使开发人员对消费位移的管理控制更加灵活。开启手动提交的前提是消费者客户端参数 enable.auto.commit 配置为false

手动提交细分为同步提交和异步提交，对应KafkaConsumer中的 commitSync() 和 commintAsync() 两种类型方法。

2.6、控制或关闭消费

KafkaConsumer 提供了对消费速度进行控制的方法，在有些场景下我们可能需要暂停某个分区的消费先消费其他分区，等条件达到的时候在恢复。KafkaConsumer 中使用 pause()和resume() 方法来分别实现暂停某些分区向客户端返回数据和恢复某些分区向客户端返回数据。

2.7、指定位移消费

如果当一个新的消费组建立的时候，根本没有可以查找的消费位移。或者消费组内的一个新消费者订阅了一个新的主题，它也没有可以查找的消费位移。(同一个分区的消息，对同一个消费组来说只能消费一次。所以当新的消费组建立或者消费者订阅了新的消费组，也就代表了该消费组在这个分区中没有位移信息。)当_consumer_offsets 主题中有关这个消费组的位移信息过期而被删除后，它也没有可以查找的消费位移。

在Kafka中，当消费者找不到所记录的消费位移时，就会根据消费者客户端参数 auto.offset.reset 的配置来决定从何处开始消费，如果值是“earliest” 那么从起始处开始，如果值是“latest”那么从末尾开始，默认值是“latest”(就是下一条要写入消息的位置)。除了查找不到消费位移，位移越界也会触发 auto.offset.reset 参数的执行。

2.8、再均衡

再均衡是指分区的所属权从一个消费者转移到另一个消费者的行为，它为消费组的高可用性和伸缩性提供保障，使消费组可以方便安全的删除或者添加组内的消费者。不过在再均衡发生期间，消费组内的消费者是无法读取信息的。也就是说，在再均衡发生期间的这一小段时间内，消费组会变的不可用。

另外，当一个分区被重新分配给另外一个消费者时，消费者当前的状态也会丢失。比如消费者消费完某个分区中的一部分信息，还没有提交消费位移就分配给了另外一个消费者，此时这个消费者会重新消费一遍，也就造成了重复消费，所以应该尽量避免不必要的在均衡发生。

2,9、消费者拦截器

消费者拦截器主要在消费到消息或者在提交消费位移的时候进行一些定制化操作。

2.10、消费者多线程实现

KafkaProducer 是线程安全的，而 KafkaConsumer 却是非线程安全的。KafkaConsumer中定义了一个 acquire() 方法用来检查当前是否只有一个线程在操作，如果有其他线程在操作那么就会抛出 ConcurrentModifcationException 异常。

KafkaConsumer 所有公用方法在执行之前都会调用 acquire() 方法，只有 wakeup() 方法例外。

消费者多线程的实现方式

KafkaConsumer 非线程安全并不意味着消费的时候只能以单线程的方式进行。如果生产者发送消息的速度大于消费者处理消息的速度，那么就会有越来越多的消息不能及时消费，消费就会有一定的延迟。除此之外，由于Kafka中消息保留机制的作用，很可能造成有些消息还未被消费就被清理，从而造成消息丢失。我们可以通过多线程的方式来实现消息消费，多线程的目的就是为了提高整体消费能力。

第一种也是常见的一种：线程封闭，也就是为每个线程实例化一个 KafkaConsumer对象。

一个线程对应一个 KafkaConsumer示例，称之为消费线程。一个消费线程可以消费一个或多个分区中的消息，所有的消费线程都属于一个消费组。这种实现方式的并发度取决于分区数量，根据之前介绍的消费者与分区数的关系，当消费线程的数量大于分区数的时候就会有部分消费线程一直处于空闲状态。

第二种：多个消费者同时消费同一个分区，这个通过 assign() –订阅特定主题的某个分区、seek() –指定位移消费等方法实现，这样可以打破原有的消费线程数不能超过分区数的限制，进一步提高消费能力。不过这这种实现方式对于位移提交和顺序控制的处理会变的非常复杂，实际应用中使用的极少，并不推荐使用。

第三种将处理消息模块改成多线程实现方式，如果对消息的处理非常迅速，那么poll()拉取的频次也会同步提高，整体消费能力也会提示；

相反，如果消息处理慢，比如进行一个事务性操作或者等待一个RPC的同步响应，那么poll()拉取的频次也会随之下降，那么整体消费能力就会下降。

其实，poll()拉取是非常快的，消费速度的瓶颈就在于消费处理的速度。

三、重要的消费者参数

1.fetch.min.bytes

Consumer 在一次拉取请求中能从 Kafka中拉取的最小数据量，默认值1(B)。

kafka在收到 Consumer 的拉取请求时，如果返回给 Consumer的数据量小于这个设置，那么就会等待，直达数据量达到配置的大小。可以适当调整这个参数的值以提高吞吐量，不过也会造成额外的延迟。

2.fetch.max.bytes

与 fetch.min.bytes对应，配置 Consumer 在一次拉取请求中从 Kafka 中拉取的最大数据量，默认值为 52428800(B)，也就是50MB。

如果这个参数设置的值比任何一条写入 Kafka 中的消息要小，那么会不会造成无法消费呢？很多资料对此参数的解读认为是无法消费的，比如一条消息的大小为10B，而这个参数的值是1(B)，既然此参数设定的值是一次拉取请求中所能拉取的最大数据量，那么显然1B<10B，所以无法拉取。这个观点是错误的，该参数设定的不是绝对的最大值，如果在第一个非空分区中拉取的第一条消息大于该值，那么该条消息将仍然返回，以确保消费者继续工作。也就是说，在这种情况下只会返回这一条record。

与此相关的，Kafka 中所能接收的最大消息的大小通过服务端参数 message.max.bytes(对应于主题端参数 max.message.bytes)来设置。

3. fetch.max.wait.ms

这个参数也和 fetch.min.bytes 参数有关，如果 Kafka 仅仅参考 fetch.min.bytes 参数的要求，那么有可能会一直阻塞等待而无法发送响应给 Consumer，显然这是不合理的。

fetch.max.wait.ms 参数用于指定 Kafka 的等待时间，默认值为500(ms)。如果 Kafka 中没有足够多的消息而满足不了 fetch.min.bytes 参数的要求，那么最终会等待500ms。这个参数的设定和 Consumer 与 Kafka 之间的延迟也有关系，如果业务应用对延迟敏感，那么可以适当调小这个参数。

4. max.partition.fetch.bytes

这个参数用来配置从每个分区里返回给 Consumer 的最大数据量，默认值为1048576(B)，即1MB。

这个参数与 fetch.max.bytes 参数相似，只不过前者用来限制一次拉取中每个分区的消息大小，而后者用来限制一次拉取中整体消息的大小。同样，如果这个参数设定的值比消息的大小要小，那么也不会造成无法消费，Kafka 为了保持消费逻辑的正常运转不会对此做强硬的限制。

5.max.poll.records

这个参数用来配置 Consumer 在一次拉取请求中拉取的最大消息数，默认值为500(条)。

如果消息的大小都比较小，则可以适当调大这个参数值来提升一定的消费速度。

6. connections.max.idle.ms

这个参数用来指定在多久之后关闭闲置的连接，默认值是540000(ms)，即9分钟。

7. exclude.internal.topics

Kafka 中有两个内部的主题：consumer_offsets 和 __transaction_state。

exclude.internal.topics 用来指定 Kafka 中的内部主题是否可以向消费者公开，默认值为 true。如果设置为 true，那么只能使用 subscribe(Collection)的方式而不能使用 subscribe(Pattern)的方式来订阅内部主题，设置为 false 则没有这个限制。

8. receive.buffer.bytes

这个参数用来设置 Socket 接收消息缓冲区(SO_RECBUF)的大小，默认值为65536(B)，即64KB。如果设置为-1，则使用操作系统的默认值。

如果 Consumer 与 Kafka 处于不同的机房，则可以适当调大这个参数值。

9. send.buffer.bytes

这个参数用来设置Socket发送消息缓冲区(SO_SNDBUF)的大小，默认值为131072(B)，即128KB。

与receive.buffer.bytes参数一样，如果设置为-1，则使用操作系统的默认值。

10. request.timeout.ms

这个参数用来配置 Consumer 等待请求响应的最长时间，默认值为30000(ms)。

11. metadata.max.age.ms

这个参数用来配置元数据的过期时间，默认值为300000(ms)，即5分钟。

如果元数据在此参数所限定的时间范围内没有进行更新，则会被强制更新，即使没有任何分区变化或有新的 broker 加入。

13. retry.backoff.ms

这个参数用来配置尝试重新发送失败的请求到指定的主题分区之前的等待(退避)时间，避免在某些故障情况下频繁地重复发送，默认值为100(ms)。

14. isolation.level

这个参数用来配置消费者的事务隔离级别。

字符串类型，有效值为“read_uncommitted”和“read_committed”，表示消费者所消费到的位置，如果设置为“read_committed”，那么消费者就会忽略事务未提交的消息，即只能消费到LSO(LastStableOffset)的位置，默认情况下为“read_uncommitted”，即可以消费到 HW(High Watermark)处的位置。

C++ 地图 + 配对组合！3 分钟吃透 map 和 pair 的黄金搭档 Reese_Cool STL 数据结构与算法 c++算法开发语言 stl
文章目录pair一、基本概念二、pair的声明与初始化三、成员访问与修改四、常用操作1.比较运算2.交换值3.tie函数（解包pair）五、pair的应用场景六、pair与结构体/类的对比七、pair与tuple的对比八、代码示例1.返回多个值2.存储键值对九、总结map一、基本概念二、map的声明与初始化三、常用操作四、map的应用场景五、注意事项在C++编程里，map和pair是标准库中十分实
TSL 和 SSL 是什么？它们有何关系？恶霸不委屈网络服务器运维
1.SSL（SecureSocketsLayer）定义：SSL（安全套接层）是一种早期的加密协议，用于在互联网通信中保障数据传输的安全性。它通过加密和身份验证机制，确保客户端（如浏览器）与服务器之间的通信不被窃听或篡改。版本：SSL1.0（未发布）、SSL2.0（1995年，已废弃）、SSL3.0（1996年，已淘汰）。问题：SSL3.0及早期版本存在严重安全漏洞（如POODLE攻击），目前已被现
LLM之向量数据库Chroma milvus FAISS maxmaxma 数据库 milvus faiss
以下是Chroma、Milvus和FAISS的核心区别，从功能定位、架构设计、性能及应用场景等维度进行对比：一、功能定位Chroma轻量级向量数据库：专注于快速构建中小型语义搜索原型，提供简单易用的API，适合快速集成到现有应用中。特点：支持近似最近邻搜索（ANN）、实时性能优化，但对大规模数据处理能力有限。Milvus分布式向量数据库：专为超大规模向量数据设计，支持云原生架构和高可用性，适合企业
【第22节】windows网络编程模型(WSAAsyncSelect模型) 攻城狮7号 Windows编程(C++)windows 网络编程 windows编程 windows sdk c++
目录引言一、WSAAsyncSelect模型概述二、WSAAsyncSelect模型流程2.1自定义消息2.2创建窗口例程2.3初始化套接字2.4注册网络事件2.5绑定和监听2.6消息循环三、完整示例代码引言在网络编程的广袤天地中，高效处理网络事件是构建稳定应用的关键。WSAAsyncSelect模型作为一种独特且实用的网络编程模型，为开发者提供了异步处理网络事件的有力手段。它巧妙地将Window
Windows Server 2025 使用 IIS 搭建 ASP.NET 3.5 网站少湖说编程实践 asp.net windows
开启远程桌面参考文章Windowsserver开启远程桌面教程打开服务管理器。ECS配置安全组，开启3389Telnet验证网络联通性telnetx.x.x.x338安装WindowsApp，登录验证安装ASP.NET3.51.参考文章WindowsServer2012安装.NETFramework3.5和WindowsServer2012上安装.NETFramework3.5打开服务器管理器，选
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
Unity编辑器扩展快速回顾托塔1 Unity知识快速回顾 unity 编辑器游戏引擎
知识点来源：总结人间自有韬哥在，唐老狮，豆包目录1.自定义菜单栏拓展1.1.Editor文件夹用途1.2.添加自定义页签1.3.Component菜单加脚本1.4.Inspector脚本右键菜单1.5.快捷键设置2.自定义窗口扩展2.1.创建窗口类2.2显示窗口2.3.窗口事件回调函数2.4.窗口中常用的生命周期函数2.5.编辑器窗口类中的常用成员3.EditorGUI3.1.EditorWind
html.partial mvc5,[ASP.NET Core Razor Pages系列教程]ASP.NET Core Razor Pages中的Partial Views(部分视图)(04)... 安静的小屁孩儿 html.partial mvc5
PartialViews(部分视图)什么是PartialViews?PartialViews(之后统称:部分视图)是包含了HTML代码片段和服务端代码的Razor文件，它同样以.cshtml为扩展名。部分视图可以被包含在任意数量的页面或者布局中。部分视图可以用来将复杂的页面分解成更小的单元，从而减少复杂性，同时也可以在团队开发中被复用。什么时候使用部分视图(PartialViews)部分视图可以处
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
HarmonyOS Next 应用性能优化实战 SameX-4869 harmonyos 性能优化华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中应用性能优化的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、性能评估指标与工具（一）关键性能评估指标CPU使用率CPU使用率是衡量应用在运行过程中对CPU资源占用情况的重要指标。一个高效的Ha
Axios 和跨域这两个概念 PLJJ685 前后端分离的仓库管理系统前端
1.Axios是什么？Axios是一个用于发送网络请求的工具，类似于浏览器自带的fetch，但更强大、更易用。在前端（Vue）中，我们通常用Axios来向后端（SpringBoot）请求数据。举个例子：假设你在一个仓储系统中，前端需要从后端获取商品库存信息。这时，前端就可以用Axios发送一个请求，比如：axios.get('/api/inventory').then(response=>{con
SpringBoot集成Flink-CDC，实现对数据库数据的监听 rkmhr_sef 面试学习路线阿里巴巴 spring boot flink 数据库
一、什么是CDC？CDC是ChangeDataCapture（变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。二、Flink-CDC是什么？CDCConnectorsforApacheFlink是一组用于ApacheFlink的源连接器，使用变更数据捕获(CDC)从
HarmonyOS Next 企业级移动办公应用构建 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）在企业级移动办公应用构建中的应用，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。第一章：应用场景与架构规划一、常见应用场景及要求任务管理在企业办公中，任务管理是核心场景之一。员工需要能够创建任务，详细描述任务
11.网络编程的基础知识就很对网络 linux
11.网络编程的基础知识**1.OSI模型与TCP/IP模型****2.IP地址分类****3.Socket编程****4.TCP三次握手与四次挥手****5.常用网络测试工具****6.练习与作业****7.总结**1.OSI模型与TCP/IP模型OSI模型（开放系统互联模型）：7层结构：应用层：为网络用户提供各种服务（如HTTP、FTP）。表示层：数据加密解密、压缩解压缩。会话层：管理进程会话
5.进程基本概念就很对 java 服务器 linux
5.进程基本概念**1.进程的基本概念****2.进程与程序的区别****3.进程的状态****4.进程调度****5.进程相关命令****6.进程创建与管理****7.进程的应用场景****8.练习与作业****9.进程的地址空间****10.进程的分类****11.进程的并发与并行****12.总结**1.进程的基本概念进程：进程是程序执行的过程，操作系统会为其分配内存资源和CPU调度。PCB
uni-app 与webView 互相传值九亿少女无法触及的梦ى uni-app
uni-app向webView传值在uni-app传值有多种实现方式，主要推荐evalJS，次要webSorcket重点：1.webView要找到正确的children！如果页面中只有一个webView标签则直接可以currentWebview.children()[0]2.H5页面中的监听function必须写在全局，不要写在任何load事件中！//index.vueletcurrentWebv
大数据技术实战---项目中遇到的问题及项目经验一个“不专业”的阿凡大数据
问题导读：1、项目中遇到过哪些问题？2、Kafka消息数据积压，Kafka消费能力不足怎么处理？3、Sqoop数据导出一致性问题？4、整体项目框架如何设计？项目中遇到过哪些问题7.1Hadoop宕机（1）如果MR造成系统宕机。此时要控制Yarn同时运行的任务数，和每个任务申请的最大内存。调整参数：yarn.scheduler.maximum-allocation-mb（单个任务可申请的最多物理内存
RK3588开发笔记-buildroot添加telnet服务 flypig哗啦啦 RK3588 buildroot busybox
目录前言一、Telnet服务背景与适用场景二、telnet服务开启Busybox配置三、固件编译及烧录RK3588烧录验证客户端连接测试3.1Linux/MacOS连接3.2Windows连接总结前言本文主要介绍在RK3588SDK文件包中添加telnet服务，由于sdkbuildroot默认添加的是ssh服务，如用户需要主动开启telnet，则需要另外在busybox中开启telnetd服务，下
Github上神仙级大模型项目：大语言模型(LLM)入门学习路线图，三个月让你从大模型基础到精通！ AI大模型-大飞 github 语言模型学习人工智能 AI大模型程序员 AI
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
verilog中何时使用begin—end 0基础学习者 verilog学习数字ic verilog fpga
当条件语句（如if,elseif,或者case）后面只有一条语句时，可以直接书写该语句而无需使用begin和end。然而，如果需要执行多条语句，则必须通过begin和end将这些语句组合成一个块状结构。使用begin和end的情况：always@(posedgeclkornegedgereset_n)beginif(!reset_n)begin//这里if下面执行了两句话所以需要再if语句里面再嵌
深入解析Flink Kafka Connector的分布式流数据采集架构与底层实现数据与算法架构提升之路 #Flink flink kafka conector 源码
目录1.FlinkKafka连接器的分布式流采集架构1.1架构组成1.2分布式流模型2.数据分区分配策略3.为什么重写序列化和偏移量管理3.1与Flink分布式架构集成3.2与Flink检查点机制集成同时承接多级并行架构3.3OffsetsInitializer与细粒度偏移量控制3.4与Flink的Source接口统一4.版本兼容性管理5.有界流处理支持5.1实现原理5.2API使用示例5.3多种
抗积分饱和（Anti-Windup）常见的处理方法鹿屿二向箔控制算法
抗积分饱和（Anti-Windup）是PID控制中防止积分项在输出受限时过度累积的关键技术。以下是主要方法及其实现步骤：1.积分限幅（IntegralClamping）原理：直接限制积分项的最大/最小值。实现：integral=max(min(integral+error*dt,integral_max),integral_min)优点：简单易实现。缺点：需合理设置限幅值，可能影响动态性能。2.积
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
安卓 vs iOS 文件系统深度解析：开放自由与封闭安全的终极博弈 jingling1007 Android android ios 安全安全性测试
安卓和iOS的差异远不止于界面和生态，它们的文件系统设计更是体现了两种截然不同的技术哲学。安卓的开放目录允许用户“为所欲为”，而iOS的沙盒机制则像一座密不透风的堡垒。本文将通过技术细节对比、真实场景案例、用户操作指南，深度剖析两大系统的核心设计，回答一个关键问题：谁的设计更能平衡自由与安全？一、文件系统架构：从根目录到沙盒1.安卓：Linux的开放基因目录结构全景根目录（/）：包含所有系统层级（
鸿蒙NEXT开发【崩溃监测实践】开发运维沙人防火历飞雨开发日常 harmonyos 运维华为鸿蒙鸿蒙系统性能优化
概述崩溃（Crash）指的是应用程序在运行过程中突然停止运行或出现错误导致程序无法正常继续执行。崩溃率作为衡量应用质量的重要指标之一，监测崩溃点，解决崩溃问题，对维护应用的稳定性有着诸多方面的意义：用户体验：崩溃会直接影响用户体验，操作程序时突然Crash，可能导致用户不再打开应用、卸载应用。用户留存率：在同质化的市场竞争中，稳定的应用程序能够吸引用户并提高用户留存率，而崩溃率低就意味着应用的稳定
ARPG 游戏战斗系统设计详解小宝哥Code Unity引擎游戏
ARPG游戏战斗系统设计详解ARPG（ActionRole-PlayingGame，动作角色扮演游戏）的战斗系统需要兼顾操作性、打击感、技能组合、AI交互等多个方面。本指南将详细解析ARPG战斗系统的核心要素、设计思路与优化方案，适用于Unity、UE4及自研引擎开发。1.ARPG战斗系统的核心要素1.1战斗核心机制即时战斗（Real-TimeCombat）：无回合制，玩家实时控制角色进行攻击、闪
Vue3前端开发：组件化设计与状态管理 caihuayuan4 面试题汇总与解析 spring sql java 大数据课程设计
Vue3前端开发：组件化设计与状态管理一、Vue3组件化设计组件基本概念与特点是一款流行的JavaScript框架，它支持组件化设计，这意味着我们可以将页面分解成多个独立的组件，每个组件负责一部分功能，通过组件的嵌套和复用，可以快速构建复杂的用户界面。组件化设计具有以下特点：组件示例组件选项在上面的代码示例中，我们通过Vue.component方法注册了一个名为my-component的组件，这是
AJAX（Asynchronous JavaScript and XML）详解与应用风亦辰739 javascript ajax xml
一、什么是AJAX？AJAX（AsynchronousJavaScriptandXML，异步JavaScript和XML）是一种用于创建异步Web应用程序的技术。它可以在不重新加载整个网页的情况下，与服务器进行数据交换，从而提供更好的用户体验。1.1AJAX的核心特点异步通信：数据请求不会阻塞页面，提升用户体验。减少服务器负担：只获取需要的数据，减少流量。提升用户体验：网页响应速度更快，减少页面刷
如何解决Vue组件间传递数据的问题？几何心凉 vue.js 前端 javascript
文章目录1.引言2.常用数据传递方式2.1父子通信：Props与$emit父向子传递数据子向父传递数据2.2兄弟组件通信：共享父组件或全局事件总线通过共同父组件全局事件总线（EventBus）2.3跨级组件通信：Provide/Inject2.4全局状态管理：Vuex3.总结1.引言在实际开发中，Vue组件之间的数据传递是最常见的需求。由于组件的作用域相互独立，如何在父子、兄弟和跨级组件间传递数据
数据结构二叉树进阶 z一一m 数据结构数据结构算法
1.根据二叉树创建字符串1.题目2.分析原理要把二叉树元素按照前序顺序取出来，并且以字符串的形式返回，还要添加括号对于左子树和右子树，那么第一步就是向定义一个string类型来接收取出的元素，需要用到to_string函数把整型变成string类型，第二步就是递归来深度遍历了，但是需要判断一下，题目有些情况是省略了括号，有些没有省去，题目例子可以知道左为空右不为空就不能省略括号，左不为空右为空就可
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL