kafka学习总结

文章目录

前言
主要内容
kafka整体架构

kafka定义
架构图
名词解释

Kafka重要组件

生产者（Producer）

生产者选择分区
序列化器和发送
生产者配置

Broker

Partition Offset
message物理结构

Consumer（消费者）

消费模式
Consumer消费过程
Consumer提交偏移量
Consumer Rebalance

kafka文件存储

Segment
消息文件

zookeeper和kafka

kafka在zookeeper中的存储结构
zookeeper在Kafka中的作用
Kafka与zookeeper通信

Kafka高可用

Controller Failover
Partition Failover
Broker Failover

kafka常见问题
参考资料

前言

最近在公司内部进行了一个知识分享，主题是kafka。分享ppt我会上传放在文末。我为了准备这个分享，几乎花了完整两周时间，看了两本书，阅读了几十篇博客，从中提炼出几十页ppt拿出来演讲，分享完后总感觉自己还有很多东西没有讲出来。
这次就把我两个星期的学习成果形成博客。便于自己回顾和大家分享。

主要内容

kafka系统架构概要介绍
kafka重要组件
kafka文件存储
zookeeper与kafka
高可用kafka
kafka常见问题

kafka整体架构

kafka定义

旧：在kafka0.8.x版本的时候，kafka主要是作为一个分布式的、可分区的、具有副本数的日志服务系统, 具有高水平扩展性、高容错性、访问速度快、分布式等特性；主要应用场景是：日志收集系统和消息系统

新：0.10.x版本及以上，Kafka是一个分布式的流处理平台(数据注入功能，数据存储功能，流处理功能)

注：今天主要还是讲它作为一个消息中间件的功能作用，kafka各个版本内部处理有差异，如何分享是一个挑战。学习的时候一定要带上版本的概念，因为网上很多资料都没有说明版本，然后会造成理解偏差。我们这次主要分享新版本kafka

架构图

kafka大体架构图如下：

名词解释

Broker Kafka集群中的服务器
Topic 每条发布到Kafka集群的消息都有一个类别，这个类别被称为Topic
Partition Partition是物理上的概念，每个Topic包含一个或多个Partition
Replica Partition 的副本，保障 partition 的高可用
Producer 消息生产者负责发布消息到Kafka broker
Consumer 消息消费者，向Kafka broker读取消息的客户端
Consumer Group 每个 consumer 都属于一个 consumer group

Kafka重要组件

生产者（Producer）

生产这消息发送过程如下图：

解读
ProducerRecord：每个消息是一个ProducerRecord对象，其中Topic和Value值必填，partition和key非必填。
过程
send()方法大致过程为：
设置序列化器->设置分区->放入队列缓存->等待时机push到broker
注：
不是直接发送给服务端，而是先在客户端把消息放入队列中，然后由一个消息发送线程从队列中拉取消息，以批量的方式发送消息给服务端。 Kafka的记录收集器( RecordAccumulator)负责缓存生产者客户端产生的消息，发送线程(Sender)负责读取记录收集器的批量消息，通过网络发送给服务端。为了保证客户端网络请求的快速响应，Kafka使用选择器( Selector) 处理网络连接和读写处理，使用网络连接( NetworkClient)处理客户端网络请求。

生产者选择分区

选择分区流程图如下：

其中，散列化方法为：Utils.murmur2(keyBytes)

序列化器和发送

发送方式
新版本客户端提供两种发送方式，同步和异步：

可以发现，两个方法其实都是异步返回。
同步方式，第一种，调用send()后，马上get()，实现同步调用。
异步方式，第二种，在callback中进行内容处理，实现异步调用。

序列化器
可以使用内置序列化器，比如StringSerializer,IntegerSerializer,ByteArraySerializer等基本的序列化器。
也可以自定义，需要实现org.apache.kafka.common.serialization.Serializer接口

注：官方建议不要自定义序列化器，因为在消费端，需要使用同样的反序列化器。使用kafka自带的，可以避免很多问题。

生产者配置

kafka重要的配置文件有三个：
server.properties
broker.properties
consumer.properties
都可以去这里查看配置的意义和解释：官网配置

这里讲一下生产者重要的几个配置

acks 如果 acks 被设为 0, 那么 broker立即返回响应;acks=1,需要等待leader写入成功；如果 acks 被设为 all，那么请求会被保存在一个叫作炼狱的缓冲区里，直到首领发现所有跟随者副本都复制了消息，晌应才会被返回给客户端。
buffer.memory 设置生产者内缓存区域的大小，生产者用它缓冲要发送到服务器的消息。
compression.type 默认情况下，消息发送时不会被压缩，该参数可以设置成snappy、gzip或lz4对发送给broker的消息进行压缩
retries 生产者从服务器收到临时性错误时，生产者重发消息的次数
batch.size 发送到同一个partition的消息会被先存储在batch中，该参数指定一个batch可以使用的内存大小，单位是byte。不一定需要等到batch被填满才能发送
linger.ms 生产者在发送消息前等待linger.ms，从而等待更多的消息加入到batch中。如果batch被填满或者linger.ms达到上限，就把batch中的消息发送出去
max.in.flight.requests.per.connection 生产者在收到服务器响应之前可以发送的消息个数
其中acks尤为重要，一定要记住他的意义。

Broker

前面讲到Broker其实可以当作一个服务器来理解，它上面有很多partition和partition的副本。那么partition和副本直接的数据是如何同步呢？如下图：

这个图信息量很大，可以看出，副本与leader之间的数据同步是副本去leader那里pull的过程。生产者发送消息到broker后，会根据配置的acks值，来决定何时返回。这个acks值，就是说这里的副本复制情况。

Partition Offset

Partition是消息的分区队列，一个topic写入不用的partition，写入过程中会更新offset，过程如下：

上面图中，有几个重要的名词：
1．ISR(In-sync Replication)
ISR中的副本都要同步leader中的数据，只有都同步完成了数据才认为是成功提交了，成功提交之后才能供外界访问。
在这个同步的过程中，数据即使已经写入也不能被外界访问，这个过程是通过LEO-HW机制来实现的。
2．OSR（Out-sync Replication）
OSR内的副本是否同步了leader的数据，不影响数据的提交，OSR内的follower尽力的去同步leader，可能数据版本会落后。
最开始所有的副本都在ISR中，在kafka工作的过程中，如果某个副本同步速度慢于replica.lag.time.max.ms指定的阈值，则被踢出ISR存入OSR，如果后续速度恢复可以回到ISR中。
3．LEO
LogEndOffset：分区的最新的数据的offset，当数据写入leader后，LEO就立即执行该最新数据。相当于最新数据标识位。
4．HW
HighWatermark：只有写入的数据被同步到所有的ISR中的副本后，数据才认为已提交，HW更新到该位置，HW之前的数据才可以被消费者访问，保证没有同步完成的数据不会被消费者访问到。相当于所有副本同步数据标识位。

message物理结构

Consumer（消费者）

消费模式

谈到消费，一直以来，我们有两种消费模式，如图：

Kafka使用消费组(consumer group)统一了上面两种消息模型。Kafka使用队列模型时，它可以将处理
工作平均分配给消费组中的消费者成员;使用发布订阅模式时，它可以将消息广播给多个消费组。
采用多个消费组结合多个消费者，既可以线性扩展消息的处理能力，也允许消息被多个消费组订阅。
kafka的消费模式：

Kafka采用消费组保证了“一个分区只可被消费组中的一个消费者所消费” ，这意味着:
(1)在一个消费组中，一个消费者可以消费多个分区。
(2)不同的消费者消费的分区一定不会重复，所有消费者一起消费所有的分区。
(3)在不同消费组中，每个消费组都会悄费所有的分区。
(4)同一个消费组下消费者对分区是互斥的，而不同消费组之间是共享的。

Consumer消费过程

由图中，我们知道，kafka的消费者客户端不断德调用poll()方法去轮询，从Broker中拉取消息。
topic下的一个分区只能被同一个consumer group下的一个consumer线程来消费，但反之并不成立，即一个consumer线程可以消费多个分区的数据

Consumer提交偏移量

由图中，我们知道，新版本客户端中，消费者提交offset不再提交到zookeeper中，而是提交到Broker中的topic为_consumer_offset的分区上。

Consumer Rebalance

什么是rebalance？
rebalance本质上是一种协议，规定了一个consumer group下的所有consumer如何达成一致来分配订阅topic的每个分区。比如某个group下有20个consumer，它订阅了一个具有100个分区的topic。正常情况下，Kafka平均会为每个consumer分配5个分区。这个分配的过程就叫rebalance。
rebalance的触发条件有三种
1,组成员发生变更
2,订阅主题数发生变更
3,订阅主题的分区数发生变更

简单举个例子，假设目前某个consumer group下有两个consumer： A和B，当第三个成员加入时，kafka会触发rebalance并根据默认的分配策略重新为A、B和C分配分区，如图所示

消费组分配partition过程如图：

注：在coordinator收集到所有成员请求前，它会把已收到请求放入一个叫purgatory(炼狱)的地方

新版kafka有两个协调器：消费者协调器（ConsumerCoordinator）和组协调器（GroupCoordinator），这里图中提到的是消费者协调器？

kafka文件存储

Server.properties配置文件中，有log.dirs配置，指向的就是kafka文件存储位置。
我本机安装了一个单机版的kafka，文件如下：

文件目录解释：

__consumer_offsets 用于存储offset的分区是由kafka服务器默认自动创建的
cleaner-offset-checkpoint 存了每个log的最后清理offset
log-start-offset-checkpoint 日志可以返回给Client的最开始边界
recovery-point-offset-checkpoint 负责记录已经被写入磁盘的offset
replication-offset-checkpoint 负责记录已经被复制到别的topic上的文件(HighWatermark的)
testliyi-0 我创建的topic对应的分区0

Segment

kafka的partition其实就是一个个文件，然后kafka会根据配置把这些文件进行分段，每一段就叫做segment，如下图所示：

segment file组成：由2大部分组成，分别为index file和data file，此2个文件一一对应，成对出现，后缀".index"和“.log”分别表示为segment索引文件、数据文件.
segment文件命名规则：partion全局的第一个segment从0开始，后续每个segment文件名为上一个segment文件最后一条消息的offset值。数值最大为64位long大小，19位数字字符长度，没有数字用0填充。

消息文件

如下图，展示了index文件和log文件的内容：

文件存储大量元数据，数据文件存储大量消息，索引文件中元数据指向对应数据文件中message的物理偏移地址。其中以索引文件中元数据3,497为例，依次在数据文件中表示第3个message(在全局partiton表示第368772个message)、以及该消息的物理偏移地址为497。

下面是书上截取的更详细的过程图：

zookeeper和kafka

zookeeper是什么，大家肯定不陌生，直接上图看下我的ppt：

kafka在zookeeper中的存储结构

上面可知zookeeper是存在于内存重的类似文件节点。那么，Kafka在zookeeper内部的存储结构是怎样的呢？一图说明一切：

zookeeper在Kafka中的作用

1，配置管理（high）
Topic的配置之所以能动态更新就是基于zookeeper做了一个动态全局配置管理。
2，命名服务（normal）
Broker将advertised.port和advertised.host.name，这两个配置发布到zookeeper上的zookeeper的节点上/brokers/ids/BrokerId(broker.id),这个是供生产者，消费者，其它Broker跟其建立连接用的。
3，分布式通知（high）
比如分区增加，topic变动，Broker上线下线等均是基于zookeeper来实现的分布式通知。
4，集群管理和master选举（normal）
5，分布式锁（high）
独占锁，用于Controller的选举。（临时顺序节点创建）

Kafka与zookeeper通信

通过查看kafka源码，我们知道，Kafka使用的是zkclient（https://github.com/sgroschupf/zkclient）开源第三方客户端。通信方式为监听器。
主要有以下三种监听器：

“主题改变的监听器”( TopicChangeListener)会监听/brokers/topics/的子节点变化事件。当主题发生变化时，监听器会处理主题的增加和删除事件。比如创建主题时， Kafka会往 ZK 节点 /brokers/topics/添加子节点 /brokers/topics/[topic_name]，并触发监昕器调用 onNewTopic.creation()方法。
“分区改变的监听器”( PartitionModificationsListener)会监听 /brokers/topics/[topic] 节点的数据变化事件。当主题的分区发生变化时，监昕器会处理分区增加的事件。比如增加分区时， Kafka会修改 ZK节点 /brokers/topics/[topic_name]的数据内容。对于主题中新增的分区，监听器会调用onNewPartitionCreation()方法创建新的分区。
“代理节点改变的监听器”( BrokerChangelistener)会监听/brokers/ids的子节点变化事件。当代理节点发生变化时，监听器会处理代理节点的上线和下线事件。比如代理节点君机， Kafka会删除/brokers/ids/[boker_id]子节点，并触发监昕器调用 onBrokerFailure()方法。代理节点上线时， Kafka会创建 /brokers/ids/[broker_id]子节点，并触发监昕器调用 onBrokerStart()方法。

Kafka高可用

Controller Failover

以下是基于ZK选举器选举主控制器的流程（虽然每个代理节点都有一个控制器对象，但 Kafka集群只有一个主控制器。）

Partition Failover

副本和分区的状态：

选举过程：

如上图所示，读取OSR作为主副本会造成数据丢失。所以kafka会定时检查是否有所有ISR都为存活状态

Broker Failover

kafka常见问题

以下两个问题经常出现在面试中，但是深入学习kafka之后，你会发现，能问出这种问题的一般都不怎么懂kafka，如果你深入了解Kafka，你可以从kafka的消息着手发问，而不是问一个什么条件都没有，半小时也讲不清楚的问题。

如何保证消息不丢失
默认保证at least once
挑战两种情况：
1，auto.commit.enable=true
2，auto.commit.enable=false
如何保证有序
分区有序。如何保证全局有序？（伪命题）

参考资料

https://book.douban.com/subject/27665114/
https://book.douban.com/subject/27179953/
https://tech.meituan.com/kafka_fs_design_theory.html
http://www.cnblogs.com/cyfonly/p/5954614.html
https://blog.csdn.net/lp284558195/article/details/80297208

Apache Kafka的伸缩性探究：实现高性能、弹性扩展的关键 i289292951 kafka kafka
引言ApacheKafka作为当今最流行的消息中间件之一，以其强大的伸缩性著称。在大数据处理、流处理和实时数据集成等领域，Kafka的伸缩性为其在面临急剧增长的数据流量和多样化业务需求时提供了无与伦比的扩展能力。本文将深入探讨Kafka如何通过其独特的架构设计实现高水平的伸缩性，以及在实际部署中如何优化和利用这一特性。一、Kafka伸缩性的核心设计分区（Partitioning）与水平扩展Kafk
【二】【设计模式】建造者模式妖精七七_ 设计模式设计模式建造者模式
建造者模式的引入//C10_1.cpp#include#include"SystemConfig.h"intmain(){SystemConfigconfig("mysql://127.0.0.1/","xiaomu","xiaomumemeda","redis://127.0.0.1/","xiaomuredis","xiaomuredispw","kafka://127.0.0.1","xia
kafka-eagle 配置文件修改使用自带的数据库 bright future cheer kafka 数据库分布式
######################################multizookeeper&kafkaclusterlistSettingsprefixedwith‘kafka.eagle.’willbedeprecated,use‘efak.’instead######################################efak.zk.cluster.alias=clu
Kafka、ActiveMQ、RabbitMQ 及 RocketMQ区别比较木西爷 kafka activemq rabbitmq 阿里云 rocketmq
消息队列中间件是分布式系统中重要的组件，主要解决应用耦合、异步消息、流量削锋等问题。它可以实现高性能、高可用、可伸缩和最终一致性架构，是大型分布式系统不可缺少的中间件。消息队列在电商系统、消息通讯、日志收集等应用中扮演着关键作用，以阿里为例，其研发的消息队列（RocketMQ）在历次天猫“双十一”活动中支撑了万亿级的数据洪峰，为大规模交易提供了有力保障。常见消息中间件对比特性ActiveMQRab
MQ横向对比：RocketMQ、Kafka、RabbitMQ、ActiveMQ、ZeroMQ namelessmyth Java框架 MQ rocketmq kafka rabbitmq activemq
前言本文将从多个角度全方位对比目前比较常用的几个MQ：RocketMQKafkaRabbitMQActiveMQZeroMQ下文单独说明。表格对比特性RocketMQKafkaRabbitMQActiveMQ单机吞吐量10万级，支撑高吞吐10万级以上，甚至有文献称，可以达到单机百万级TPS。万级，同ActiveMQ万级，相对其他MQ较低。topic数量对吞吐量的影响topic可以达到几百/几千的级
Maxwell监听mysql的binlog日志变化写入kafka消费者澄绪猿 mysql kafka 数据库
一.环境：maxwell:v1.29.2(从1.30开始maxwell停止了对java8的使用，改为为11)maxwell1.29.2这个版本对mysql8.0以后的缺少utf8mb3字符的解码问题，需要对原码中加上一个部分内容：具体也给大家做了总结：关于v1.29.2版本的Maxwell存在于mysql8.0后版本部分源码字符集处理确实问题-CSDN博客二.程序这里还是那一个kafka模拟器来实
13周｜会议记录绳系
你好，我是绳系。今天是2022年3月28日。感谢你的到来，接下来，让我们一起度过愉快的阅读时光吧。今天给大家复盘一下绳系阅读群第三次会议记录。3月27日社群内部开展了一场腾讯会议，内容如下。会议主题：13周的学习总结会议时间：2022年3月27日18：00会议地址：线上腾讯会议主持人：绳系参与人：绳系阅读群部分成员（排名不分先后）东东、木子、谢琳、叶同学、Lucy、观摩、进击中的罗罗、杰怡妈、朱朱
Debezium日常分享系列之：Debezium2.5稳定版本之MySQL连接器配置示例和Connector参数详解最笨的羊羊日常分享专栏 Debezium日常分享系列 Debezium2.5稳定版本 MySQL连接器配置示例 Connector参数详解
Debezium日常分享系列之：Debezium2.5稳定版本之MySQL连接器配置示例和Connector参数详解一、MySQL连接器配置示例二、添加连接器配置三、连接器属性四、必须的连接器配置属性五、高级MySQL连接器配置属性六、Debezium连接器数据库架构历史配置属性七、用于配置生产者和消费者客户端的传递数据库架构历史属性八、Debezium连接器Kafka信号配置属性九、Debezi
Flink 批作业消费kafka wending-Y Flink 入门到实践 flink kafka 大数据
文章目录示例代码原理总是kafka数据源可以是有界数据源，也可以是无界数据源示例代码publicstaticvoidmain(String[]args){StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment();env.setParallelism
Kafka主题二三事慢一点，细一点 Kafka kafka 分布式
客户端如果订阅了多次主题，则以最后一次为主，例如consumer.subscribe(Arrays.asList(topic1));consumer.subscribe(Arrays.asList(topic2));则订阅的只有topic2。消费者订阅主题是支持正则表达式，这样如果有新topic上线，并且匹配正则，则也会消费到这个新topic的内容，比如consumer.subscribe(Pat
大数据开发（Kafka面试真题-卷一） Key-Key 大数据 kafka 面试
大数据开发（Kafka面试真题）1、请解释以下ApacheKafka是什么？它在大数据系统中的角色是什么？2、请解释以下Kafka的工作原理和它与传统消息队列服务的不同之处？3、解释以下ApacheKafka的作用以及它与常见消息队列系统（如RabbitMQ）之间的区别？4、如何使用ApacheKafka来实现实时数据流处理？5、Flinkcheckpoint和Kafkaoffset的关联是什么？
Kafka-SSL笔记整理 yicj kafka ssl 笔记
创建密钥仓库以及CA创建密匙仓库,用户存储证书文件keytool-keystoreserver.keystore.jks-aliashello_kafka-validity100000-genkey创建CAopensslreq-new-x509-keyoutca-key-outca-cert-days100000将生成的CA添加到客户端信任库keytool-keystoreclient.trust
架构:Apache Kafka Connect实现sqlserver数据实时同步管理大亨 sqlserver 中间件架构
实现ApacheKafkaConnect与SQLServer之间的实时数据同步，您可以使用KafkaConnect的JDBCSourceConnector。以下是一个基本的步骤：1.安装KafkaConnect：确保您已经安装了ApacheKafka和KafkaConnect。您可以从ApacheKafka的官方网站或其他途径获取它。2.下载JDBCDriver：获取适用于SQLServer的JD
flume集成kafka weixin_34112181 大数据 python java
2019独角兽企业重金招聘Python工程师标准>>>1.kafka的配置参照https://my.oschina.net/u/1591525/blog/22519102.flum配置在flume的conf目录下新建kafka.propertiesagent.sources=s1agent.channels=c1agent.sinks=k1agent.sources.s1.type=execage
【学习总结】Python transformers AutoTokenizer encode 出现的 101 和 102 爱学习的小道长 AI python 学习 AI编程
1.代码展示：fromtransformersimportAutoTokenizer,AutoModelmodel_name="bert-base-chinese"tokenizer=AutoTokenizer.from_pretrained(model_name)model=AutoModel.from_pretrained(model_name)print(len(tokenizer.voca
集群启动脚本西风凋丶碧树 linux
使用SSH服务，要首先确保Linux主机间ssh相互免密，配置免密可看下面：Linux主机间ssh相互免密创建kafka启动脚本vimkafka-cluster.shforiin192.168.8.105192.168.8.106192.168.8.107doecho--------------------------------$ikafka启动-------------------------
1分钟玩转Kafka 中间件小哥
说起Kafka，许多使用者对它是又爱又恨。Kafka是一种分布式的、基于发布/订阅的消息系统，其极致体验让人欲罢不能，但操心的运维、复杂的安全策略、可靠性易用性的缺失、算不上极致的性能发挥、并不丰富的消息服务功能，仍需要使用者付出诸多的背后工作。即使你是Kafka老手，也难免会有上述同样的烦恼。与其整日操心Kafka的部署，不如试试云上Kafka带给你的惊喜？目前国内主流的云服务厂商均提供了云上的
Linux基础命令的学习总结 Gnevergiveup linux
Linux基础命令vmware的三种网络模式桥接模式虚拟机占用一个独立的ip，通过虚拟交换机，直接使用物理网卡上网NAT模式使用主机ip，通过NAT设备上网仅主机模式无法上网，与其他主机隔绝配置静态ip配置成功的标志虚拟机可以上网虚拟机与主机可以相互ping通如何配置静态ip查看物理机ipipconfig-all有线上网以太网适配器无线上网无线局域网适配器WLAN100.67.14.155配置虚拟
2020-06-05《学习究竟是什么》学习总结清单5 魔域之晶
你不是在找答案，而是在做研究。通过各种方式获取信息，然后以我为主，做出自己的判断，这是做研究。三种找书方法：看推荐，看主流媒体的书评，追作者。思维导图不是整理和记忆工具，而是思考工具。思维导图更高级的用法是决策和判断。借助智能化记录和储存信息，大脑用来思考。强力研读笔记法第一，清晰表现每一章的逻辑脉络；第二，带走书中所有的亮点；第三，大量自己的看法和心得；第四，发现这本书和以前读过的其他书或文章的
springboot 连kafka 发，接消息 Perfect珈蓝 spring boot kafka linq
引入pomorg.apache.kafkakafka_2.133.7.0org.springframework.kafkaspring-kafka增加yml配置spring:kafka:bootstrap-servers:192.168.1.30:9092consumer:group-id:testack-mode:manual#生产者producer:key-serializer:org.apa
kafka（三）springboot集成kafka（1）介绍 w_t_y_y kafka spring boot linq
一、相关组件介绍1、pom：org.apache.kafkakafka-clients3.0.02、kafkaProducerproduce的发送主要流程概述如下：拦截器对发送的消息拦截处理；获取元数据信息；序列化处理；分区处理；批次添加处理；发送消息。3、KafkaConsumer二、生产者发送消息类型1、同步发送消息同步发送的意思就是，一条消息发送之后，会阻塞当前线程，直至返回ack。由于se
kafka Interceptors and Listeners 伊布拉西莫 kafka
InterceptorsProducerInterceptorhttps://www.cnblogs.com/huxi2b/p/7072447.htmlProducer拦截器(interceptor)是个相当新的功能，它和consumer端interceptor是在Kafka0.10版本被引入的，主要用于实现clients端的定制化控制逻辑。对于producer而言，interceptor使得用户
幂等性设计风清扬-独孤九剑 golang 幂等性设计软件设计
目录前言幂等性设计幂等性设计处理流程HTTP幂等性消息队列幂等性基于kafka前言幂等性设计，就是说，一次和多次请求某一个资源应该具有同样的副作用。为什么我们要有幂等性操作？说白了，就两点：1、网络的不稳定性2、服务状态不确定性，服务状态不仅有成功，失败，还有超时。超时又有多种原因引起的，有可能是网络抖动，也有可能是负载引起的。对于这种情况，需要做重试，重试的后果是服务被调用了多次，数据不对，业务
常用中间件docker安装 Happywzy~ 中间件 docker 容器
zookeeperdockerrun-d--namezookeeper-p2181:2181--restartalways-eZOO_MY_ID=1-eALLOW_ANONYMOUS_LOGIN=yes-eTZ=Asia/Shanghai-v/etc/localtime:/etc/localtimezookeeper:3.7kafka#注意：KAFKA_CFG_ADVERTISED_LISTENE
prometheus监控kafka 仙女陈 prometheus kafka 分布式
kafka_exporter下载地址：https://github.com/danielqsj/kafka_exporter/releases/download/v1.2.0/kafka_exporter-1.2.0.linux-amd64.tar.gz1.1安装kafka_exportertar-xvfkafka_exporter-1.2.0.linux-amd64.tar.gz-C/usr/l
消息队列-kafka 百晓生612 消息队列 kafka 分布式
kafka和redis的区别数据类型和用途：Kafka：Kafka是一个分布式消息队列系统，主要用于高吞吐量的消息发布和订阅。它可以用于构建实时流处理应用、日志收集和传输、事件驱动架构等场景。Redis：Redis是一个内存数据库，支持多种数据结构（如字符串、列表、哈希、集合、有序集合等），并提供持久化功能。它通常用于缓存、会话存储、实时数据处理、消息队列、发布/订阅等场景。持久化支持：Kafka
在消息队列kafka多消费者组消费同一Topic场景下的idea调试debug断点进不去的解决方案小白菜儿929 java kafka intellij-idea java
1.问题场景复现不同类型的消息发到同一个Topic中，设置多个消费者组，为每个消费者组打一个标记。每一种消费者组只能消费对应的消息类型。这样做的好处是避免设置多个Topic，简化代码开发的同时性能损耗小。问题出现在消费端，由于多个消费者组对象随着项目初始化而初始化，导致了你的断点不一定能准确打在对应的消费者上，出现的问题就是进不去断点。2.解决思路你在生产者端发送一条消息进入到kafka消息队列，
Kafka入门介绍一吴代庄 Java kafka 分布式 java
介绍Kafka是一个分布式系统，由服务器和客户端组成，通过高性能TCP网络协议进行通信。它可以部署在本地和云中的裸机硬件、虚拟机和容器上环境。服务器：Kafka作为一个或多个服务器的群集运行，这些服务器可以跨越多个数据中心或云区域。其中一些服务器构成了存储层，称为代理。其他服务器运行KafkaConnect以持续导入和导出数据作为事件流，用于将Kafka与现有系统（如关系数据库）集成，以及其他Ka
docker安装kafka和kafka-console-ui 李君临 docker kafka ui
3、安装kafkahttps://blog.csdn.net/m0_64210833/article/details/134199061kafka依赖Zookeeper,当然也可以用内置的kraft。安装前提条件1.安装Zookeeper1.1运行ZooKeeper容器2.运行Kafka容器2.1启动Kafka容器3.验证3.1进入Kafka容器3.2查看容器状态3.3查看容器日志3.4重新启动容
kafka 生产者消费者设计思考动态一时爽，重构火葬场哲学与架构 middleware kafka 分布式
生产者负载均衡生产者直接发送消息给分区leader，而不需要通过中间者进行转发。这意味着生产者需要知道哪些服务器是存活的，以及主题分区leader在哪里的元数据请求。同时这也意味着生产者可以根据情况决定发给哪个broker，那么既可以随机负载，也可以进行散列批量发送生产者会尝试收集数据，然后在单次请求中发送大量数据，以牺牲少量额外延迟来换取更好的吞吐量。消费者pushorpull?kafka选择了
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts