熟透的蜗牛

Kafka如何保证数据的可靠性&Kafka集群

一、Kafka数据存储方式

名词解释

分区分步示意图

Kafka数据存放

Kafka如何通过offset查找到Message

二、Kafka如何确保数据不丢失

三、Kafka可以支持高吞吐量的原因

四、Kafka选举策略

什么是ISR

什么是LEO、LSO、HW、LW

数据更新过程

Follwer同步数据

分区 Leader故障转移&选举策略

一、Kafka数据存储方式

名词解释

Broker：Kafka节点，一个Kafka节点就是一个broker，多个broker可以组成一个Kafka集群

Topic：一类消息，消息存放的目录即主题，例如page view日志、click日志等都可以以topic的形式存在，Kafka集群能够同时负责多个topic的分发

message： Kafka中最基本的传递对象。

Partition：topic物理上的分组，一个topic可以分为多个partition，每个partition是一个有序的队列

每个分区都有一台 server 作为 “leader”，零台或者多台server作为 follwers 。leader server 处理一切对 partition （分区）的读写请求，而follwers只需被动的同步leader上的数据。当leader宕机了，followers 中的一台服务器会自动成为新的 leader。

Replica：副本，为实现备份的功能，保证集群中的某个节点发生故障时，该节点上的 Partition 数据不丢失，且 Kafka 仍然能够继续工作，Kafka 提供了副本机制，一个 Topic 的每个分区都有若干个副本，一个 Leader 和若干个 Follower。

Segment：partition物理上由多个segment组成，每个Segment存着message信息

Producer : 生产者，生产message发送到topic

Consumer : 消费者，订阅topic并消费message, consumer作为一个线程来消费

Consumer Group：消费者组，一个Consumer Group包含多个consumer

Offset：偏移量，理解为消息partition中的索引即可

分区分步示意图

创建一个6个分区，3个副本的topic

    @Bean
    public NewTopic myTopic() {
        return new NewTopic("my-topic-partition", 6, (short) 3);
    }

通过ZKtools可知几个分区分步如下。工具下载地址，免费下载哦 zktools.rar-桌面系统文档类资源-CSDN下载

   partition1：{"controller_epoch":4,"leader":1,"version":1,"leader_epoch":0,"isr":[1,3,2]}
   partition2：{"controller_epoch":4,"leader":2,"version":1,"leader_epoch":0,"isr":[2,1,3]}
   partition3：{"controller_epoch":4,"leader":3,"version":1,"leader_epoch":0,"isr":[3,2,1]}
   partition4：{"controller_epoch":4,"leader":1,"version":1,"leader_epoch":0,"isr":[1,2,3]}
   partition5：{"controller_epoch":4,"leader":2,"version":1,"leader_epoch":0,"isr":[2,3,1]}
   partition6：{"controller_epoch":4,"leader":3,"version":1,"leader_epoch":0,"isr":[3,1,2]}

其中controller_epoch表示的是当前的kafka控制器，leader表示当前分区的leader副本所在的broker的id编号，version表示版本号（当前半本固定位1），leader_epoch表示当前分区的leader纪元，isr表示变更后的isr列表（后面解释什么ISR）。

由图可见，每一个Broker都冗余了每个分区的数据。我们称为副本机制。这样有以下优点

提供数据冗余：即使有Broker宕机，系统依然能够继续运转不会丢失数据，因而增加了整体可用性以及数据持久性。
提供高伸缩性：支持横向扩展，能够通过添加机器的方式来提升读的性能，进而提高读操作吞吐量。
改善数据局部性：允许将数据放入与用户地理位置相近的地方，从而降低系统延时。

Kafka数据存放

在一个分区中，会将一个大的分区拆分n多个不同小segment文件，每个segment文件存放我们该分区日志消息。在每个segment中会有.index、.log。在默认的情况下，每个segment文件容量最大是为1073741824KB(1024MB)，如果超过的情况下依次内推，产生一个新的segment文件,可以通过修改配置文件log.segment.bytes=1073741824修改。

00000000000000000000.index-----消息偏移量索引文件

00000000000000000000.log-----消息持久化内容

如上图假如第一个分区存放的offset到1000，那么下一个文件的命名从上一个offset位置结束的位置开始。

如下图是文件存储的样子

总结：每个分区是由多个segment组成，每个segment由多个index和多个log文件组成，并且是按照一定的顺序存放数据的。

命名规则

每个segment file也有自己的命名规则，每个名字有20个字符，不够用0填充，每个名字从0开始命名，下一个segment file文件的名字就是，上一个segment file中最后一条消息的索引值。在.index文件中，存储的是key-value格式的，key代表在.log中按顺序开始顺序消费的offset值，value代表该消息的物理消息存放位置。但是在.index中不是对每条消息都做记录，它是每隔一些消息记录一次（稀疏索引），避免占用太多内存。即使消息不在index记录中，在已有的记录中查找，范围也大大缩小了。

如何查看Kafka日志和index文件

#index
./bin/kafka-run-class.sh kafka.tools.DumpLogSegments --files /kafka/kafka-logs-689fb31d544a/my-topic-partition-1/00000000000000000000.index

#log
./bin/kafka-run-class.sh kafka.tools.DumpLogSegments --files /kafka/kafka-logs-689fb31d544a/my-topic-partition-1/00000000000000000000.log

Index文件

Log文件

Kafka如何通过offset查找到Message

首先根据二分查找法找到对应的segment文件。
通过二分查找找到对应的.index索引文件中position的值。
通过稀疏索引在log文件中查找对应的message信息。

小结：

1、topic是逻辑概念，partition是物理概念。
2、.log文件存放实际数据，生产者的数据都会追加到.log文件中。
3、为防止.log文件过大导致数据定位效率低下，kafka采取了分片（segment）和稀疏索引机制，将partition分为多个segment，分别进行索引。
4、.index文件存储大量的索引信息，.log文件存储大量的数据，索引文件中的元数据指向对应数据文件中Message的物理偏移地址。

二、Kafka如何确保数据不丢失

生产者的ack机制

向 Kafka 写数据时，producers 设置 ack 是否提交完成。

0：不等待broker返回确认消息，效率高可能丢失数据。
1：leader副本保存成功返回，当leader还没有将数据同步到Follwer宕机，存在丢失数据的可能性。
-1：(all): 所有副本都保存成功返回设置 “ack = all” 并不能保证所有的副本都写入了消息。

注意：默认情况下，当 acks = all 时，只要 ISR 副本同步完成，就会返回消息已经写入。例如，一个 topic 仅仅设置了两个副本，那么只有一个 ISR 副本，那么当设置acks = all时返回写入成功时，剩下了的那个副本数据也可能数据没有写入。

消费者的offset commit

消费者通过offset commit 来保证数据的不丢失，kafka自己记录了每次消费的offset数值，下次继续消费的时候，会接着上次的offset进行消费。kafka并不像其他消息队列，消费完消息之后，会将数据从队列中删除，而是维护了一个日志文件，通过时间和储存大小进行日志删除策略。默认情况下每隔 5分钟（log.retention.check.interval.ms=300000）会检测一次是否有日志文件需要删除。日志文件会保留log.retention.hours=168小时（7天），当日志文件超过（log.retention.bytes=1073741824）1024MB（与时间保留策略独立）都会进行删除。如果offset没有提交，程序提交之后，会从上次消费的位置继续消费，有可能存在重复消费的情况。

Offset Reset 三种模式

earliest（最早）：当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，从头开始消费
latest(最新的)：当各分区下有已提交的offset时，从提交的offset开始消费；无提交的offset时，消费新产生的该分区下的数据
none(没有)：topic各分区都存在已提交的offset时，从offset后开始消费；只要有一个分区不存在已提交的offset，则抛出异常

broker的副本机制

每个broker中的partition我们一般都会设置有replication（副本）的个数，生产者写入的时候首先根据分发策略（有partition按partition，有key按key，都没有轮询）写入到leader中，follower（副本）再跟leader同步数据，这样有了备份，也可以保证消息数据的不丢失。

三、Kafka可以支持高吞吐量的原因

1、顺序读写：基于磁盘的随机读写确实很慢，但磁盘的顺序读写性能却很高，一些情况下磁盘顺序读写性能甚至要高于内存随机读写。（Kafka的message是不断追加到本地磁盘文件末尾的，而不是随机的写入，这使得Kafka写入吞吐量得到了显著提升。）

2、Page Cache:为了优化读写性能，kafka利用了操作系统本身的page cache,就是利用操作系统自身的内存而不是JVM空间内存，这样做的好处是：

a：避免Object消耗：如果是使用java堆，java对象的内存消耗比较大，通常是所存储数据的两倍甚至更多。

b：避免GC问题：随着JVM中数据不断增多，垃圾回收将会变得复杂与缓慢，使用系统缓存就不会存在GC问题。

通过操作系统的page cache,kafka的读写操作基本上是基于内存的，读写速度得到了极大的提升。

3、零拷贝:（不使用的时候，数据在内核空间和用户空间之间穿梭了两次），使用零拷贝技术后避免了这种拷贝。通过这种 “零拷贝” 的机制，Page Cache 结合 sendfile 方法，Kafka消费端的性能也大幅提升。这也是为什么有时候消费端在不断消费数据时，我们并没有看到磁盘io比较高，此刻正是操作系统缓存在提供数据。

4、分区分段+索引：topic 中的数据是按照一个一个的partition即分区存储到不同broker节点的，每个partition对应了操作系统上的一个文件夹，partition实际上又是按照segment分段存储的，这也非常符合分布式系统分区分桶的设计思想。kafka的message消息实际上是分布式存储在一个一个segment中的，每次文件操作也是直接操作的segment。为了进一步的查询优化，kafka又默认为分段后的数据文件建立了索引文件，就是文件系统上的.index文件.这种分区分段+索引的设计，不仅提升了数据读取的效率，同时也提高了数据处理的并行度。

5、批量读写：Kafka数据读写也是批量的而不是单条的。在向Kafka写入数据时，可以启用批次写入，这样可以避免在网络上频繁传输单个消息带来的延迟和带宽开销。假设网络带宽为10MB/S，一次性传输10MB的消息比传输1KB的消息10000万次显然要快得多。

6、批量压缩：

在很多情况下，系统的瓶颈不是CPU或磁盘，而是网络IO，对于需要在广域网上的数据中心之间发送消息的数据流水线尤其如此。进行数据压缩会消耗少量的CPU资源,不过对于kafka而言,网络IO更应该需要考虑。

如果每个消息都压缩，但是压缩率相对很低，所以Kafka使用了批量压缩，即将多个消息一起压缩而不是单个消息压缩
Kafka允许使用递归的消息集合，批量的消息可以通过压缩的形式传输并且在日志中也可以保持压缩格式，直到被消费者解压缩
Kafka支持多种压缩协议，包括Gzip和Snappy压缩协议

Kafka速度的秘诀在于，它把所有的消息都变成一个批量的文件，并且进行合理的批量压缩，减少网络IO损耗，通过mmap提高I/O速度，写入数据的时候由于单个Partion是末尾添加所以速度最优；读取数据的时候配合sendfile直接暴力输出。

四、Kafka选举策略

什么是ISR

简单来说，分区中的所有副本统称为 AR (Assigned Replicas)。所有与leader副本保持一定程度同步的副本（包括leader副本在内）组成 ISR (In Sync Replicas)。 ISR 集合是 AR 集合的一个子集。消息会先发送到leader副本，然后follower副本才能从leader中拉取消息进行同步。同步期间，follow副本相对于leader副本而言会有一定程度的滞后。 “一定程度同步“ 是指可忍受的滞后范围，这个范围可以通过参数进行配置。于leader副本同步滞后过多的副本（不包括leader副本）将组成 OSR （Out-of-Sync Replied）由此可见，AR = ISR + OSR。正常情况下，所有的follower副本都应该与leader 副本保持一定程度的同步，即AR=ISR，OSR集合为空。

什么是LEO、LSO、HW、LW

LEO：LEO是Log End Offset的缩写，它表示了当前日志文件中下一条待写入消息的offset。上图的LEO分别是8、6、9

LSO：Log Stable Offset。这是 Kafka 事务的概念。如果你没有使用到事务，那么这个值不存在(其实也不是不存在，只是设置成一个无意义的值)。该值控制了事务型消费者能够看到的消息范围。就是消费者只能消费到事务被提交的消息。

HW：分区ISR集合中的每个副本都会维护自身的LEO，而ISR集合中最小的LEO即为分区的HW，对消费者而言只能消费HW之前的消息，HW之后的消息消费者是消费不到的。

LW：Low Watermark的缩写，俗称“低水位”，代表AR集合中最小的logStartOffset值（日志起始位移值）。上图中的LW都是从1开始的。

数据更新过程

更新记录进入主副本节点处理，为该记录分配Sn（Serial Number），然后将该记录插入prepare list，该list上的记录按照sn有序排列；
主副本节点将携带sn的记录发往从节点，从节点同样将该记录插入到prepare list；
一旦主节点收到所有从节点的响应，确定该记录已经被正确写入所有的从节点，那就将commit list向前移动，并将这些消息应用到主节点的状态机；
主节点提交后即可给客户端返回响应，同时向所有从节点发送消息，告诉从节点可以提交刚刚写入的记录了。所有的读需要全部发往主节点，这是因为客户端来读时，主节点有可能尚未将commit消息发送至从，因此，如果读从节点可能会无法获取最新数据。

Follwer同步数据

首先，Follower 发送 FetchRequest 请求给 Leader。接着，Leader 会读取底层日志文件中的消息数据，再更新它内存中的 Follower 副本的 LEO 值，更新为 FetchRequest 请求中的 fetchOffset 值。最后，尝试更新分区高水位值（HW ）。Follower 接收到 FETCH 响应之后，会把消息写入到底层日志，接着更新 LEO 和 HW 值。

Kafaka的复制机制不是完全的同步复制，也不是单纯的异步复制，事实上，同步复制要求所有能工作的Follower副本都复制完，这条消息才会被确认为成功提交，这种复制方式影响了性能。而在异步复制的情况下， follower副本异步地从leader副本中复制数据，数据只要被leader副本写入就被认为已经成功提交。在这种情况下，如果follower副本都没有复制完而落后于leader副本，如果突然leader副本宕机，则会造成数据丢失。Kafka正是使用这种ISR的方式有效的权衡了数据可靠性与性能之间的关系。

分区 Leader故障转移&选举策略

Kafka会选择一个 broker 作为 “controller”节点。 controller 节点负责检测 brokers 级别故障,并负责在 broker 故障的情况下更改这个故障 Broker 中的 partition 的 leadership 。这种方式可以批量的通知主从关系的变化，使得对于拥有大量partition 的broker ,选举过程的代价更低并且速度更快。如果 controller 节点挂了，其他存活的 broker 都可能成为新的 controller 节点。

Kafka的选举策略大致分一下几种情况

OfflinePartition Leader 选举:每当有分区上线时，就需要执行 Leader 选举。所谓的分区上线，可能是创建了新分区，也可能是之前的下线分区重新上线。这是最常见的分区 Leader 选举场景。
ReassignPartition Leader 选举:当你手动运行 kafka-reassign-partitions 命令，或者是调用 Admin 的 alterPartitionReassignments 方法执行分区副本重分配时，可能触发此类选举。假设原来的 AR 是[1，2，3]，Leader 是 1，当执行副本重分配后，副本集合 AR 被设置成[4，5，6]，显然， Leader 必须要变更，此时会发生 Reassign Partition Leader 选举。
PreferredReplicaPartition Leader 选举:当你手动运行 kafka-preferred-replica- election 命令，或自动触发了 Preferred Leader 选举时，该类策略被激活。所谓的 Preferred Leader，指的是 AR 中的第一个副本。比如 AR 是[3，2，1]，那么， Preferred Leader 就是 3。
ControlledShutdownPartition Leader 选举:当 Broker 正常关闭时，该 Broker 上的所有 Leader 副本都会下线，因此，需要为受影响的分区执行相应的 Leader 选举。

这 4 类选举策略的大致思想是类似的，即从 AR 中挑选首个在 ISR 中的副本，作为新 Leader。

参考：

https://blog.csdn.net/sillyzhangye/article/details/86181345

https://blog.csdn.net/qq_26838315/article/details/106883256

https://www.cnblogs.com/18800105616a/p/13863254.html

Windows下Go语言环境搭建和使用 go语言学习基地 GO语言学习 golang windows 开发语言
简介go语言是一种开源的、语法精简的静态编程语言，它的开源社区比较庞大，应用场景非常广范。可以用于系统监控、容器技术(Docker)、大数据、存储技术、分布式系统(HyperledgerFabric)、消息系统(Kafka客户端)、服务器管理、安全工具、Web工具等。这里介绍在Linux上安装并配置go。下载go安装包到GoLang中国：https://golang.google.cn/dl/下载
RabbitMQ架构设计原理 T_karine RabbitMQ java 开发语言
一、什么是消息中间件消息中间件基于队列模型实现异步/同步传输数据。作用：可以实现支撑高并发、异步、解耦、流量削峰。优点：由于RabbitMQ是erlang语言开发的，具有天生抗高并发的性能，吞吐量达到万级。1、什么是异步将一个任务中比较耗时的业务逻辑代码使用异步的方式去执行，可以提高响应速度。2、什么是解耦耦合：所谓耦合，指系统各功能、模块之间具有依赖性，依赖性越强、耦合度就越高，维护成本也就越高
Kakfa客户端SSL访问kafka 浪漫至死不渝1 kafka ssl 分布式
博主最近在做安全治理，遇到了相当多的坑，现在我进行整理，提供一个可行的kafka的SSL访问开启kafka的ssl访问1首先创建你的私钥与证书，在kafka所在的主机，运行如下命令：keytool-keystoreserver.keystore.jks-aliaslocalhost-validity365-genkey这一步会生成一个有效期为365天，别名localhost，存有你的私钥和证书的文
STM32（hal库）通过MQTT协议连接onenet sea1216 ESP8266 STM32cubemx onenet 物联网 stm32 hal onenet mqtt
在中国移动物联网平台onenet，选择用多协议的mqtt旧版协议新建产品和设备。然后根据自己的情况更改程序中的参数。数据流上传时要根据自己的数据将程序中固定的更改为动态赋值就好了。本程序参考超级大洋葱806的STM32CubeMXESP8266AT指令实现MQTT协议并接入阿里云IOT平台源码解析【附Github源码地址】一、esp8266驱动我将esp8266设置为station透传模式#inc
Kafka ACL（访问控制列表）介绍王多鱼的梦想～ Kafka修炼手册 kafka 分布式安全 apache 运维
文章目录KafkaACL（访问控制列表）介绍1.KafkaACL的基本概念1.1KafkaACL的目标1.2KafkaACL的组成部分2.Kafka支持的资源类型2.1Topic（主题）2.2ConsumerGroup（消费者组）2.3Cluster（集群）2.4TransactionalId（事务ID）2.5DelegationToken（委托令牌）2.6ACL管理与资源类型的结合3.Kafka
linux的apache安装,Apache Kylin | 安装指南姜白的树洞 linux的apache安装
软件要求Hadoop:2.7+,3.1+(sincev2.5)Hive:0.13-1.2.1+HBase:1.1+,2.0(sincev2.5)Spark(可选)2.3.0+Kafka(可选)1.0.0+(sincev2.5)JDK:1.8+(sincev2.5)OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+在HortonworksHDP2.2-2.6and3.0,C
Kafka 单机和集群环境部署教程闲人编程大数据集群部署教程 kafka 分布式集群部署单机 zookeeper
目录一、Kafka单机环境部署1.环境准备2.安装Java3.安装ZooKeeper3.1下载并解压ZooKeeper3.2配置ZooKeeper3.3启动ZooKeeper3.4验证ZooKeeper是否正常运行4.安装Kafka4.1下载并解压Kafka4.2配置Kafka4.3创建日志目录4.4启动KafkaBroker4.5验证Kafka是否正常运行5.Kafka单机部署的注意事项二、Ka
Kafka SASL/SCRAM介绍王多鱼的梦想～ Kafka修炼手册 kafka 分布式 apache 安全
文章目录KafkaSASL/SCRAM介绍1.SASL/SCRAM认证机制2.SASL/SCRAM认证工作原理2.1SCRAM认证原理2.1.1密码存储和加盐2.1.2SCRAM认证流程2.2SCRAM认证的关键算法2.3SCRAM密码存储2.4SCRAM密码管理3.配置和使用KafkaSASL/SCRAM3.1Kafka服务器端配置3.2创建SCRAM用户并设置密码3.3Kafka客户端配置3.
Kafka中文文档圣心 kafka 分布式
文章来源：https://kafka.cadn.net.cn什么是事件流式处理？事件流是人体中枢神经系统的数字等价物。它是为“永远在线”的世界奠定技术基础，在这个世界里，企业越来越多地使用软件定义和automated，而软件的用户更多的是Software。从技术上讲，事件流式处理是从事件源实时捕获数据的做法如数据库、传感器、移动设备、云服务和流形式的软件应用程序事件;持久存储这些事件流以供以后检索
Kafka SASL/PLAIN介绍王多鱼的梦想～ Kafka修炼手册 kafka 分布式安全
文章目录KafkaSASL/PLAIN介绍1.SASL/PLAIN简介2.配置步骤（1）Kafka服务器端配置（2）Kafka客户端配置（3）测试连接3.认证过程3.1SASL/PLAIN认证工作原理3.2认证过程描述4.安全性考虑4.1SASL/PLAIN的安全问题4.2保障SASL/PLAIN安全性的方案4.3SASL/PLAIN的安全性处理场景5.SASL/PLAIN适用场景介绍5.1简单场
docker-compose部署MongoDB&MySQL&RabbitMQ集群靖子甘 docker docker mysql rabbitmq mongodb 云服务
在三个节点：172.29.154.8、172.29.154.9、172.29.154.10部署MongoDB1主2从副本集、RabbitMQ主-主、MySQL主-从复制。这些节点是在同一个内网环境下的，节点间互通，各节点部署的服务器关系如下表，其中，MySQL的主节点是172.29.154.9，与其他的服务反过来了，目的是减轻单节点的压力。本文采用docker-compose同时启动多台服务，如果
kafka下载安装、简易实例、遇到的错误解决诸葛名义 kafka linux hadoop zookeeper
目录kafk实例错误解决WARN[ConsumerclientId=consumer-1,groupId=console-consumer-94437]Connectiontonode-kafka启动：Nativememoryallocation(mmap)failedtomap1073741824bytesforcommittingreservedmemorkafka下载地址：https://m
Kafka 下载安装及使用总结 GreyFable 开发技术及框架 kafka 分布式
1.下载安装官网下载地址：ApacheKafka下载对应的文件上传到服务器上，解压tar-xzfkafka_2.13-3.7.0.tgz目录结果如下├──bin│└──windows├──config│└──kraft├──libs├──licenses└──site-docs官方文档：ApacheKafkakafka有两种启动方式，ZooKeeper和KRaft，这里采用KRaft的方式，使用k
【技海登峰】Kafka漫谈系列（一）Kafka服务集群的核心组件阿阿阿安【独家专栏】知识星球同步专享优质好文 kafka 分布式 java
【技海登峰】Kafka漫谈系列（一）Kafka服务端的核心组件一.Broker完整的Kafka服务是集群Cluster结构，其由多个Kafka服务节点组成，每个物理节点即称为Broker，在实际部署中，每个Broker节点都是一个Kafka实例的服务进程。Broker是Kafka实际的运行单元，负责请求处理、数据同步、存储主题/分区/消费偏移量等元数据信息，多个Broker分布式部署在不同机器上，
Java与Kafka：消息队列使用指南墨瑾轩一起学学Java【一】java kafka linq
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣大家好呀！今天我们要来聊聊如何使用Java语言与ApacheKafka搭建消息队列系统。Kafka是一款分布式流处理平台，它能够高效地处理大量实时数据。无论是构建实时数据分析系统还是简单的消息队列应用，Kafka都能胜任。那么，我们就开始吧！什么是Kafka？
Kafka 监控及使用 JMX 进行远程监控的安全注意事项流华追梦 Kafka kafka Kafka监控 kafkamonitoring kafka使用jmx jmx远程监控 messageinrate requestrate
目录一.前言二.Kafka监控（KafkaMonitoring）2.1.概览2.2.使用JMX进行远程监控的安全注意事项一.前言众所周知，Kafka的集中式设计具有很强的耐用性和容错性。此外，由于Kafka是一个分布式系统，因此Topic在多个节点之间进行分区和复制。此外，Kafka可以成为数据集成的极具吸引力的选择，具有有意义的性能监控和对问题的及时警报。基本上，当对Kafka问题进行故障排除时
docker-compose kafka安装及外部访问不到kafka问题 1010739073 Docker kafka docker
文章目录一、docker-compose.yml二、kafkamanager/kafka-manager连接zookeeper三、PHP生产者、消费者连接总结一、docker-compose.ymlversion:'3'services:zookeeper:image:bitnami/zookeepercontainer_name:zoorestart:alwaysports:-8181:2181
如何自己设计一个类似 Dubbo 的 RPC 框架？码农小旋风后端
面试题如何自己设计一个类似Dubbo的RPC框架？面试官心理分析说实话，就这问题，其实就跟问你如何自己设计一个MQ一样的道理，就考两个：你有没有对某个rpc框架原理有非常深入的理解。你能不能从整体上来思考一下，如何设计一个rpc框架，考考你的系统设计能力。面试题剖析其实问到你这问题，你起码不能认怂，因为是知识的扫盲，那我不可能给你深入讲解什么kafka源码剖析，dubbo源码剖析，何况我就算讲了，
【RabbitMQ】RabbitMQ持久化泡芙冰淇淋ya RabbitMQ rabbitmq
一、简介RabbitMQ的持久化机制是一种确保数据在RabbitMQ服务重启或异常情况下不会丢失的重要特性。RabbitMQ的持久化主要包括三个方面的内容：交换器的持久化、队列的持久化、消息的持久化。二、交换器的持久化1、实现方式在RabbitMQ中，实现交换器持久化的主要方式是在声明交换器时，将durable参数设置为true。这个参数告诉RabbitMQ，这个交换器应该被持久化到磁盘上，以便在
RabbitMQ消息持久化 jackwade666 rabbitmq 分布式
消息持久化如何保障RabbitMQ服务停掉以后消息生产者发送过来的消息不丢失。默认情况下RabbitMQ退出或由于某种原因崩溃时，会忽视队列和消息，除非告知它不要这样做。确保消息不会丢失需要做两件事：需要将队列和消息都标记为持久化。一、队列持久化创建的队列如果是非持久化的，如果rabbitmq重启队列就会被删除。如果需要持久化只要把durable设置为true就可以把队列持久化了。Queue.De
RabbitMQ高级特性 - 非持久化 / 持久化（交换机、队列、消息）陈亦康面试总结 rabbitmq ruby 分布式
文章目录RabbitMQ持久化机制概述实现非持久化（交换机、队列、消息）实现持久化（交换机、队列、消息）RabbitMQ持久化机制概述前面讲到了生产者消息确认机制和消费者消息确认机制，保证了消息传输的可靠性，但是这还不够，试想如果Broker突然崩溃，那么所有的交换机、队列、消息不就全部都没了（RabbitMQ以内存为主，硬盘为辅，默认交换机和队列都是非持久化的）.因此需要持久化机制.a）交换机持
RabbitMQ持久化队列配置修改问题 S-X-S Bug rabbitmq 分布式
文章目录1.问题产生2.问题解决1.询问gpt2.独立思考1.问题产生我在给一个普通队列去绑定死信交换机和死信队列的时候，发现总是报错x-dead-letter-exchange的属性为noneERROR[PFTID:][Module:defaultModule]org.springframework.amqp.rabbit.connection.CachingConnectionFactory-
OVN – OVN OpenStack(二) cuibin1991 OpenStack 网络
OpenStacknetworking-ovn项目为Neutron提供了一个基于ML2的OVN插件，它使用OVN组件代替了各种Neutron的Pythonagent，也不再使用RabbitMQ，而是基于OVN数据库进行通信：使用OVSDB协议来把用户的配置写在NorthboundDB里面，ovn-northd监听到NorthboundDB配置发生改变，然后把配置翻译到SouthboundDB里面，
日常题解——LCA和RMQ1 xiaowang524 深度优先算法图论
Tarjan算法：DFS+并查集求LCARMQ查询区间最大最小值，st（动态规划写法）dfs序/dfn序->使用dfn编号构建的dfs序，在dfs序上rmq查询区间最小值得到的就是lca的编号，映射得到的是节点板子话不多说，贴代码这个代码没有具体的建树，只有核心的代码原理和代码实现，建树用python的邻接表最方便，遍历子节点部分参照Python遍历邻接表逻辑理解publicclassLCA_RM
Kafka 之详解(Detailed Explanation of Kafka） Linux运维老纪奋力拼搏让企业网站更好 kafka 分布式
一、Kafka简介ApacheKafka是一款分布式发布-订阅消息系统，由LinkedIn公司在2010年贡献给Apache基金会，并成为顶级开源项目。它有着独特的定位与特点，是一种快速、可扩展，且内在设计就是分布式、分区的以及可复制的提交日志服务。需要注意的是，Kafka并未遵循JMS规范，仅提供发布和订阅这一通讯方式。其官方中文网站为http://kafka.apachecn.org/quic
Caused by: java.io.NotSerializableException: org.apache.kafka.common.metrics.MetricConfig Slient-猿 flink flink kafka
flink自定义数据源的开发过程中遇到这样一个错误。错误原因：在于KafkaConsumer的初始化放在了定义处。解决：应该放在open方法内初始化。DataStreamSourcedataStreamSource=env.addSource(newKafkaSourceFunction());//获取数据kafka消费数据获取DataStreamSourcedata=env.addSource(
面试官：Kafka是什么，它有什么特性与使用场景？字节全栈_rJF kafka linq wpf
坐上了进京的大巴车，车子缓缓开动，我的内心五味杂陈，这一去不知道几天才能找到工作，晚上不知道去哪里落脚呢。车子越来越堵，我就知道快要到了，看着窗外慢慢从破旧平房转变成了高楼大厦，我不由得感慨，什么时候这里才能有我的一席之地啊。二、面试==================================================================进了京我一刻也不敢停歇，马上找到要
分布式微服务系统架构第89集：kafka消费者掘金-我是哪吒分布式微服务系统架构 kafka 架构
那么消费者是如何提交偏移量的呢？消费者往一个叫作_consumer_offset的特殊主题发送消息，消息里包含每个分区的偏移量。如果消费者一直处于运行状态，那么偏移量就没有什么用处。不过，如果消费者发生崩溃或者有新的消费者加入群组，就会触发再均衡，完成再均衡之后，每个消费者可能分配到新的分区，而不是之前处理的那个。为了能够继续之前的工作，消费者需要读取每个分区最后一次提交的偏移量，然后从偏移量指定
flume系列之：消费Kafka集群Topic报错java.io.IOException: Can‘t resolve address: data03:9092 快乐骑行^_^ flume flume系列消费Kafka集群Topic OException resolve address
flume系列之：消费Kafka集群Topic报错java.io.IOException:Can'tresolveaddress:data03:9092Causedby:java.nio.channels.UnresolvedAddressException一、flume消费Kafka集群Topic报错二、报错原因三、解决方法一、flume消费Kafka集群Topic报错21Sep202214:5
最新性能测试:Kafka、Pulsar 和 Pravega 哪个最强? 起码有故事程序员软件测试 IT 程序人生测试工程师单元测试软件测试 python
本文会对Pravega进行性能评估，重点关注读写性能。1简介为了对比不同的设计选择，我们还额外展示了来自其它系统的性能结果：ApacheKafka和ApachePulsar。Pulsar和Kafka最初都被作为优秀的消息系统而为人熟知，但它们最近都做出了很大努力向存储系统方向发展，这两个系统最近都新增了分层存储的特性。然而，它们的设计选择具有根本性的不同，并导致了不同的行为以及性能特点。我们将会在
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

Kafka如何保证数据的可靠性&Kafka集群

一、Kafka数据存储方式

名词解释

分区分步示意图

Kafka数据存放

Kafka如何通过offset查找到Message

二、Kafka如何确保数据不丢失

三、Kafka可以支持高吞吐量的原因

四、Kafka选举策略

什么是ISR

什么是LEO、LSO、HW、LW

数据更新过程

Follwer同步数据

分区 Leader故障转移&选举策略

你可能感兴趣的:(MQ消息中间件,kafka)