涂有

Kafka 深入浅出

深入浅出

broker：每个Kafka实例叫一个broker，每个broker可以轻松处理数千个分区和每秒数百万的消息量
分区：一个分区属于一个broker，这个分区叫做主分区，同时分区可以分布在多个broker上面，这些分区叫做分区复制，如果主分区失效，其他分区接管主导权。分区复制只能发生在单个集群中。
保留策略：保留一段时间（比如7天），如果超时一定大小就删除旧消息，每个topic可以配置单独的保留策略
分组订阅：每条消息保证在分组中只会被消费一次
默认会自动创建topic的情况：1、生产者写入消息；2、消费者消费消息；3、客户端获取topic元信息
Kafka客户端要自己负责把生产和消费请求发到正确的broker上面，否则会收到一个“非首领”错误，这是客户端会从任意一个broker获取并更新自己的元信息

服务器配置

使用1024以下端口，需要使用root权限
默认端口号9092

auto.create.topics.enable=false #关闭自动创建topic
log.retention.bytes=xxx #是设置每个分区最大保留大小，而不是topic维度

操作系统配置

# 页面缓存配置
vm.swappiness=1
vm.dirty_ratio=60~80
vm.dirty_background_ratio=5

# 网络配置
net.core.wmem_default=128K #socket写缓冲大小
net.core.rmem_default=128K #socket读缓冲大小
net.core.wmem_max=2M #socket写缓冲最大值
net.core.rmem_max=2M #socket读缓冲最大值
net.ipv4.tcp_wmem=4k 64K 2M #tcp socket配置
net.ipv4.tcp_rmem=4k 64K 2M

net.ipv4.tcp_window_scaling=1 #启动tcp时间窗口
net.ipv4.tcp_max_syn_backlog=1024 #设置并发连接数
net.core.netdev_max_backlog=1000 #设置最大排队等待数

生产者

发送消息的三种方式：

发送不管结果，直接返回
同步发送，send方法返回Future，调用get阻塞
异步发送，send方法指定回调函数

如果发送嫌慢，可以采用多线程

如何保证发送不丢失消息：
就是不能不管send的结果就直接返回，要通过get或者添加回调函数来处理失败的情况，失败后记录日志或保存到数据库

配置

client.id
acks=[0 | 1 | all] #0不等待直接返回，1首领节点成功就返回，all全部成功才返回
retries=n #收到服务器的错误，重试次数
retry.backoff.ms=n #重试时间间隔
buffer.memory=n #内存缓冲大小
compression.type=[snappy | gzip | lz4] #snappy占用较少cpu来提高可观的压缩比，gzip占用内存大压缩比高
batch.size=n #一批可发送的最大数量
linger.ms #发送前的等待时间，增加吞吐量，增加延迟
max.in.flight.requests.per.connection=n #生成者在收到服务器响应前可以发送多少条消息，设置为1可以保证顺序写入
max.block.ms #调用send和partitionsFor的最大阻塞时间
max.request.size #一批次发送消息的最大值
send.buffer.bytes=n #设置tcp缓冲大小,-1则使用操作系统的默认值

高性能-写入

Kafka的特性之一就是高吞吐率，但是Kafka的消息是保存或缓存在磁盘上的，一般在磁盘上读写数据性能是不高的，但kafka可以轻松支持每秒百万级的写入请求，主要是采用了顺序写入和MMFile(memory mapped files, 内存映射文件, 简称mmap)

顺序写

因硬盘寻址相对读写耗时, 每次读写都会寻址->写入, 随机I/O(RDB很多都是随机I/O)要比顺序I/O慢很多. 为了提高读写硬盘的速度, kafka就是使用顺序I/O. 这样省去了大量的内存开销(减少jvm垃圾回收)以及节省了IO寻址的时间.
但是单纯的使用顺序写入, kafka的写入性能也不可能和内存(寻址读写速度远远高于硬盘)进行对比, 因此Kafka的数据并不是实时的写入硬盘中

MMAP

kafka充分利用了操作系统分页存储来利用内存提高I/O效率. mmap称为内存映射文件, 在64位操作系统中一般可以表示20G的数据文件
它的工作原理是直接利用操作系统的pagecache实现磁盘文件到物理内存的直接映射. 完成MMP映射后, 用户对内存的所有操作会被操作系统自动的刷新到磁盘上，极大地降低了IO使用率. (用户将不直接把数据写入磁盘, 而是写入内存(pagecache)中, pagecache数据会被系统定时(间隔由系统参数配置)刷写进磁盘)
直接写入硬盘, 速度慢, 但安全; 使用pagecache, 速度快, 但操作系统宕机(断电)会丢失数据(应用(用户态)挂掉不影响, pagecache是内核态, 数据依然会被操作系统刷入硬盘)

消费者

同一个消费组里面，消费者大于分区数会导致一些消费者被闲置，不能收到消息，因为一个分区只能由消费组中一个消费者消费，因此分区数量决定了并发消费的上限
当消费者增加和删除消费者时，会发生再均衡导致一小段时间不会消费消息（再均衡：在同一个消费组当中，分区所有权从一个消费者转移到另一个消费者）
订阅消息可以使用正则表达式匹配topic
唯一一次消费解决方案：使用数据库保存offset，处理逻辑和保存offset在同一个事物里面。offset通过ConsumerRebalanceListener监听和获取偏移量并设置要读取的开始偏移量
consumer.wakeup()退出poll()，是consumer唯一一个线程安全的方法

Runtime.getRuntime().addShutdownHook(new Thread() {
    public void run() {
        consumer.wakeup();
    }
});

独立消费者：只有一个消费者消费数据，因为消费组有再均衡的问题，为了避免这个问题，可以使用如下API：

List partitionInfoList = consumer.partitionsFor(ProducerTest.topic);
        List topicPartitionList = partitionInfoList.stream()
                .map(item -> new TopicPartition(item.topic(), item.partition()))
                .collect(Collectors.toList());
        consumer.assign(topicPartitionList);

        while(true) {
            ConsumerRecords poll = consumer.poll(Duration.ofMillis(100));
            for (ConsumerRecord record : poll) {
                System.out.printf("topic:%s,partition:%d,key:%s,content:%s\n",
                        record.topic(),
                        record.partition(),
                        record.key(),
                        record.value());
            }
            consumer.commitSync();
        }

Kafka使用零复制技术，直接把消息从系统内核态发送到网络通道，而不需要经过内核态到用户态的拷贝
在消息还未复制完成时，消息者不会消费到这些消息，所以消费速度受到副本复制快慢的影响
如果中间有些消息想先不处理，可以调用pause保存到缓冲区，调用resume()开始从轮询里面获取新数据
基于键的分区，在之后调整分区数量是很困难，所以基于键的分区最好一开始就计算好分区数量

消费者配置

fetch.min.bytes=x #返回的数据大小至少xx，否则阻塞等待到有这么多数据
fetch.max.wait.ms=x #指定最大阻塞等待时间，默认500ms
max.partition.fetch.bytes=x #一次poll，从一个分区能拉取的最大大小
session.timeout.ms=x #会话过期时间，如果过期就被认定为消费者挂掉了
auto.offset.reset=[latest | earliest] #在没有偏移量的情况，指定消费其实位置（最前或者最后）
enable.auto.commit=true #是否自动提交偏移量
auto.commit.interval.ms=100 #设置自动提交偏移量的频率
max.poll.records=n #单次poll最大的返回最大记录数
receive.buffer.bytes=n #设置tcp缓冲大小,-1则使用操作系统的默认值

高性能-读取

kafka服务器在响应客户端读取时, 使用ZeroCopy技术, 直接将需要读取的数据从内核空间的磁盘中传递输出, 而无需将数据读取并拷贝到用户空间, 再进行传输

传统IO操作

用户进程调用read等系统调用向操作系统发出IO请求,请求读取数据到自己的内存缓冲区中.自己进入阻塞状态
操作系统收到请求后, 进一步将IO请求发送磁盘
磁盘驱动器收到内核的IO请求,把数据从磁盘读取到驱动器的缓冲中.此时不占用CPU.当驱动器的缓冲区被读满后,向内核发起中断信号告知自己缓冲区已满
内核收到中断,使用CPU时间将磁盘驱动器的缓存中的数据拷贝到内核缓冲区中
如果内核缓冲区的数据少于用户申请的读的数据, 重复步骤3跟步骤4, 直到内核缓冲区的数据足够多为止
将数据从内核缓冲区拷贝到用户缓冲区, 同时从系统调用中返回. 完成任务

引入DMA(协处理器)后

用户进程调用read等系统调用向操作系统发出IO请求，请求读取数据到自己的内存缓冲区中。自己进入阻塞状态。
操作系统收到请求后，进一步将IO请求发送DMA。然后让CPU干别的活去。
DMA进一步将IO请求发送给磁盘。
磁盘驱动器收到DMA的IO请求，把数据从磁盘读取到驱动器的缓冲中。当驱动器的缓冲区被读满后，向DMA发起中断信号告知自己缓冲区已满。
DMA收到磁盘驱动器的信号，将磁盘驱动器的缓存中的数据拷贝到内核缓冲区中。此时不占用CPU。这个时候只要内核缓冲区的数据少于用户申请的读的数据，内核就会一直重复步骤3跟步骤4，直到内核缓冲区的数据足够多为止。
当DMA读取了足够多的数据，就会发送中断信号给CPU。
CPU收到DMA的信号，知道数据已经准备好，于是将数据从内核拷贝到用户空间，系统调用返回。

zero copy

文件在磁盘中数据被copy到内核缓冲区
从内核缓冲区copy到内核与socket相关的缓冲区
数据从socket缓冲区copy到相关协议引擎发送出去

Kafka原理

分区

何为分区：就是一个topic的数据，分散存储在多个broker中，这样就可以避免一个topic把broker给占满的情况，同时分区可以提高吞吐量，比如一个客户端的消费速度是50M/S,要达到每秒1G/S的吞吐量，就需要1000/50=20个分区

分区策略

默认采用轮询broker(round-robin)的方式，先分主分区，再分副本分区；分区数=2为例: 第1条去0分区, 第2条去1分区, 第3条去0分区, 仅仅达到负载均衡

hash, 每条record根据key的hash值对分区数取模(去哪个分区= hash(record的key) % 分区数 ), 决定该record存放哪个分区

分段

每个分区又分为多个片段，每个片段默认1G或者1周的数据量，每个片段是一个文件
正在写入的片段叫活跃片段，永远不会被删除

数据管道Connect

适用于以Kafka为中心，把Kafka的数据转存或者其他地方存到Kafka的场景，比如mysql发到Kafka，Kafka发到ES
提供仅一次语义
支持数据池Data Sink
Kafa支持数据加密（SASL）

管理Kafka

主题管理

创建分区

kafka-topics.sh --zookeeper zkStr --create --topic test --replication-factor 2 --partitions 8 #如果放置存在报错，可以加--if-not-exists

增加分区

只能增加分区，不能减少分区，因为减少分区会出现消息乱序，如果一定要减少分区，只能删除整个topic

kafka-topics.sh --zookeeper zkStr --alter --topic test --partition 16

删除topic

删除topic必须broker的delete.topic.enable=true，否则删除请求将被忽略

kafka-topics.sh --zookeeper zkStr --delete --topic test

列出所有topic（简要信息）

kafka-topics.sh --zookeeper zkStr --list

列出所有topic（详细信息）

kafka-topics.sh --zookeeper zkStr --describe
--topics-with-overrides #只列出有不同于默认配置的topic
--under-replicated-partitions #列出包含不同步副本分区
--unavailable-partitions #列出没有leader的分区

消费者群组

在旧版本中，消费者群组信息保存在zk上面，用–zookeeper指定；
在新版本中，消费者群组信息保存在broker上面，用–bootstrap-server指定；
在旧版本可以删除消费者群组和偏移量信息，新的不行。

列出所有消费者群组

kafka-consumer-groups.sh --zookeeper zkStr --list

列出某个消费者群组详细信息

kafka-consumer-groups.sh --zookeeper zkStr --describe --group testGroup

字段	描述
group	分组名字
topic	分区名字
partition	分区名字
current-offset	这个群组读取的位置
log-end-offset	高水位位置
log	current-offset和log-end-offset的差距
owner	消费者id

动态配置

覆盖配置

kafka-configs.sh --zookeeper zkStr --alter --entity-type [topics | clients] --entity-name xxxx --add-config key=value[,key=value...]

列出被覆盖的配置

kafka-configs.sh --zookeeper zkStr --describe --entity-type [topics | clients] --entity-name xxxx

移除被覆盖的配置

kafka-configs.sh --zookeeper zkStr --alter --entity-type [topics | clients] --entity-name xxxx --delete-config key[,key...]

分区管理

首领选举

修改分区副本

修改复制系数

转储日志片段

副本验证

消费和生产

控制台消费者

kafka-console-consumer.sh --zookeeper zkStr --topic topicName [--from-begin] [--max-messages] [--partition] [--formatter] [--property]

控制台生产者

kafka-console-producer 
--broker-list ip:port[,ip:port] 
--topic topicName [--key-serializer] 
[--value-serializer] 
[--compression-codec [none | gzip | snappy | lz4]] #压缩方式
[--sync] #是否同步发送

Kafka Streams流式处理

什么是流式处理

请求与相应：一个请求对应一个响应，响应时长在亚秒和毫秒级

批处理：处理周期为分钟、小时、天、周、月、年等等

流式处理：流式处理范式介于上面两种范式中间，不要求在亚秒级响应，但也不能容忍第二天才返回结果。流式处理是持续的，输入的数据一直持续进行，返回的结果也是持续进行。有持续性和非阻塞特性。

流式处理概念

时间

事件时间：表示追踪时间的发生时间或者创建时间

日志追加时间：事件保存到broker的时间，这个时间一般和流式计算没有关系，除非事件没有记录事件时间，这时可以使用日志追加时间模糊代表事件时间

处理时间：指应用程序在收到事件之后开始对其进行处理的时间。因为从产生事件到处理事件中间时间不确定，所以这个时间更不可靠，尽量避免使用它

状态

本地状态：只有当前应用程序能访问，一般使用内嵌的数据库保存，优点访问速度快，不受内存大小限制

外部状态：使用外部的数据存储系统，一般是NoSQL，优势是没有容量限制，但是延迟高。大部分流式处理应该避免使用外部存储

流和表的二元性

表只关注于数据的当前状态，而流表示了数据的整个变化过程，比如，mysql的binlog就是一个事件流。大部分的数据库都提供了CDC方案（Change Data Capture）

时间窗口

窗口的大小：是统计5分钟还是10分钟内的数据

窗口的移动间隔：统计5分钟的数据，可以每1秒钟统计一次，也可以每1分钟统计一次。如果窗口大小和移动间隔相等叫做“滚动窗口”，如果窗口随每一条数据移动，这种叫做“滑动窗口”

窗口的可更新时长：有些数据可能由于网络或者服务器重启导致数据姗姗来迟，这些数据在允许的时间范围可以更新统计结果，否则忽略他们

Kafka Streams在流式计算领域应用的很少，主要在于只能处理Kafka的数据，对于其他数据源和Sink的数据只能干瞪眼。而且部署上也没有优势。

linux下消息队列详解 zy20150613 linux linux 消息队列
消息队列提供了从一个进程向另外一个进程发送一块数据的方法，每个数据块认为有一个类型（通俗说法是一个通道），但是接受通道与发送通道必须一致才能实现通信。消息队列的不足之处在于每个消息最大长度有限度，每个消息队列总字节数有限制，系统的消息队列有限制。命令：cat/proc/sys/kernel/msgmax：查看一条信息最大有多大cat/proc/sys/kernel/msgmnb：查看消息队列中信息
队列在计算机系统中的应用 AredRabbit 队列
队列在计算机系统中有广泛的应用，主要用于管理任务和处理数据流。以下是队列的一些常见应用场景：1.任务调度操作系统：操作系统使用队列管理进程调度，如先来先服务（FCFS）调度算法。线程池：线程池通过队列管理待执行任务，确保任务按顺序处理。2.数据缓冲I/O操作：队列用于缓冲输入输出数据，平衡生产者和消费者速度。网络通信：网络数据包通过队列缓冲，确保按顺序处理。3.消息传递消息队列：在分布式系统中，消
MQ和ActiveMQ浅析星星都没我亮 ActiveMQ activemq
文章目录什么是JMSMQ消息中间件应用场景异步通信缓冲解耦冗余扩展性可恢复性顺序保证过载保护数据流处理常用消息队列（ActiveMQ、RabbitMQ、RocketMQ、Kafka）比较JMS中的一些角色BrokerproviderConsumerp2ppub/subPTP和PUB/SUB简单对QueueTopicConnectionFactoryConnectionDestinationSess
ActiveMQ消息队列服务(三)监听器 chouxin3832 c#开发工具网络
在前面的示例中，我们发现消费者每次只能消费一条消息。当队列中有多条消息的时候，我们需要多次运行消费者，才能消费完这些消息。很麻烦！！！！如何解决这个问题呢？那就是使用ActiveMQ监听器来监听队列，持续消费消息。配置步骤说明创建一个监听器对象。修改消费者代码，加载监听器。第一步：创建监听器MyListener类说明：自定义监听器需要实现MessageListener接口packagecn.act
消息队列的特性与使用场景：Kafka、ActiveMQ、RabbitMQ与RocketMQ的深度剖析啊sen丶 kafka activemq rabbitmq rocketmq 分布式消息队列
在分布式系统和微服务架构中，消息队列是实现服务间通信和解耦的核心组件。Kafka、ActiveMQ、RabbitMQ和RocketMQ是当前最受欢迎的消息队列解决方案，它们各自具有独特的特性和适用场景。本文将从特性和使用场景两个维度进行对比分析，帮助读者更好地理解它们的差异，并根据实际需求选择合适的消息队列。一、特性对比（一）吞吐量与延迟-Kafka：以高吞吐量著称，适合大规模数据的批量处理。延迟
InfluxDB写入测试 PascalMing 编程 influxdb java 读写测试
早几年测试时序库时，采集数据到kafka，然后用不同数据进行存储验证。Influxdb是花时间比较多的，它的数据建模方法、读写方法都需要使用特殊的API。时间久了自己也经常忘记，把当时的测试关键代码记录下来，也方便日后查找。代码基于java编写。1、接口数据定义，clientid+tag组合必须唯一publicclassKafkaInfo{//客户端idpublicStringclientid;/
Spring Boot中使用RabbitMQ实现简单的消息发送与接收 Takumilovexu MQ java-rabbitmq rabbitmq spring boot
文章目录环境准备1.RabbitMQ的基础配置2.实现消息发送功能3.实现消息接收功能4.总结在微服务架构和分布式系统中，消息队列是实现异步通信和解耦的重要工具。RabbitMQ作为一种常见的消息中间件，广泛应用于消息传递、任务分发等场景。本文将带你一步步实现如何在SpringBoot应用中使用RabbitMQ进行消息的发送和接收。我们将构建一个消息发送者（Publisher）和一个消息接收者（C
RabbitMQ 高级特性：从 TTL 到消息分发的全面解析（下） ngioig RabbitMQ ruby 开发语言后端
RabbitMQ高级特性RabbitMQ高级特性解析：RabbitMQ消息可靠性保障（上）-CSDN博客RabbitMQ高级特性：从TTL到消息分发的全面解析（下）-CSDN博客引言RabbitMQ作为一款强大的消息队列中间件，在分布式系统中发挥着至关重要的作用。除了基本的消息收发功能外，它还具备许多高级特性，如TTL、死信队列、延迟队列、事务和消息分发等。本文将详细介绍这些高级特性。1.TTL（
kafka生成者发送消息失败报错：RecordTooLargeException 青椒1013 kafka 分布式
kafka生成者发送消息典型案例生产者发送消息失败：Failedtosend;nestedexceptionisorg.apache.kafka.common.errors.RecordTooLargeException:Themessageis1053512byteswhenserializedwhichislargerthanthemaximumrequestsizeyouhaveconfig
从0到1构建AI深度学习视频分析系统--基于YOLO 目标检测的动作序列检查系统：（2）消息队列与消息中间件 shiter 人工智能系统解决方案与技术架构人工智能深度学习音视频
文章大纲原始视频队列Python内存视频缓存优化方案（4GB以内）一、核心参数设计二、内存管理实现三、性能优化策略四、内存占用验证五、高级优化技巧六、部署建议检测结果队列YOLO检测结果队列技术方案一、技术选型矩阵二、核心实现代码三、性能优化策略四、可视化方案对比五、部署建议逻辑判定队列时间片图论时间序列大模型引入参考文献原始视频队列想要在单机内存中缓存1-5分钟的视频片段，python技术栈的话
全网最详细的Kafka应用教程【建议收藏】 Java布道者 kafka 分布式
Kafkakafka是什么？kafka仅仅是属于消息中间件吗？kafka在设计之初的时候开发人员们在除了消息中间件以外，还想吧kafka设计为一个能够存储数据的系统，有点像常见的非关系型数据库，比如说NoSql等。除此之外还希望kafka能支持持续变化，不断增长的数据流,可以发布和订阅数据流，还可以对于这些数据进行保存也就是说kafka的本质是一个数据存储平台，流平台，只是他在做消息发布，消息消费
深入了解 Kafka：应用场景、架构和GO代码示例 spiker_ kafka 架构 golang
深入了解Kafka：应用场景、架构和GO代码示例ApacheKafka是一个分布式流平台，用于实时数据处理和流处理。在这篇博客中，我们将介绍Kafka的主要应用场景、架构及主要组件，并展示如何使用Go语言操作Kafka，包括Kafka生产者、消费者的示例代码，以及如何通过KafkaConnectRESTAPI配置连接器。Kafka的主要应用场景实时数据流处理：Kafka用于处理实时数据流，如用户行
RabbitMQ相关的面试题努力的搬砖人. java rabbitmq 后端
以下是150道RabbitMQ相关的面试题及简洁回答：RabbitMQ基础概念1.什么是RabbitMQ？RabbitMQ是一个开源的AMQP（高级消息队列协议）实现，用于在分布式系统中进行消息传递和通信。它允许应用程序通过网络发送和接收消息，实现异步处理、解耦合和扩展性。RabbitMQ使用Erlang语言开发，具有高可用性和容错性，适用于各种规模的应用程序。2.RabbitMQ的核心组件有哪些
【kafka的零拷贝原理】 @Corgi Java面试题 kafka 分布式面试题
kafka的零拷贝原理一、零拷贝技术概述二、Kafka中的零拷贝原理三、零拷贝技术的优势四、零拷贝技术的实现细节五、注意事项一、零拷贝技术概述零拷贝（Zero-Copy）是一种减少数据拷贝次数，提高数据传输效率的技术。在传统的数据传输过程中，数据需要在用户态和内核态之间多次拷贝，这不仅浪费CPU资源，还会增加延迟。而零拷贝技术通过避免这些不必要的拷贝操作，直接在内核空间进行数据传输，从而大大提高了
SpringBoot 整合 Avro 与 Kafka m0_74823408 面试学习路线阿里巴巴 spring boot kafka linq
优质博文：IT-BLOG-CN【需求】：生产者发送数据至kafka序列化使用Avro，消费者通过Avro进行反序列化，并将数据通过MyBatisPlus存入数据库。一、环境介绍【1】ApacheAvro1.8；【2】SpringKafka1.2；【3】SpringBoot1.5；【4】Maven3.5；4.0.0com.codenotfoundspring-kafka-avro0.0.1-SNAP
C++使用ZeroMQ和MessagePack实现简单又轻量级的RPC框架特立独行的猫a C++c++rpc zeromq messagepack
在现代的分布式系统中，远程过程调用（RPC）是一个非常重要的机制，它允许不同的服务或组件之间的通信，就像调用本地函数一样。本文将介绍如何使用ZeroMQ和MessagePack来构建一个轻量级的RPC框架，并提供一个简单的使用示例。ZeroMQ简介ZeroMQ（也称为0MQ）是一个高性能的异步消息库，旨在使用标准的、对等的传输协议实现消息的发送与接收。ZeroMQ的核心是提供一个消息队列，使得消息
Elastic Stack 8.16.0 日志收集平台的搭建 JingAi_jia917 Elastisearch Logstash Filebeat Kibana Elastic stack ELK日志平台
简介1.1ELK介绍ELK是‌Elasticsearch‌、‌Logstash‌、‌Kibana‌三款开源工具的首字母缩写，构成了一套完整的日志管理解决方案，主要用于日志的采集、存储、分析与可视化‌。1）Logstash：数据管道工具，负责从多种来源（如文件、数据库、消息队列）采集日志，进行过滤、格式化后输出到目标（如Elasticsearch）‌；2）Elasticsearch：分布式实时搜索与
Spring Boot整合RabbitMQ极简教程 Cloud_. java-rabbitmq spring boot rabbitmq
一、消息队列能解决什么问题？异步处理：解耦耗时操作（如发短信、日志记录）流量削峰：应对突发请求，避免系统过载应用解耦：服务间通过消息通信，降低依赖二、快速整合RabbitMQ1.环境准备安装RabbitMQ（推荐Docker一键部署）：dockerrun-d--namerabbitmq-p5672:5672-p15672:15672rabbitmq:management访问管理界面：http://
Liunx启动kafka并解决kafka时不时挂掉的问题 RyFit linux kafka
kafka启动步骤先启动zookeeper，启动命令如下nohup./zookeeper-server-start.sh/home/kafka/kafka/config/zookeeper.properties>/home/kafka/kafka/zookeeper.log2>&1&再启动kafka，启动命令如下nohup./kafka-server-start.sh/home/kafka/kaf
RocketMQ、Kafka、RabbitMQ，如何选型？大梦谁先觉i 中间件 Spring boot Spring Cloud rocketmq kafka rabbitmq
如何根据应用场景选择合适的消息中间件?分布式、微服务、高并发架构中，消息队列（MessageQueue，简称MQ）扮演着至关重要的角色。消息队列用于实现系统间的异步通信、解耦、削峰填谷等功能。目前常见的MQ实现包括RabbitMQ、RocketMQ和Kafka。RocketMQ、Kafka、RabbitMQ如何选择？三大MQ的简单对比特性RabbitMQRocketMQKafka公司/社区Rabb
kafka rocketmq rabbitmq 都是怎么实现顺序消费的 C18298182575 kafka rocketmq rabbitmq
Kafka、RocketMQ和RabbitMQ都支持顺序消费，但它们的实现机制有所不同。以下是这三种消息队列实现顺序消费的方式：1.Kafka的顺序消费实现机制分区内有序：Kafka保证单个分区（Partition）内的消息是有序的。消息按照写入分区的顺序存储，消费者按照相同的顺序消费。分区间无序：不同分区之间的消息顺序是不保证的。例如，消息A写入分区0，消息B写入分区1，消费者可能会先消费到消息
Kafka 生产者与消费者的关系与应用场景分析白.夜 kafka json
在现代分布式系统中，ApacheKafka作为一个高性能的消息队列系统，在数据流转和处理方面扮演着至关重要的角色。Kafka采用了经典的生产者-消费者模式，极大地解耦了数据生成与数据消费的过程。本文将详细探讨Kafka中生产者与消费者的关系、常见问题以及Kafka在实际应用中的使用场景。1.Kafka中生产者与消费者的关系1.1生产者（Producer）生产者是Kafka系统中的一个客户端应用程序
IDEA下载依赖慢最懒的菜鸟 intellij-idea java
因为是境外所以慢，像kafka依赖这些等半天有时还出错，怎么决绝呢？切换阿里云镜像源即可首先找到settings.xml文件，位置一般在于C:\Users\你的用户名\.m2\settings.xmalimavenaliyunmavenhttps://maven.aliyun.com/repository/publiccentral找不到settings.xml文件打开idea，到项目中pom.x
springboot kafka spring boot搭建单机集群集成入门木秀林环境配置 kafka spring boot docker
搭建kafka(单机版)使用虚拟机+docker参考https://blog.csdn.net/qq_35394891/article/details/84349955https://www.cnblogs.com/xiaohanlin/p/10078865.html拉取镜像(kafka依赖zookeeper,所有两个都要)dockerpullwurstmeister/zookeeperdocke
AVA面试_进阶部分_kafka面试题茂茂在长安 JAVA 面试 kafka 职场和发展 java 中间件
1.Kafka的设计时什么样的呢？Kafka将消息以topic为单位进行归纳将向Kafkatopic发布消息的程序成为producers.将预订topics并消费消息的程序成为consumer.Kafka以集群的方式运行，可以由一个或多个服务组成，每个服务叫做一个broker.producers通过网络将消息发送到Kafka集群，集群向消费者提供消息2.数据传输的事物定义有哪三种？数据传输的事务定
知识点专项整理健忘的鱼 android android studio java
跨进程通讯（IPC）参考Android通信机制消息队列：基于SystemV和Posix系统优点异步，解耦，缓冲，缺点：比信号和管道更加重，队列数据有上限（一般16KB）Android中代表handler，但handlerr只是进程内的通信方式：由消息轮询器（Looper）、消息队列（MessageQueue）、消息处理器（Handler）三部分组成，轮询器通过prepare()初始化消息队列，处理
【Springboot知识】开发属于自己的中间件健康监测HealthIndicate 问道飞鱼微服务相关技术 spring boot 中间件后端 HealthIndicate
文章目录**一、技术栈****二、项目结构****三、依赖配置(pom.xml)****四、配置文件(application.yml)****五、自定义健康检查实现****1.Redis健康检查****2.Elasticsearch健康检查****3.Kafka健康检查****4.MySQL健康检查****六、自定义健康检查接口(可选)****七、测试与验证****八、高级功能扩展****九、部署
大数据学习（67）- Flume、Sqoop、Kafka、DataX对比 viperrrrrrr 大数据学习 flume kafka sqoop datax
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦工具主要作用数据流向实时性数据源/目标应用场景Flume实时日志采集与传输从数据源到存储系统实时日志文件、网络流量等→HDFS、HBase、Kafka等日志收集、实时监控、实时分析Sqoop关系型数据库与Hadoop间数据同步关系型数据库→Hadoop生态系统（HDFS、Hive、
从前端视角理解消息队列：核心问题与实战指南秋水为渡前端
消息队列（MessageQueue）是现代分布式系统的核心组件之一，它在前后端协作、系统解耦、流量削峰等场景中发挥着重要作用。本文从前端开发者视角出发，解析消息队列的关键问题，并结合实际场景给出解决方案。一、为什么要使用消息队列？1.前端常见场景异步任务处理：用户行为日志上报、实时通知推送流量削峰：应对秒杀活动、大文件上传等瞬时高并发场景系统解耦：前端与后端服务、第三方服务之间的松耦合通信2.前端
基础知识《Redis解析》 Hum8le redis 数据库缓存安全 web安全
Redis详细解析与介绍Redis（RemoteDictionaryServer）是一个开源的高性能键值对（Key-Value）数据库，支持多种数据结构（如字符串、哈希、列表、集合等），广泛应用于缓存、消息队列、实时数据分析等场景。核心特点：内存存储：数据主要存储在内存中，读写性能极高（10万+/秒QPS）。持久化支持：支持RDB（快照）和AOF（追加日志）两种持久化方式。多数据结构：支持字符串、
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin