Kafka生产者

向Kafka写入数据

Kafka生产者组件

从创建一个ProducerRecord对象开始，ProducerRecord对象需要包含目标主题和要发送的内容。我们可以指定键或分区。在发送ProducerRecord对象时，生产者要先把键和值对象序列化成字节数组，这样才能在网络上传输。
接下来，数据被传送给分区起，如果之前在ProducerRecord对象里指定了分区，则分区器不会再做任何事情，直接把指定的分区返回。如果没有指定分区，则分区器会根据ProducerRecord对象的键来选择一个分区。选好分区后，生产者就知道该往哪个主题和分区发送这条记录了。紧接着，这条记录被添加到一个记录批次里，这个批次里的所有消息会被发送到相同的主题和分区上。有一个独立的线程负责把这些记录批次发送到相应的broker上。

创建Kafka生产者

Kafka生产者有3个必选属性

bootstrap.servers: 指定broker地址清单，地址格式为host:port。为了可靠性，至少提供两个broker信息，生产者可以从给定的broker里查找其他broker信息

key.serializer: 必须是一个实现了org.apache.kafka.xxx.Serializer接口的类，生产者使用这个类把键对象序列化成字节数组。

value.serializer: 与key.serializer一样，value.serializer指定的类会将值序列化。如果键和值都是字符串，可以使用与key.serializer一样的序列化器。如若不同则使用不同的序列化器。

发送消息到Kafka

3种发送消息的方式

发送并忘记：发送消息到服务器，但并不关心是否正常到达；

同步发送：使用send()发送消息，返回一个Future对象，调用get()方法进行等待，就可以知道消息是否发送成功；

异步发送：调用send()方法，并指定一个回调函数，服务器在返回响应时调用该函数。

示例：

// 需要目标主题和要发送的键和值的对象 的构造函数
ProducerRecord record = new ProducerRecord<>("CustomerCountry", "Precision Producers", "France");
try {
  // 如果不关心发送结果，则可以使用这种发送方式
  producer.send(record);
} catch (Exception e) {
  // 发送消息之前，生产者可能发生其他异常，可能是序列化消息失败、缓冲区已满又或者是发送线程被中断
  e.printStackTrace();
}

同步发送消息
同步发送消息方式示例：

ProducerRecord record = new ProducerRecord<>("CustomerCountry", "Precision Products", "France");
try {
  // producer.send()方法先返回一个Future对象，然后调用Future对象的get()方法等待Kafka响应。如果服务器返回错误，get()方法会抛出异常，如果没有，则会得到一个RecordMetadata对象，可以用它获取消息的偏移量
  producer.send(record).get();
} catch (Exception e) {
  // 发送消息之前或发送过程中，比如broker返回了一个不允许重发消息的异常或者已经超过了重发的次数
  e.printStackTrace();
}

KafkaProducer一般会发生两类错误。其中一类是可重试错误，这类错误可以通过重发消息来解决，比如连接错误，可以通过再次建立连接来解决，"no leader"错误则可以通过重新为分区选举首领来解决；另一类错误无法通过重试解决，比如"消息太大"异常，此时直接抛出异常。

异步发送消息
为了在异步发送消息的同时能够对异常情况进行处理，生产者提供了回调支持。下面是使用回调的一个例子：

// 为了使用回调，需要实现一个org.apache.kafka.xxx.Callback接口的类，这个接口只有一个onCompletion方法
private class DemoProducerCallback implements Callback {
  @Override
  public void onCompletion(RecordMetadata recordMetadata, Exception e) {
    if (e != null) {
      // 若Kafka返回一个错误，onCompletion方法会抛出一个非空(non null)异常
      e.printStackTrace();
    }
  }
}

// 记录与之前的一样
ProducerRecord record = new ProducerRecord<>("CustomerCountry", "Biomedical Materials", "USA");
// 在发送消息时传进去一个回调对象
producer.send(record, new DemoProducerCallback());

生产者的配置

在内存使用、性能和可靠性方面对生产者影响比较大的参数的说明

1.acks:

acks参数制定了必须要有多少个分区副本接收到消息，生产者才会认为消息写入是成功的。此参数对消息丢失的可能性有重要影响
acks=0: 生产者在成功写入消息之前不会等待任何来自服务器的响应。即生产者不关注消息是否丢失，不等待服务器响应，只管发送消息，所以能达到很高的吞吐量。
acks=1: 只要集群leader节点收到消息，生产者就会收到一个来自服务器的成功响应。
acks=all: 只有当所有参与复制的节点全部收到消息时，生产者才会收到一个来自服务器的成功响应。此时最安全，不过延迟最高，因为要等待不止一个服务节点的响应。

2.buffer.memory:

用来设置生产者内存缓冲区的大小，生产者用它缓冲要发送到服务器的消息。若应用程序发送消息的速度超过发送到服务器的速度，会导致生产者空间不足。此时，send()方法调用要么阻塞，要么抛出异常，取决于如何设置block.on.buffer.full/max.block.ms参数

3.compression.type

默认情况下，消息发送时不会被压缩，该参数可以设置为snappy、gzip或lz4，它指定了消息被发送给broker之前使用哪一种压缩算法进行压缩。使用压缩可以降低Kafka的网络传输开销和存储开销。

4.retries

生产者从服务器收到的错误有可能是临时性的错误(比如分区找不到leader)。这种情况下，retries参数的值决定了生产者可以重发消息的次数，若达到这个次数，生产者会放弃重试并返回错误。默认情况下，生产者会在每次重试之间等待100ms，也可以通过retry.backoff.ms参数来改变这个时间间隔。

5.batch.size

当有多个消息需要被发送到同一个分区时，生产者会把它们放在同一个批次里。该参数指定了一个批次可以使用的内存大小，按照字节数计算(而不是消息个数)。当批次被填满，批次里的所有消息会被发送出去。不过生产者并不一定都会等到批次被填满才发送，半满的批次，甚至只包含一个消息的批次也有可能被发送。

6.linger.ms

指定生产者在发送批次之前等待更多消息加入到批次的时间。KafkaProducer会在批次填满或linger.ms达到上限时把批次发送出去。默认情况，只要有可用线程，生产者就会把消息发送出去，就算批次里只有一个消息。虽然会增加延迟，但也会提升吞吐量。

7.client.id

可以是任意字符串，服务器会用它来识别消息的来源，还可以用在日志和配额指标里。

8.max.in.flight.requests.per.connnection

指定生产者在收到服务器响应之前可以发送多少个消息。值越高，就会占用越多的内存，不过也会提升吞吐量。设为1可以保证消息是按照发送的顺序写入服务器的，即使放生了重试。

9.timeout.ms、request.timeout.ms和metadata.fetch.timeout.ms

request.timeout.ms指定生产者在发送数据时等待服务器返回响应的时间，metadata.fetch.timeout.ms指定生产者在获取元数据(比如目标分区的leader是谁)时等待服务器返回响应时间。timeout.ms指定了broker等待同步副本返回消息确认的时间，与asks的配置相匹配——若指定时间内没收到同步副本的确认，则broker就会返回一个错误。

10.max.block.ms

指定在调用send()方法或使用partitionsFor()方法获取元数据时生产者的阻塞时间。当生产者的发送缓冲区已满或没有可用元数据时，这些方法就会阻塞。当阻塞时间达到max.block.ms时，生产者会抛出超时异常。

11.max.request.size

控制生产者发送的请求大小。它可以指能发送的单个消息的最大值，也可以指单个请求里所有消息总的大小。broker对可接收的消息最大值也有自己的限制(message.max.bytes)，所以两边的配置最好可以匹配，避免生产者发送的消息被broker拒绝。

12.receive.buffer.bytes和send.buffer.bytes

分别指定TCP socket接收和发送数据包的缓冲区大小。如果它们被设为-1，就使用操作系统的默认值。若生产者和消费者与broker处于不同的数据中心，则可以适当增大这些值，因为跨网络一般都有较高延迟和较低的带宽。

顺序保证

一般来说，若某些场景要求消息是有序的，则消息是否写入成功也是很关键的，所以不建议把retries设为0。可以把max.in.flight.requests.per.connection设为1，这样生产者尝试发送第一批消息时，就不会有其他的消息发送给broker。但是这样会严重影响生产者的吞吐量，所以只有在对消息的顺序有严格要求的情况下才能这么做。

序列化器

在Kafka里使用Avro

Avro的数据文件里包含了整个schema，不过这样的开销是可接受的。但是如果在每条Kafka记录里都嵌入schema，会让记录的大小成倍地增加。我们遵循通用的结构模式并使用"schema注册表"来达到目的。schema注册表并不属于Kafka，可以使用一些开源的schema注册表来实现，例如：Confluent Schema Registry。

Avro记录的序列化和反序列化流程图

生产者将所有写入数据需要用到的schema保存在注册表里，然后在记录里引用schema标识符。负责读取数据的应用程序使用标识符从注册表里拉取schema来反序列化记录。序列化器和反序列化器分别负责处理schema的注册和拉取。

示例：把生成的Avro对象发送到Kafka

Properties props = new Properties();

props.put("bootstrap.servers", "localhost:9092");
props.put("key.serializer", "io.confluent.kafka.serializers.kafkaAvroSerializer");
props.put("value.serializer", "io.confluent.kafka.serializers.KafkaAvroSerializer");
// schema.registry.url是一个新的参数，指向schema的存储位置
props.put("schema.registry.url", schemaUrl);

String topic = "customerContacts";

// Customer是生成的对象。我们会告诉生产者Customer对象就是记录的值
Producer producer = new KafkaProducer(props);

// 不断生成事件，直到有人按下Ctrl+C组合键
while(true) {
  Customer customer = CustomerGenerator.getNext();
  System.out.println("xxxx" + customer.toString());
  ProducerRecord record = new ProducerRecord<>(topic, customer.getId(), customer);
  producer.send(record);
}

示例：使用一般的Avro对象而非生成的AVro对象

Properties props = new Properties();

props.put("bootstrap.servers", "localhost:9092");
props.put("key.serializer", "io.confluent.kafka.serializers.kafkaAvroSerializer");
props.put("value.serializer", "io.confluent.kafka.serializers.KafkaAvroSerializer");
// schema.registry.url是一个新的参数，指向schema的存储位置
props.put("schema.registry.url", schemaUrl);

// 这里需要提供Avro schema，因为我们没有使用Avro生成的对象
String schemaString = "{\n" +
        "      \"namespace\": \"customerManagement.avro\",\n" +
        "      \"type\": \"record\",\n" +
        "      \"name\": \"Customer\",\n" +
        "      \"fields\": [\n" +
        "        {\"name\": \"id\", \"type\": \"int\"},\n" +
        "        {\"name\": \"name\", \"type\": \"string\"},\n" +
        "        {\"name\": \"email\", \"type\":  [\"null\", \"string\"], \"default\": \"null\"}\n" +
        "      ]\n" +
        "    }";

// 对象类型是Avro GenericRecord，我们通过schema和需要写入的数据来初始化它
Producer producer = new KafkaProducer(props);
Schema.Parser parser = new Schema.Parser();
Schema schema = parser.parse(schemaString);

for (int nCustomers = 0; nCustomers < customers; nCustomers++) {
  String name = "exampleCustomer" + nCustomers;
  String email = "example" + nCustomers + "@example.com";
  
  GenericRecord customer = new GenericData.Record(schema);
  customer.put("id", nCustomers);
  customer.put("name", name);
  customer.put("email", email);
  
  ProducerRecord data = new ProducerRecord("customerContacts", name, customer);
  
  producer.send(data);
}

分区

Kafka消息是一个个键值对，ProducerRecord对象可以只包含目标主题和值，键可以设置为默认的null，不过大多数应用程序会用到键。键有两个用途：可以作为消息的附加信息，也可以用来决定消息该被写到主题的哪个分区。要创建一个包含键值的记录，只需像下面这样创建ProducerRecord对象：

ProducerRecord record = new ProducerRecord<>("CustomerCountry", "Laboratory Equipment", "USA");

如果要创建键为null的消息，不指定键就可以了：

// 这里键被设为null
ProducerRecord record = new ProducerRecord<>("CustomeCountry", "USA");

附录

参考文章

《Kafka权威指南》

老版本kafka查询topic消费情况(python查询) 代码是谁 kafka python 分布式
由于老版本的kafka缺少shell，导致无法通过命令直接进行查询，所以通过python代码，实现消费情况查询安装必须的包#pyhon2.5pipinstallkafka-python==1.4.7python脚本#!/usr/bin/envpythonimportsysfromkafkaimportKafkaConsumer,TopicPartitioniflen(sys.argv)!=2:pr
【Python系列】使用切片移动元素位置 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
字节架构师：来说说 Kafka 的消费者客户端详解，你都搞懂了吗？ 2401_84049200 程序员 kafka linq 分布式
点对点模式基于队列，类似于同一个消费者组中的数据，由生产者发送数据到分区，然后消费者拉取分区的消息进行消费，此时消息只能被同一个消费者组的消费者消费一次。发布订阅模式模式就是kafka中的分区消息可以被不同消费者组的消费者消费。这就是一对多的广播模式应用。当然，消费者组是一个逻辑的概念，通过客户端参数group.id来配置，默认值为空字符串。而消费者并不是逻辑的概念，它是真正消费数据的实体，可以是
Java Kafka生产者实现 stormsha Java web java kafka linq
欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐：「stormsha的主页」，「stormsha的知识库」持续学习，不断总结，共同进步，为了踏实，做好当下事儿~专栏导航Python系列:Python面试题合集，剑指大厂Git系列:Git操作技巧GO系列:记录博主学习GO语言的笔记，该笔记专栏
python调用rocketmq的api_Python：Rocketmq消息队列使用 weixin_39914868
rocketmq可以与kafka等一起使用，用于实时消息处理。安装rocketmq：pipinstallrocketmq[-ihttps://pypi.tuna.tsinghua.edu.cn/simple]生产消息producer：fromrocketmq.clientimportProducer,Messageimportjsonproducer=Producer('PID-test')pro
Kafka2.8.0集群安装教程请叫我你好安装教程 kafka
Kafka2.8.0集群安装教程准备工作node01~node04（四个节点机器，三台也可以），kafka安装node01~~node03启动zookeeper，这里依次启动node131，node132，node133上的zk。（关于zookeeper集群安装请看https://blog.csdn.net/qq_41578037/article/details/123809220）[root@n
实时数仓之实时数仓架构(Hudi)(1) 2401_84164527 程序员架构
目前比较流行的实时数仓架构有两类，其中一类是以Flink+Doris为核心的实时数仓架构方案；另一类是以湖仓一体架构为核心的实时数仓架构方案。本文针对Flink+Hudi湖仓一体架构进行介绍，这套架构的特点是可以基于一套数据完全实现Lambda架构。实时数仓架构图如下：技术框架Kafka：用于接入数据源；FlinkCDC：如果直接接入业务数据源可以考虑CDC方式，如果通过Kafka缓冲接入业务数据
2024年大数据最新实时数仓之实时数仓架构(Hudi) 2401_84185556 程序员大数据架构
技术框架Kafka：用于接入数据源；FlinkCDC：如果直接接入业务数据源可以考虑CDC方式，如果通过Kafka缓冲接入业务数据可以忽略;Flink：用于数据ETL，包括接入数据、处理数据及输出数据全链路数据计算任务；Spark：用于数据ETL，包括处理数据及输出数据全链路数据计算任务；Hudi：湖仓一体数据管理框架，用来管理模型数据，包括ODS/DWD/DWS/DIM/ADS等；Doris：O
在ELFK架构中加入kafka beretxj_ kafka 分布式大数据 elk
传统的ELFK架构中，filebeat到logstash这个过程中，由于logstash要进行日志的分析处理，而filebeat至进行日志的收集和发送，处理过程较为简单，所以当日志量非常巨大的时候，logstash会由于处理不及时导致日志或数据的丢失，这时候可以在filebeat和logstash之间加入kafka存储信息，在logstash处理不及时的时候，日志或数据不至于丢失。kafka的安装
Kafka【问题 03】Connection to node -1 ( IP 9092) could not be established(1) 2401_84265972 2024年程序员学习网络安全 web安全面试
还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！【完整版领取方式在文末！！】93道网络安全面试题需要体系化学习资料的朋友，可以加我V获取：vip204888（备注网络安全
Kafka是如何实现高性能的明斯克开源 Java 经验分享架构 java
将写磁盘的过程变为顺序写Kafka的整个设计中，Partition相当于一个非常长的数组，而Broker接收到的所有消息顺序写入这个大数组中。同时Consumer通过Offset顺序消费这些数据，并且不删除已经消费的数据，从而避免了随机写磁盘的过程。由于磁盘有限，不可能保存所有数据，实际上作为消息系统Kafka也没必要保存所有数据，需要删除旧的数据。而这个删除过程，并非通过使用“读-写”模式去修改
Spring常用中间件贺仙姑 spring 中间件 java
1.数据库中间件（1）MySQL:常用的关系型数据库，支持JDBC和JPA。（2）PostgreSQL:功能强大的开源关系型数据库，支持复杂查询。（3）MongoDB:NoSQL数据库，适合存储非结构化数据。（4）Redis:内存数据结构存储，常用于缓存和消息队列。2.消息队列（1）RabbitMQ:开源消息代理，支持多种消息协议，适合异步处理。（2）Kafka:分布式流处理平台，适合处理大规模数
【Python系列】中位数计算 Kwan的解忧杂货铺@新空间代码工作室 s2 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,
Kafka、RabbitMQ、RocketMQ 之间的区别是什么 m0_67394230 面试学习路线阿里巴巴 android 前端后端
Kafka、RabbitMQ、RocketMQ之间的区别是什么?-知乎Kafka和RabbitMQ的区别:RabbitMQ有这么个特性，它在官方文档就声明了自己是不保证多线程消费同一个队列的消息，一定保证顺序的。而不保证的原因，是因为多线程时，当一个线程消费消息报错的时候，RabbitMQ会把消费失败的消息再入队，此时就可能出现乱序的情况。用RabbitMQ，出现了三个问题：为了实现发布订阅功能，
Kafka高性能揭秘 —— sequence IO、PageCache、SendFile的应用详解大数据学习与分享 Kafka kafka 大数据 java
大家都知道Kafka是将数据存储于磁盘的，而磁盘读写性能往往很差，但Kafka官方测试其数据读写速率能达到600M/s，那么为什么Kafka性能会这么高呢？首先producer往broker发送消息时，采用batch的方式即批量而非一条一条的发送，这种方式可以有效降低网络IO的请求次数，提升性能。此外这些批次消息会"暂存"在缓冲池中，避免频繁的GC问题。批量发送的消息可以进行压缩并且传输的时候可以
pyspark kafka mysql_数据平台实践①——Flume+Kafka+SparkStreaming(pyspark) weixin_39793638 pyspark kafka mysql
蜻蜓点水Flume——数据采集如果说，爬虫是采集外部数据的常用手段的话，那么，Flume就是采集内部数据的常用手段之一(logstash也是这方面的佼佼者)。下面介绍一下Flume的基本构造。Agent：包含Source、Channel和Sink的主体，它是这3个组件的载体，是组成Flume的数据节点。Event：Flume数据传输的基本单元。Source：用来接收Event，并将Event批量传
Spring Boot 2.x实战94 - 事件驱动3 - Kafka与Kafka Streams 汪云飞记录本 Spring Boot2.x实战全集 spring boot kafka kafka streams KafkaListener
3.KafkaApacheKafka以Topic为导向，提供消息中间件的功能。一个类型的数据称之为一个Topic。3.1安装Kafka使用dockercompose安装ApacheKafka。stack.ymlversion:'3.1'services:zookeeper:image:wurstmeister/zookeeperrestart:alwayskafka:image:wurstmeis
基于 Kafka 实现分布式事件驱动 weixin_33785972 大数据 java 数据库
事件驱动是一种灵活的系统设计方法，在事件驱动的系统中，当数据发生变化时系统会产生、发布一个对应的事件，其它对这个事件感兴趣的部分会接收到通知，并进行相应的处理。事件驱动设计最大的好处在我看来有两点：一是它为系统提供了很好的扩展能力，比如我们可以对某类事件增加一个订阅者来对系统进行扩展，最主要的是我们并不需要修改任何已有的代码，它完全符合开闭原则；二是它实现了模块间的低偶合，系统间各个部分不是强依赖
pyflink 滚动窗口实例菜鸟社长菜鸟的大数据进阶之路大数据进阶之路 kafka big data python flink
写在前头：更多大数据相关精彩内容请进我的知识星球，每周定期更新正篇技术路线：模拟kafka生产者发送数据——>flink对kafka数据实时计算处理——>处理后的数据发送到kafka1、模拟客流数据的生产者，参考https://blog.csdn.net/qq_22611181/article/details/1199002502、flink聚合操作原理介绍，参考https://blog.csdn
【Flink】Flink 写入到 CSV BucketingSink 的使用方法九师兄大数据-flink flink BucketingSink csv
1.概述【File】CSV文件写入追加写入CsvWriter的使用有一个需求是这样的，flink读取kafka数据，然后写入到csv，但是写入的时候，要求写入一个文件，然后在监听到配置文件变化的时候，将写入到另外一个文件。然后想到这里我就想到了CsvWriter实体类@Data@AllArgsConstructor@NoArgsConstructorpublicstaticclass
第五章 Kafka 构建TB级异步消息系统跟风。仿牛客社区论坛 kafka java 分布式
第五章Kafka构建TB级异步消息系统1、阻塞队列模拟阻塞队列publicclassBlockingQueueTest{publicstaticvoidmain(String[]args){//容量为10的阻塞队列BlockingQueuequeue=newArrayBlockingQueue(10);//生产者线程newThread(newProducer(queue)).start();//消
kubernetes集群下部署kafka+zookeeper单机部署方案 jiang0615csdn 消息队列服务 kubernetes kafka zookeeper
背景：注：在kubernetes集群上部署单机版的zookeeper+kafka服务，是采用了kubernetes中的deploment组件+service组件+pvc存储组件1、部署zookeeper服务：注：这里时候的镜像是：dockerhub.jiang.com/jiang-public/zookeeper:3.5.91.镜像下载地址：registry.cn-hangzhou.aliyunc
Kafka，构建TB级异步消息系统 Fern977 牛客论坛学习笔记 kafka java 分布式
1.阻塞队列BlockingQueue解决线程通信的问题阻塞方法：put、take。生产者消费者模式生产者：产生数据的线程消费者：使用数据的线程实现类ArrayBlockingQueueLinkedBlockingQueuePriorityBlockingQueue、SynchronousQueue、DelayQueue等2.Kafka入门Kafka简介Kafka是一个分布式的流媒体平台应用：消息
仿论坛项目--Kafka，构建TB级异步消息系统 HUT_Tyne265 kafka 分布式
阻塞队列•BlockingQueue解决线程通信的问题。阻塞方法：put、take。•生产者消费者模式生产者：产生数据的线程。消费者：使用数据的线程。•实现类ArrayBlockingQueueLinkedBlockingQueuePriorityBlockingQueue、SynchronousQueue、DelayQueue等。Kafka入门•Kafka简介Kafka是一个分布式的流媒体平台。
大数据系列 | Kafka架构分析及应用降世神童大数据技术专栏大数据 kafka 架构
大数据系列|Kafka架构分析及应用1.消息系统介绍2.Kafka原理分析3.Kafka架构分析4.Kafka的安装与配置4.1.Zookeeper集群安装配置4.2.安装Kafka集群4.3.配置kafka自启动服务5.kafka生产者和消费者的应用5.1.生产者使用5.2.消费者使用6.KafkaController控制器1.消息系统介绍常用消息系统对比： ■RabbitMQ：Erlan
SpringBoot+Kafka+ELK 完成海量日志收集（超详细） 2401_83703797 程序员 spring boot kafka elk
SpringBoot项目准备引入log4j2替换SpringBoot默认log，demo项目结构如下：pomIndexController测试Controller，用以打印日志进行调试InputMDC用以获取log中的[%X{hostName}]、[%X{ip}]、[%X{applicationName}]三个字段值NetUtil启动项目，访问/index和/ero接口，可以看到项目中生成了app
Kafka Broker处于高负载状态（例如消息处理量大或系统资源不足），无法及时响应消费者的请求战族狼魂消息队列 java kafka 分布式
Causedby:org.apache.kafka.common.errors.TimeoutException:Timeoutof60000msexpiredbeforethepositionforpartitionactivity-0couldbedetermined。出现这个错误的原因是Kafka消费者在尝试获取分区(activity-0)的位置信息时，超时了。在60秒内无法确定该分区的最新
Kafka 常用的传输和序列化数据方式傲雪凌霜，松柏长青后端大数据 kafka 分布式
Kafka常用的传输和序列化数据方式。不同的方式有不同的优缺点，选择哪种方式通常取决于具体的应用场景、性能要求、数据兼容性需求等。以下是几种常见的方式，包括：1.ProtoBuf(ProtocolBuffers)概述：ProtoBuf是Google开发的一种语言中立、平台中立的高效二进制序列化格式，广泛应用于RPC、数据传输和存储等场景。优点：高效的二进制格式，序列化和反序列化速度快，数据体积小。
kafka3.7.1 单节点 KRaft部署&测试发送和接收消息运维小弟| srebro.cn openeuler kafka 运维运维云原生
一、环境准备kafka3.7.1包下载地址：https://mirrors.nju.edu.cn/apache/kafka/3.7.1/kafka_2.13-3.7.1.tgzopenjdk11.0.2下载地址：https://mirrors.nju.edu.cn/openjdk/11.0.2/openjdk-11.0.2_linux-x64_bin.tar.gz二、openjdk安装【如已安装，
Kafka 如何保证消息不丢失阳光倾洒 Kafka kafka 分布式 java 学习开发语言
1、生产者1.1丢失原因：kafka生产端异步发送消息后，不管broker是否响应，立即返回，伪代码producer.send(msg)，由于网络抖动，导致消息压根就没有发送到broker端；kafka生产端发送消息超出大小限制，broker端接到以后没法进行存储；1.2解决方案：1、生产者调用异步回调消息。伪代码如下:producer.send(msg，callback)；2、生产者增加消息确认
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo