七号公园的忧伤

Kafka 入门学习

1 初识KafKa

1.1基本概念

2 生产者

2.1客户端开发

2.1.1 必要参数

2.1.2 消息的发送

2.1.3 序列化

2.1.4 分区器

2.1.5 生产者拦截器

2.2 整体架构

2.2.1 RecordAccumulator

2.2.2 Sender线程

3 消费者

3.1 消费者和消费者组

3.1.1 消息投递模式

3.2 客户端开发

3.2.1 必要参数

3.2.2 订阅主题与分区

3.2.3 反序列化

3.2.4 消费消息

3.2.5 位移提交

3.2.6 控制或关闭消费

3.2.7 指定位移消费

3.2.8 再均衡

3.2.9 消费者拦截器

3.2.10 多线程实现

3.2.11 重要消费参数

4 主题与分区

4.1 优先副本的选举

4.2 文件目录

4.3 日志索引

4.4 日志快速读取

5、队列

1 初识KafKa

1.1基本概念

1.Producer:生产者，生产者负责创建消息，投递到Kafka中

2.Consumer:消费者，连接到KafKa上，并接收消息，进行处理。

3.Broker：独立的Kafka服务节点或者服务实例。

4.Topic: Kafka中消息以主题为单位进行归类。生产这将消息发送到特定的主题（每一个消息都需要指定主题），消费者负责订阅主题并进行消费。

5.Partition:主题是一个逻辑上的概念，他可以细分为多个分区。

同一主题下的不同分区包含的消息不同。分区在存储层面可以看做是一个追加的日志文件。消息被追加到日志文件会分配一个特定的偏移量offest,offest是分区中的唯一标识，offest不会跨越分区，所以只保证分区中的消息有序。

分区可以分布在不通的服务器上，也就是说，一个主题可以横跨多个broker。可以解决单文件只能在一个服务器上造成的性能问题。

6.Replica:Kafka为分区引入了多副本概念；增加分区副本数量可以提升容灾能力。

副本同一时间，并非完全一样，一主多从，leader副本负责读写。follower副本只负责消息同步。副本处于不通broker中。当leader出现故障，从follower中重新选举新的leader。

7.分区中的所有副本(leader+follower)统称为AR(Assigned Replicas),所有与leader副本保持一定程度同步的副本（包括leader）组成ISR（In-Sync Replicas）.与leader副本同步滞后过多的副本（不包过leader）组成OSR(out-of-Syn Replicas).

leader副本负责维护和跟踪ISR集合中所有的follower副本的滞后状态，当follower滞后太多或者失效时，leader将其从ISR中剔除。如果OSR中有follower副本追上，那么从OSR转移到ISR. 默认情况下，当leader发生故障，只有ISR中的副本才有资格被宣威leader。

ISR与HW和LEO也有密切的关系。HW-Hight Watermark的缩写。高水位。他表示了一个特定的消息偏移量offest,消费者只能拉取到这个offest之前的消息。

LEO为Log End Offest缩写。（分区中当前日志文件一条待写入消息的offest）

分区中消息是从Log Start Offest（为0）开始，到LogEndOffest结束。HW就是所有ISR集合中LogEndOffest的最小值

2 生产者

2.1客户端开发

一个正常的生产逻辑需要具备以下几个步骤：

配置生产者客户端参数以及创建相应的生产者实例。
构建待发送的消息
发送消息
关闭生产者实例

//生产者实例 是线程安全的
KafkaProducer prodcuer = new KafkaProducer<>(propos);


发送的消息类。
public class ProducerRecord {
    //主题
    private final String topic;
    //分区号
    private final Integer partition;
    //消息头
    private final Headers headers;
    //消息key
    private final K key;
    //消息值
    private final V value;
    //消息的时间戳
    private final Long timestamp;

2.1.1 必要参数

bootstrap.servers 用来指定连接Kafka集群所需的broker地址清单，多个用逗号分割。
key.serializer
value.serializer :borker端接收的消息必须以字节数组形式存在。

2.1.2 消息的发送

发送消息有三种方式：

fire-and-forget 发后即忘只管发送，不管是否到达
sync 同步
async异步

try{
  Future future =producer.send(record);
  RecordMetedata metedata = future.get();
  //可以通过get方法来阻塞等待Kafka的响应，直到消息发送成功
}catch(ExecutionException | InterruptedException e){
  e.printStackTrace();
}

2.1.3 序列化

生产者使用序列化把对象转为字节数组才能发送给kafka, 消费者需要用对应的反序列化将字节数组转化为对象。

2.1.4 分区器

消息在通过send方法发往broker过程中，有可能需要经过拦截器（Interceptor）、序列化器（Serializer）和分区器（Partitioner）的一系列作用之后才能被真正的发往broker。

作用：为消息分配分区。（没有指定分区的时候分区器会指定一个）

默认分区器是org.apache.kafka.clients.producer.internals.DefaultPartitioner。其中partition用来计算分区号，返回值为int类型。Partitioner是DefaultPartitioner的父类接口，继承了Configurable接口，通过该接口中的configure方法获取配置信息。

    /**
     * Compute the partition for the given record.
     *
     * @param topic         The topic name
     * @param numPartitions The number of partitions of the given {@code topic}
     * @param key           The key to partition on (or null if no key)
     * @param keyBytes      serialized key to partition on (or null if no key)
     * @param value         The value to partition on or null
     * @param valueBytes    serialized value to partition on or null
     * @param cluster       The current cluster metadata
     */
    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster,
                         int numPartitions) {
        if (keyBytes == null) {
            return stickyPartitionCache.partition(topic, cluster);
        }
        // hash the keyBytes to choose a partition
        return Utils.toPositive(Utils.murmur2(keyBytes)) % numPartitions;
    }

如果key不为null,那么对key进行hash，然后计算分区号。相同的key写入同一个分区。
如果key为null,那么消息会随机的方式发往主题内的任意一个分区。

2.1.5 生产者拦截器

可以在发送消息前做一些准备工作，比如过滤不合要求的消息，修改消息内容。也可以做一些定制化的需求，比如统计类工作。

使用：自定义实现ProducerInterceptor接口。需要实现3个接口

public interface ProducerInterceptor extends Configurable {
   public ProducerRecord onSend(ProducerRecord record);
   public void onAcknowledgement(RecordMetadata metadata, Exception exception);
   public void close();
}

KafkaProducer在将消息序列化和计算分区前会调用生产者拦截器的onSend方法来对消息进行相应的定制化操作。

KafkaProducer会在消息被应答（Acknowledge）之前或者消息发送失败时调用onAcknowledgement方法，优先与用户设定的CallBack之前执行。

2.2 整体架构

整个生产者客户端由两个线程协调运行，这2个线程分别为主线程和Sender线程。

主线程中由KafkaProducer创建消息，通过可能的拦截器、序列化器、分区器的作用后缓存消息到消息累加器：RecordAccumulator。Sender线程从RecordAccumulator中获取消息并将期发送到Kafka中。

sender线程也是在构造函数里启动的

this.sender = newSender(logContext, kafkaClient, this.metadata);
String ioThreadName = NETWORK_THREAD_PREFIX + " | " + clientId;
this.ioThread = new KafkaThread(ioThreadName, this.sender, true);
this.ioThread.start();

2.2.1 RecordAccumulator

//在KafkaProducer的构造方法中初始化            
this.accumulator = new RecordAccumulator(logContext,
                    config.getInt(ProducerConfig.BATCH_SIZE_CONFIG),  //batchSiz  默认16384
                    this.compressionType, //消息压缩方式：none（不压缩）、gzip、snappy、lz4、zstd、
                    lingerMs(config), //用来
                    retryBackoffMs,
                    deliveryTimeoutMs,
                    metrics,
                    PRODUCER_METRIC_GROUP_NAME,
                    time,
                    apiVersions,
                    transactionManager,
                    new BufferPool(this.totalMemorySize, config.getInt(ProducerConfig.BATCH_SIZE_CONFIG), metrics, time, PRODUCER_METRIC_GROUP_NAME));

batchSize :初始化MemoryRecords实例时分配的大小
CompressionType:压缩消息的方式，默认none，不压缩
lingerMs, 用来指定生产者发送ProducerBatch之前需要等待更多消息ProducerRecord加入ProducerBatch的时间。默认为0。
retryBackoffMs：配置生产者重试的次数，默认为0。异常情况下会重试。
deliveryTimeoutMs：

requestTime(Producer请求等待响应的最长时间) + lingerMs <= deliveryTimeoutMs(传递超时时间)
metrics:
transactionManager:事务管理
BufferPool：字节缓存池

属性：

ConcurrentMap> batches;

以TopicPartition为key, 双端队列为value。收集器可以收集不同分区的消息，各自分区下有一个队列，队列中有多个ProducerBatch，每个ProducerBatch中可以放很多消息。

发送消息追加后，还会在IncompleteBatches中缓存起来，直到被ACK确认。

2.2.2 Sender线程

sender线程中维护了确认机制：

acks = 1 发送消息，leader副本写入消息，就会响应成功。默认
0：生产者发送消息，不需要响应。
-1或null，发送消息，需要ISR都写入成功才响应成功。

发送方式：每次线程启动只发送一次。 Producer new完之后，发送消息完成需要调用close方法，会关闭sender线程。

3 消费者

3.1 消费者和消费者组

消费者（Consumer）：负责订阅Kafka中的主题（Topic）,并从订阅的主题上拉取消息。
消费者组（Consumer Group）：每个消费者都有一个消费者组，消息发布到主题后，只会被投递给订阅他的每个消费者组中的其中一个消费者。

注意：同一个topic下会有很多的分区，同一个消费组中可以增加消费者来让消费能力提升。但是当消费者过多，就会导致有的消费者分配不到任何分区。

分配策略是通过消费这客户端参数partition.assignment.strategy来配置的。

3.1.1 消息投递模式

点对点（p2p）如果所有消费者都属于同一个消费组。那么所有消息就会被均衡的投递到每一个消费者。每条消息只会被一个消费者消费。
发布订阅：如果所有消费者都属于不同的消费组。那么所有的消息都会被广播给所有的消费者。那么一个消息会被所有消费者处理。

3.2 客户端开发

一个正常的客户端需要一下几个步骤：

配置消费者客户端参数及创建相应的消费者实例。
订阅主题
拉取消息
提交消费位移
关闭消费者实例。

3.2.1 必要参数

bootstrap.servers。和生产者中一样
group.id: 消费者组的名称，默认为“”。如果为空，会报错。一般会设置成具有一定业务意义的名称。
key.deserializer 和 value.deserializer:用于反序列化。

3.2.2 订阅主题与分区

订阅方式：AUTO_TOPICS:集合订阅的方式 AUTO_PATTERN:正则订阅方式 USER_ASSIGNED:assign方式

三种方式互斥，一个消费者只能使用一种。否则会报错。

1.消费者可以订阅一个或者多个主题。

consumer.subscribe(Arrays.asList(topic1));
consumer.subscribe(Arrays.asList(topic2));
consumer.subscribe(Pattern.complie("topic-.*"));

可以使用集合或者正则表达式的形式订阅特定模式的主题。如果前后2次订阅了不通的主题，以最后一次为准。

2.消费者还可以通过KafkaConsumer中的assign()方法订阅主题主题中特定的分区。

public void assign(Collection partitions)


//通过该方法可以获取主题下的所有分区信息 （包括 AR ISR OSR集合）
public List partitionsFor(String topic, Duration timeout)

有以上方法，所以我们可以通过assign方法也能实现订阅主题（全部分区）的功能。

3.消费者可以通过unsubscribe()方法来取消主题的订阅。

3.2.3 反序列化

生产者使用序列化把对象转为字节数组才能发送给kafka, 消费者需要用对应的反序列化将字节数组转化为对象。

都可以自定义序列化方式，不过生产者和消费者得配对。

3.2.4 消费消息

Kafka中的消费是基于拉模式的。

//拉取消息方法
public ConsumerRecords poll(final Duration timeout)

Kafka消费消息是一个不断循环拉取的过程，也就是重复的调用poll方法。poll方法是所订阅主题（分区）上的一组消息。

3.2.5 位移提交

消费者中的offest来表示消费到分区中某个消息所在的位置。需要持久化保存，不然重启后，无法知道消费到哪个位置。

//获取消费位置(position)
public long position(TopicPartition partition)
//获取已经提交过的消费位移（committed Offset）
public OffsetAndMetadata committed(TopicPartition partition)

position = committed offest = lastConsumedOffset +1

位移提交时机：

消费者消费获取一批消息，如果消费一部分，然后异常导致没有位移提交，就会导致重复消费。

位移提交方式

自动提交（默认）：enable.auto.commit配置为true，然后定期提交。auto.commit.interval.ms配置周期，默认5s.

缺点：重复消费、消息丢失问题优点：编码简单

手动提交：enable.auto.commit配置为false。

同步提交：commitsync 可以按分区提交

异步提交：commitAsync 可以增加回调方法

 public void commitSync()
 public void commitSync(Duration timeout)
 public void commitSync(final Map offsets)
 public void commitSync(final Map offsets, final Duration timeout)
   
 public void commitAsync()
 public void commitAsync(OffsetCommitCallback callback)
 public void commitAsync(final Map offsets, OffsetCommitCallback callback)

异步提交回调函数失败，如果重试，会有先后问题，导致重复消费。

3.2.6 控制或关闭消费

Kafka提供了对消费速度进行控制的方法。通过pause()和resume()方法来分别实现暂停和恢复。

3.2.7 指定位移消费

新消费者加入时，没有可以查找的消费位移。配置auto.offset.restart可以在找不到消费位移时决定从何处开始消费

latest 从分区末尾开始，也就是下一条
earliest:从0开始
none:找不到时抛出异常。

以上只是找不到时的处理。seek可以指定位移：

public void seek(TopicPartition partition, long offset)

seek只能重置分区的消费位置，而拉取哪个分区的消息是poll中实现的，所以seek之前必须要先poll

通过seek可以跳过或者回溯消息。

3.2.8 再均衡

分区的所有权从一个消费者转移到另一个消费者的行为。

优点：高可用，伸缩性。可以安全的删除消费组内的消费者或者添加新的消费者。

缺点：

再均衡过程中，消费组不可用。
消费者状态丢失。比如：消费者还没提交消费位移的时候，发生再均衡，会导致重复消费。

public void subscribe(Collection topics)
public void subscribe(Collection topics, ConsumerRebalanceListener listener)
public void subscribe(Pattern pattern)
public void subscribe(Pattern pattern, ConsumerRebalanceListener listener)

ConsumerRebalanceListener:再均衡监听器，用来设定再均衡动作前后的一些准备和收尾动作。

public interface ConsumerRebalanceListener {
  //会在再均衡开始之前和消费者停止读取消息之后被调用 partitions：重分配前
  void onPartitionsRevoked(Collection partitions);
  //在重新分配分区之后和消费者开始读取消息之前被调用。partitions：重分配后
  void onPartitionsAssigned(Collection partitions);

3.2.9 消费者拦截器

Kafka会在poll方法返回结果之前，调用拦截器的onConsume方法，对消息进行定制化的操作。

public interface ConsumerInterceptor extends Configurable, AutoCloseable {
  //在poll方法返回结果前
  public ConsumerRecords onConsume(ConsumerRecords records);
  //在提交完消费位移之后。
  public void onCommit(Map offsets);
  public void close();

3.2.10 多线程实现

生产者是现成安全的，但是消费者不是。

//KafkaConsumer中
//通过这个方法判断是不是只有一个线程在操作。    相当与一个锁，将refcount计数+1
private void acquire() {
        long threadId = Thread.currentThread().getId();
        if (threadId != currentThread.get() && !currentThread.compareAndSet(NO_CURRENT_THREAD, threadId))
            throw new ConcurrentModificationException("KafkaConsumer is not safe for multi-threaded access");
        refcount.incrementAndGet();
    }
//释放锁
    private void release() {
        if (refcount.decrementAndGet() == 0)
            currentThread.set(NO_CURRENT_THREAD);
    }

实现方式：使用滑动窗口

一个方格代表一个批次的消息，一个滑动窗口包含若干方法，startOffset滑动窗口开始位置，endOffset结束位置，

每当startOffset中的消息被消费完成，就能提交这部分位移，窗口向前滑动一步。

一个方格代表一个线程，如果startOffset无法被消费完成，悬停一定时间后就可以重试，重试失败就转入重试队列，再不行就进入死信队列。

3.2.11 重要消费参数

fetch.min.bytes: 拉取请求中能从Kafka中拉取的最小数据量。如果小于该值，会进行等待。
fetch.min.bytes: 拉取的最大数据量。
fetch.max.wait.ms：与fetch.min.bytes参数相关，防止一直等待。

4 主题与分区

4.1 优先副本的选举

优先副本：AR集合的第一个副本[1,2,0] 优先副本为1。

4.2 文件目录

一个主题有很多分区，分区有很多副本，一个副本对应一个目录，目录下主要有

三类文件。 *.index *.log *.timeindex

4.3 日志索引

Kafka索引文件以稀疏索引的方式构造消息的索引。每当写入一定量的消息时，偏移量索引文件和时间戳索引文件分别增加一个偏移量索引项和时间戳索引项。

在索引中使用二分查找法。

4.4 日志快速读取

日志删除：

日志压缩：相同key的value，只保留最新

磁盘存储：文件只允许追加，不允许修改。其实是顺序写磁盘的一种，加快了速度。

页缓存：Kafka不使用Java虚拟机缓存数据，使用页缓存。Jvm gc会变慢。

零拷贝：应用程序直接请求内核磁盘中的数据传输给socket.

5、队列

就是日志存储，按顺序存储，然后按位移消费。

你可能感兴趣的:(Kafka,kafka,分布式,java)

AI 时代，学习 Java 应如何入手？琢磨先生David 人工智能 java
一、Java的现状：生态繁荣与AI融合的双重机遇在2025年的技术版图中，Java依然稳坐企业级开发的“头把交椅”。根据行业统计，Java在全球企业级应用中的市场份额仍超过65%，尤其在微服务架构、大数据平台和物联网（IoT）领域占据核心地位。随着云原生技术的普及，Java生态正经历新一轮进化：轻量化框架通过无服务器架构优化，启动速度提升300%，内存占用降低50%，使得Java在容器化部署中更具
Java 处理 json 格式数据解析为 csv 格式李昊哲小课数据分析 Java 大数据 java json 开发语言大数据数据分析
Java处理json格式数据解析为csv格式如果不使用JSON工具库，你可以手动解析JSON格式字符串并将其转换为CSV格式字符串。以下是一个简单示例，展示如何实现这一功能。示例代码下面的示例代码手动处理JSON字符串，将其转换为CSV格式字符串：/***接收JSON字符串，去掉开头和结尾的方括号，按对象划分。*通过extractKeys方法提取字段名，添加到CSV的第一行。*逐项解析JSON对象
Apache Doris整合Iceberg + Flink CDC构建实时湖仓体的联邦查询分析架构 MfvShell apache flink 架构 Flink
随着大数据技术的迅猛发展，构建实时湖仓体并进行联邦查询分析成为了许多企业的迫切需求。在这篇文章中，我们将探讨如何利用ApacheDoris整合Iceberg和FlinkCDC来构建这样一个架构，并提供相应的源代码示例。简介实时湖仓体是一种灵活、可扩展的数据架构，结合了数据湖和数据仓库的优势。ApacheDoris是一款开源的分布式SQL引擎，专注于实时分析和查询。Iceberg是一种开放式表格格式
【Apache Storm】茉菇 apache storm 大数据
一、Storm简介1、概述官网地址：https://storm.apache.org/index.htmlApacheStorm是一个开源的、分布式的实时计算系统，专为处理流式数据而设计。它能够处理大量数据流并在极低的延迟下提供实时的结果。相比于传统的批处理系统，Storm具有处理无限数据流的能力，支持非常高的可扩展性和容错机制。Storm可以适用于多种编程语言，具有高度的灵活性。2、核心功能分布
Java数据类型 Arrays VS ArraysList VS LikedList 解析 fantasy_4 Java java
在学习Java过程中，在刷题时总是搞不清楚这三种数据结构的区别，打算写篇文章记录一下ArraysVSArrayListArrayListVSLinkedList总结ArraysVSArrayListArraysArrayList类型Java的基本数据类型Java集合框架中的一个类，实现了List接口存储内容基本数据类型+对象引用对象引用可变性数组长度创建后不可变长度可变适用场景查询元素会比较快，直
HashMap 的底层实现宋发元哈希算法算法
HashMap的底层实现HashMap简介HashMap主要用来存放键值对，它基于哈希表的Map接口实现，是常用的Java集合之一，是非线程安全的。HashMap可以存储null的key和value，但null作为键只能有一个，null作为值可以有多个JDK1.8之前HashMap由数组+链表组成的，数组是HashMap的主体，链表则是主要为了解决哈希冲突而存在的（“拉链法”解决冲突）。JDK1.
vue3+springboot电影院售票选座管理系统 qq_3166678367 spring boot 后端 java
目录本系统(已开发完成)->成品实现截图开发技术本系统支持的技术栈源码获取详细视频演示：文章底部获取博主联系方式！！！！本课题重点核心代码部分展示论文提纲来自指导老师帅的肯定视频演示/源码获取本系统(已开发完成)->成品实现截图开发技术关键技术实现：在Java的开发过程中，可以使用HTML、CSS、JavaScript等前端技术来实现系统的用户界面设计和交互功能。后端可以使用Java语言编写业务逻
Node.js系列（4）--微服务架构实践一进制ᅟᅠ ‌‍‎‏ Node.js 架构 node.js 微服务
Node.js微服务架构实践引言微服务架构已成为构建大规模Node.js应用的主流选择。本文将深入探讨Node.js微服务架构的设计与实现，包括服务拆分、服务治理、通信机制等方面，帮助开发者构建可扩展的微服务系统。微服务架构概述Node.js微服务架构主要包括以下方面：服务拆分：业务领域划分与服务边界服务治理：服务注册、发现与负载均衡通信机制：同步与异步通信方案数据管理：分布式事务与数据一致性可观
2025年计算机毕业设计springboot 智慧社区管理系统 zhihao503 课程设计 spring boot 后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于智慧社区管理系统的研究，现有成果多聚焦于单一功能模块的数字化（如物业缴费或门禁系统），缺乏对多场景服务整合与用户体验优化的系统性研究。国外研究侧重物联网技术应用（如新加坡“智慧国”计划中的社区传感器网络），而国内研究更多关注管理平台的基础框架设计，但针对业主、物业、设备多方
java实现二叉树的深度优先遍历开往1982 深度优先算法 java
深度优先三种遍历方法1.先序遍历2.中序遍历3.后序遍历1.定义树节点（这里我重构了tostring方法）packagecom.data.tree;publicclassNode{intvalue;Nodeleft;Noderight;publicNode(intval){value=val;}@OverridepublicStringtoString(){return"Node[value="+
flink从kafka读取数据写入clickhouse本地表的实现 Breatrice_li kafka flink 分布式大数据
实现功能因为直接写clickhouse的分布式表在数据量比较大的时候会有各种问题，所以做了一个flink读取kafka数据然后路由写入到相应的本地表节点，并且关于不同的表的配置信息可以随时更改并设置生效时间。实现流程首先从kafka将数据读取过来然后进行相应的处理及逻辑判断写入到对应的clickhouse表格中最后根据CDC读取来的配置信息进行相应节点的hash路由，直接写入本地表读取kafka数
demo flink写入kafka_Flink 写入数据到 Kafka ONES Piece demo flink写入kafka
Flink写入数据到Kafka前言通过Flink官网可以看到Flink里面就默认支持了不少sink，比如也支持Kafkasinkconnector(FlinkKafkaProducer)，那么这篇文章我们就来看看如何将数据写入到Kafka。准备Flink里面支持Kafka0.8、0.9、0.10、0.11.这里我们需要安装下Kafka，请对应添加对应的FlinkKafkaconnector依赖的版
Flink读取kafka数据并写入HDFS 王知无(import_bigdata) Flink系统性学习专栏 hdfs kafka flink
硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021年从零到大数据专家面试篇之消息队列篇2021年从零到大数据专家面试篇之Spark篇2021年从零到大数据专家面试篇之Hbase篇
java for循环内执行多线程 m0_74823434 面试学习路线阿里巴巴资料职业发展 java python 开发语言后端
目录一、java用多线程来加快循环效率（推荐第3种！！！！）?第一种：线程池搭配闭锁?第二种：分页概念执行线程?第三种：分页概念执行线程进阶版！！！！一、java用多线程来加快循环效率（推荐第3种！！！！）第一种：线程池搭配闭锁涉及知识：Executors（线程池）、CountDownLatch（闭锁）优点：代码简洁，方便阅读，性能稳定；缺点：Executors创建的线程池是公用的，如果多个地方使
Kafka系列之—向Kafka 写入数据（四）葛旭朋 Kafka kafka 分布式 java
一，创建Kafka生产者1.1必选的三个属性1.1.1bootstrap.servers指定broker的地址清单，不需要包含所有的broker地址，生产者会从给定的broker里找到其它broker的信息，建议最少提供两个broker的信息。1.1.2key.serializerbroker希望接收到的消息的键和值都是字节数组。1.1.3value.serializer指定的类会将值序列化。1.
Kafka 数据写入问题喝醉酒的小白 DBA kafka 分布式
目录标题分析思路1.**生产者配置问题**：Kafka生产者的配置参数生产者和消费者的处理确定并优化2.**网络问题**：3.**Kafka集群配置问题**：unclean.leader.election.enable4.**Zookeeper配置问题**：5.**JVM参数调优**：6.**副本因子和同步复制**：分析思路针对您提到的Kafka数据写入问题，以下是一些具体的原因和排查命令：1.生
Java开发者必看！零成本集成DeepSeek-R1打造AI办公神器，源码级实战教程让你效率翻倍！ Leaton Lee java 人工智能开发语言
目录开篇互动一、为什么是DeepSeek-R1？它凭什么碾压传统AI工具？二、手把手部署DeepSeek-R1本地环境（附避坑指南）步骤1：Docker一键部署步骤2：下载模型步骤3：验证部署三、Java整合DeepSeek-R1：从理论到实战1.添加HTTP客户端依赖（以SpringBoot为例）2.封装AI工具类（核心代码解析）3.实战场景1：自动生成周报（附Prompt技巧）四、高阶玩法：A
列出0 racle Forms配置文件？思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
OracleForms配置文件OracleForms应用程序的配置涉及到多个文件，这些文件用于定义运行时环境、数据库连接、安全设置等。以下是与OracleForms相关的常见配置文件：1.formsweb.cfg位置：通常位于/forms/server/formsweb.cfg或WebLogic域中的指定目录。用途：此文件包含启动Forms应用所需的各种参数和属性，如表单模块名称、数据库连接字符串
【Kafka】Kafka写入数据此木|西贝 Kafka kafka 分布式
不管是把Kafka作为消息队列还是数据存储平台，总是需要一个可以往Kafka写入数据的生产者，一个可以从Kafka读取数据的消费者。生产者创建一个ProducerRecord对象，包含目标topic和发送的内容；另外可以指定键、分区、时间戳或标头对数据进行分区；如果没有显示指定分区，数据将会传给分区器，确定往哪个主题和分区发送数据。消息添加到一个消息批次，该批次所有的消息被发送到同一个主题和分区；
小白学java日记day22--单例实例兰翎翡竹
定义一个类只允许有一个对象,建立一个全局的访问点,提供出去供大家使用.分析:1.我们肯定要建立一个单例类来描述2.只允许有一个对象3.全局的访问点:说的就是当前的s----通过static实现的4.提供出去5.给大家使用总括:1.传值.作为全局的访问点.解决一个全局使用的类，频繁创建和销毁。拥有对象的唯一性，并保证内存中对象的唯一。可以节省内存，因为单例共用一个实例，有利于Java的垃圾回收机制。
Java集合之HashSet集合小白的编程日记 java java
文章目录前言一、HashSet集合特点二、HashSet集合的初始化三、HashSet集合中的成员方法1.添加集合元素2.删除集合元素3.查询集合元素4.修改集合元素5、其他成员方法四、集合的遍历总结前言HashSet集合继承了AbstractSet类，实现了Set接口。其框架图如下：一、HashSet集合特点存放单列元素，无序而且不重复。线程不安全，效率高。集合元素可以为null。没有下标，不可
深入理解 TypeScript 中的迭代器（Iterators）与生成器（Generators）念九_ysl typescript 前端 typescript
一、为什么需要迭代协议？在现代JavaScript/TypeScript开发中，我们经常需要处理各种集合型数据：数组、Map、Set甚至是自定义数据结构。ES6引入的迭代协议（IterationProtocols）正是为了解决统一遍历机制的问题。通过迭代器模式，我们可以：为不同的数据结构提供统一的访问接口实现惰性计算（LazyEvaluation）支持现代语言特性（for...of,扩展运算符等）
分布式事务3PC解决了2PC哪些问题？ java干货仓库八股文汇总分布式事务分布式 java 面试
三阶段提交（3PC，Three-PhaseCommit）是对二阶段提交（2PC，Two-PhaseCommit）的改进，旨在解决2PC的一些固有缺陷，特别是在分布式系统中的容错性和性能问题。以下是3PC比2PC更好的原因及其优势的详细分析：1.二阶段提交（2PC）的问题2PC是一种经典的分布式事务协议，分为两个阶段：准备阶段（PreparePhase）：协调者向所有参与者发送准备请求。参与者执行事
思途CMS高并发、高性能、高可用架构设计 php
一、整体架构概述思途CMS采用分层架构设计，整体架构分为客户层、接入层、站点层、数据存储层和缓存层。各层之间通过松耦合的方式协同工作，确保系统在高并发场景下的高性能和高可用性。通过分布式部署、负载均衡、多级缓存等技术手段，思途CMS能够有效应对大规模用户访问，保障系统的稳定性和响应速度。二、各层技术特点及实现方式客户层1.1CDN加速思途CMS支持与主流CDN服务商（如阿里云CDN、腾讯云CDN等
如何有效判断与排查Java GC问题 java算法
目录一、GC的重要性与对性能的影响（一）GC对性能的影响简要分析1.GC暂停与应用停顿2.GC吞吐量与资源利用率3.GC对内存管理的作用：资源回收4.GC策略与优化的选择（二）GC的双刃剑二、GC性能评价标准（一）GC性能评价标准：延迟（Latency）与吞吐量（Throughput）延迟STW（Latency）吞吐量（Throughput）（二）SLA与实际业务需求的结合1.如何结合SLA和GC
06.动态代理设计模式 java
06.动态代理设计模式目录介绍01.为何要动态代理1.1为何要动态代理1.2动态代理思考02.动态代理的概念2.1动态代理定义2.2动态代理类比理解2.3动态代理参与者2.4动态代理步骤03.动态代理的实现3.1罗列一个场景3.2用一个例子理解代理3.3基于接口动态代理3.4基于类动态代理3.5动态代理模版代码04.动态代理案例4.1动态代理和反射4.2Java中代理4.3Retrofit核心思想
Java的泛型一朵忧伤的蔷薇 java windows 开发语言
Java的泛型（Generics）是一种编程技术，它允许类、接口和方法在定义时使用参数化类型。通过泛型，可以编写更加通用和类型安全的代码。以下是Java泛型的一些关键知识点：1.泛型类（GenericClass）定义泛型类时，使用尖括号{privateTt;publicvoidset(Tt){this.t=t;}publicTget(){returnt;}}这里的T是一个类型参数，可以在实例化类时
Java的正则表达式一朵忧伤的蔷薇 java 正则表达式开发语言
Java中的正则表达式(RegularExpressions,简称regex)是一种强大的工具，用于在字符串中搜索、匹配和替换特定的模式。以下是Java正则表达式的一些基础知识点：1.基本语法字符类:.匹配任意单个字符（除了换行符）。\d匹配任意数字，相当于[0-9]。\D匹配任意非数字。\w匹配任意字母、数字或下划线，相当于[a-zA-Z0-9_]。\W匹配任意非字母、数字或下划线。\s匹配任意
按照时间排序的分布式游标分页像云~ 记录分布式
背景最近有这么一个需求，就是在分页查询的时候，需要返回最近的pagesize条记录，即按照时间倒序的近pagesize条记录。有两个问题：一个就是这些记录来自于不同的存储位置，不能通过一次查询统一排序取数据，而需要分开查询读入，再汇总统一排序另一个就是在进行分页的时候，要保证当前页数据与上一页的连贯性，有点类似刷短视频的瀑布流。即分页查询是统一的，而数据存储是分布式的。方案由于是在高并发的场景下，
深入探索 dubbo-rpc-jsonrpc：跨语言服务调用的高效桥梁郁铎舒
深入探索dubbo-rpc-jsonrpc：跨语言服务调用的高效桥梁dubbo-rpc-jsonrpcApacheDubbo-rpc-jsonrpc是一个用于ApacheDubbo的JSON-RPC协议实现项目。它提供了一个用于ApacheDubbo的JSON-RPC协议实现库和工具。适合用于在应用程序中处理分布式服务。项目地址:https://gitcode.com/gh_mirrors/dub
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。