吉星J_x

Kafka 学习笔记

创作不易，各位看官点赞收藏.

文章目录

Kafka 学习笔记
- 1、消息队列 MQ
- 2、Kafka 下载安装
- - 2.1、Zookeeper 方式启动
  - 2.2、KRaft 协议启动
  - 2.3、Kafka 集群搭建
- 3、Kafka 之生产者
- - 3.1、Java 生产者 API
  - 3.2、Kafka 生产者生产分区
  - 3.3、Kafka 生产者常见问题
- 4、Kafka 之 Broker
- - 4.1、Broker 节点上下线
  - 4.2、Broker 副本
  - 4.3、Broker 文件存储机制
- 5、Kafka 之消费者
- - 5.1、消费者组
  - 5.2、Java 消费者 API
  - 5.3、消费者分区分配
  - 5.4、消费者 offset 维护
  - 5.5、消费者常见问题
- 6、Kafka-Eagle 监控
- 7、Spring Boot 整合 Kafka
- - 7.1、Kafka 生产者
  - 7.2、Kafka 消费者

Kafka 学习笔记

Kafka：是一个开源的分布式事件流平台，用于高性能数据管道、流分析、数据集成和关键任务应用。在一些大数据领域中通常使用 kafka 作为消息队列，在 JavaEE 开发中也有 ActiveMQ、RabbitMQ、RocketMQ 等等消息队列。

1、消息队列 MQ

消息队列是一种在分布式系统中用于不用组件之间传递和处理数据的通信机制，基于异步通信模式，允许发送者将消息发送到队列中，接受者从队列中获取消息数据并进行处理。

消息队列几种模式：

点对点模式：消息生产者将消息放入队列，每一条消息只能被一个消费者消费，消费者将消息处理完以后会将消息从队列中移除，这种适合单一消息被一个消费者处理的场景。

发布 - 订阅模式：生产者将消息发布到一个主题中，多个消费者可以订阅主题来接收消息，每一个消费者都会收到相同的消息，消息会被保存即使被消费也不会被删除。

应用场景：

限流消峰：MQ 可以将系统超量的请求进行暂存，以便后期系统进行处理调度，从而避免请求的的丢失和系统被压垮。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gLys6siY-1692610909240)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20221125185444191-16917431184751.png)]

异步和解耦：上游系统去调用下游系统时采用同步调用方式，系统的吞吐量会大大降低，并且上下游系统的耦合度增加。一般会在上下游系统之间添加一个MQ，上游系统将消息数据给 MQ 然后直接返回给用户，后面的所有操作由 MQ 进行请求下游操作，如果失败了就进行重试。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bUhYcjMH-1692610909241)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20221125190838306-16917431184763.png)]

数据收集：分布式系统会产生大量的数据，例如业务日志、监控数据等。针对这些数据进行实时采集和处理，然后对数据进行分析操作，MQ 也可以完成这类操作。

2、Kafka 下载安装

下载地址https://www.apache.org/dyn/closer.cgi?path=/kafka/3.5.0/kafka_2.13-3.5.0.tgz

# 解压
tar -zxvf kafka_2.13-3.5.0.tgz 
cd kafka_2.13-3.5.0

注意：

在 kafka2.8.0 之前必须需要依赖 zookeeper 组件，在之后可以选择不依赖 zookeeper 组件，而是以 KRaft 协议启动。
kafka 需要 Java 环境，需要配置环境变量。

2.1、Zookeeper 方式启动

配置文件 - server.properties ：

# 常用配置
# 身份唯一标识，不能重复
broker.id=0
# 日志文件
log.dirs=/tmp/kafka-logs
# 依赖的zookeeper节点地址，一般会加一个kafka节点
zookeeper.connect=localhost:2181/kafka	
# 与zookeeper连接超时时间
zookeeper.connection.timeout.ms=18000

启动 kafka 服务：

# 先启动一个 kafka 自带的 zookeeper，-daemon 后台运行
bin/zookeeper-server-start.sh -daemon config/zookeeper.properties

# 启动 kafka 服务
bin/kafka-server-start.sh -daemon config/server.properties

2.2、KRaft 协议启动

配置文件：修改 config/KRaft/server.properties 文件。

# 生成集群UUID(只执行一次)
KAFKA_CLUSTER_ID="$(bin/kafka-storage.sh random-uuid)"
# 格式化日志目录(只执行一次)
bin/kafka-storage.sh format -t $KAFKA_CLUSTER_ID -c config/kraft/server.properties
# 启动kafka服务
bin/kafka-server-start.sh -daemon config/kraft/server.properties
# 停止服务
bin/kafka-server-stop.sh

脚本简单使用：

# 创建一个主题
bin/kafka-topics.sh --create --topic quickstart-events --bootstrap-server localhost:9092
# 查看某个主题参数信息
bin/kafka-topics.sh --describe --topic quickstart-events --bootstrap-server localhost:9092

# 向主题中写入消息
bin/kafka-console-producer.sh --topic quickstart-events --bootstrap-server localhost:9092
# 阅读消息
bin/kafka-console-consumer.sh --topic quickstart-events --from-beginning --bootstrap-server localhost:9092

2.3、Kafka 集群搭建

KRaft 方式搭建集群：

修改配置文件：

# 每一个节点的唯一标识id，不能重复
node.id=0

# 集群中每个 Controller IP地址和端口号
controller.quorum.voters=0@192.168.32.135:9093,[email protected]:9093,[email protected]
# 内网监听ip地址
listeners=PLAINTEXT://192.168.32.137:9092,CONTROLLER://192.168.32.137:9093
# 外网监听ip地址
advertised.listeners=PLAINTEXT://192.168.32.137:9092

生成集群唯一 UUID：

# 生成uuid，并把uuid记录下来
./bin/kafka-storage.sh random-uuid
gfCReVjpRqWi3RzL-sg7Lw

# -t 的参数就是生成的唯一集群id，每个节点都要根据这个id去执行命令
./bin/kafka-storage.sh format -t gfCReVjpRqWi3RzL-sg7Lw -c ./config/kraft/server.properties

启动服务：

# 启动 kafka 服务
./bin/kafka-server-start.sh -daemon ./config/kraft/server.properties

3、Kafka 之生产者

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YZp3ESQp-1692610909242)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20230814170630024.png)]

3.1、Java 生产者 API

导入依赖：

<dependency>
    <groupId>org.apache.kafkagroupId>
    <artifactId>kafka-clientsartifactId>
    <version>3.5.1version>
dependency>

代码编写：

public static void main(String[] args) throws ExecutionException, InterruptedException {
    Properties properties = new Properties();
    // Kafka服务端的主机名和端口号
    properties.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "192.168.32.135:9092,192.168.32.136:9092,192.168.32.137:9092");
    // 等待所有副本节点的应答
    properties.put(ProducerConfig.ACKS_CONFIG, "0");
    // 消息发送最大尝试次数，默认一直重试
    properties.put(ProducerConfig.RETRIES_CONFIG, 0);
    // 一批消息处理大小，默认16KB
    properties.put(ProducerConfig.BATCH_SIZE_CONFIG, 16384);
    // 请求延时，默认0
    properties.put(ProducerConfig.LINGER_MS_CONFIG, 1);
    // 发送缓存区内存大小,默认32MB
    properties.put(ProducerConfig.BUFFER_MEMORY_CONFIG,33554432);
    // key序列化
    properties.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());
    // value序列化
    properties.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());

    // kafka 生产者对象
    KafkaProducer<String, String> producer = new KafkaProducer<>(properties);

    // 构建消息
    ProducerRecord<String, String> message = new ProducerRecord<>("quickstart-events", "key1", "value1");
    /**
         * 有两种消息发送方式：
         * 1：异步方式：send()方法返回一个异步Future对象，
         * 2：回调异步方式：可以在构建参数时设置一个回调方法
         * 3：同步发送：根据send()返回的future对象调用其get()方法进行阻塞主线程
         */
    //        Future send = producer.send(message); // 异步方式
    producer.send(message, new Callback() { // 回调异步
        @Override
        public void onCompletion(RecordMetadata recordMetadata, Exception e) {
            System.out.println("消息发送成功");
        }
    });

    // 同步发送，get()方法会阻塞线程，知道上一批数据全部发送成功，返回结果包含了消息主题、分区等信息
    RecordMetadata metadata = producer.send(message).get();
    producer.close();
}

注意：主线程会先将数据发送到缓冲区，然后由 sender 线程进行异发送，而同步发送是一批数据发送到缓冲区由 sender 线程发送到 kafka 集群才会允许下一批数据进行发送。

3.2、Kafka 生产者生产分区

消息分区：将同一个主题的消息数据分区数据到不同的 broker 机器上。

便于合理使用存储资源，每个分区存储在一个 Broker 上，可以将海量数据按照分区分割成一块一块存储在多台 Broker 上。合理控制分区任务，可以实现负载均衡效果。
提高并行度，生产者可以以分区单位进行发送，消费者可以以分区单位进行消费，大大提高数据的处理能力。

分区策略：生产者写入消息到 topic，Kafka 将依据不同的策略将数据分配到不同的分区中。

轮询分区策略：如果生产消息时，对应 key 值是 null，则使用轮询方式最大限度均匀分配到某个分区。
key 分区策略：生产消息时，key 值不为 null，但是没有指定具体分区，则按照 key 的 hash 值去取余你的分区数量确定对应分区。
指定分区：生产消息时，指定对应的分区则严格按照指定分区存储。
自定义分区策略：实现 Partitioner 接口，通过配置可以创建自定义分区策略。

注意：如果发送的分区不存在，则客户端一直会进行等待连接，阻塞线程所有线程。

自定义分区器：可以根据业务需求自定义分区器，实现 Partitioner 接口重写 partition() 方法。

// 自定义分区器
public class CustomerPartitioner implements Partitioner {

    /**
     * 重写对应的分区策略
     * @param topic 主题
     * @param key key 值
     * @param keyBytes 序列化后的key字节值
     * @param value value 值
     * @param valueBytes 序列化后的value值
     * @param cluster 一些集群信息，可以通过主题获取有几个分区
     * @return 数据发送到哪个分区
     */
    @Override
    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {
        if (key == null){
            return 0;
        }else {
            return 1;
        }
    }

    @Override
    public void close() {
    }

    @Override
    public void configure(Map<String, ?> configs) {
    }
}

// 配置对象配置对应的自定义分区器
properties.put(ProducerConfig.PARTITIONER_CLASS_CONFIG, CustomerPartitioner.class.getName());

3.3、Kafka 生产者常见问题

提高生产者吞吐量：主要是通过配置属性，结合实际生产环境调整配置。

batch.size：批次大小，默认 16 KB，可以根据需要修改对应大小。
linger.ms：缓冲时间，达到这个时间 sender 读取缓冲区数据进行发送，一般 5 ~ 100 ms，如果设置过长数据延迟性就变高。
buffer.memory：缓冲区大小，默认 32 MB，如果分区较多可以设置大一点，如果设置小了就会出现 sender() 数据不足导致等待。
compression.type：数据压缩方式，默认不压缩，可以使用压缩方式有：gzip、snappy、lz4、zstd，常用方式 snappy。

// 一批消息处理大小，默认16KB
properties.put(ProducerConfig.BATCH_SIZE_CONFIG, 16384);
// 请求延时，默认0
properties.put(ProducerConfig.LINGER_MS_CONFIG, 5);
// 发送缓存区内存大小,默认32MB
properties.put(ProducerConfig.BUFFER_MEMORY_CONFIG,33554432);
// 设置数据压缩方式
properties.put(ProducerConfig.COMPRESSION_TYPE_CONFIG, "snappy");

数据可靠性：kafka 生产者在生产数据时有三种 ACK 应答级别，不同应答数据可靠性不一样，默认级别是 -1(all)。

“0”：生产者发送数据不需要等数据落盘直接响应，这样就可能出现数据丢失，但是效率高。
“1”：生产者发送数据只需要 Leader 落盘成功不用等副本复制就直接响应，也可以出现副本数据丢失，如果 Leader 宕机副本成为 Leader 就会出现数据丢失。对于一些数据量大并且允许少量数据丢失。
“-1”、“all”：生产者发送数据只有 Leader 和所有副本都落盘才会应答响应，不会出现数据丢失。==但是可能出现数据重复问题，Leader 和副本都落盘成功，但是没给到响应前 Leader 宕机，生成者由于没有收到应答就会重新给新 Leader 发出数据，但是新 Leader 已经存在这条数据。==用于数据可靠性要求较高。

在同步副本数据时，如果某个副本无法应答 Leader，Leader 也不会应答生产者。但是 Leader 维护了 ISR 一个动态副本队列，如果超过默认 30s 没有副本心跳就会把对应副本剔除队列，这样就不会长期去等待无法同步的副本。

最佳实践方式：（ACK 级别为 -1） + （分区副本 >= 2） + （ISR 中应答最小副本 >= 2）。

// ACK 应答级别
properties.put(ProducerConfig.ACKS_CONFIG, "-1");
// ISR 副本超时时间，默认30分钟
properties.put(ProducerConfig.REQUEST_TIMEOUT_MS_CONFIG, 1000 * 60 * 30);

数据重复问题：

至少一次：ACK 级别为 -1，副本和 ISR 队列中数量大于等于2，但是存在数据重复问题。
最多一次：ACK 级别为 0，数据不会重复但是可能出现数据丢失问题。
精确一次：对于一些重要数据，数据可靠性高并且不能重复。

幂等性：指生产者向 Broker 发送多少条重复数据，Broker 都只会持久化一条数据。重复数据判断依据：PID(会话ID)、Partition(分区号)、SeqNumber(自增序列号)，三者都不相同则表示不同数据。

PID：每个客户端启动会生成一个 PID，重启会重新生成。(这就导致只能解决单会话内的数据重复问题)
Partition：数据存放的分区位置。
SeqNumber：消息的只增序列号。

/**
 * 开启幂等性：默认开启
 * 开启前提条件：max.in.flight.requests.per.connection等待请求数小于等于5
 *              retries：大于等于0
 *              ACK：-1
 */
properties.put(ProducerConfig.ENABLE_IDEMPOTENCE_CONFIG, true);

生产者事务：开启事务必须先开启幂等性，事务是基于幂等性的。

try {
    // 开启事务
    producer.beginTransaction();
    for (int i=0;i<10;i++){
        ProducerRecord<String, String> message = new ProducerRecord<>("topic-3",UUID.randomUUID().toString(), UUID.randomUUID().toString());
        producer.send(message);
    }
    // 提交事务
    producer.commitTransaction();
}catch (Exception e){
    // 回滚事务，如果数据发送出现异常就会回滚所有发送的数据
    producer.abortTransaction();
    e.printStackTrace();
}finally {
    producer.close();
}

注意：生产者在使用事务前需要指定自定义唯一的 transaction-id，在第一次使用事务会初始化一个 __transaction_state 主题数据，默认有 50 个分区，这里面存放着对事务数据的存放。

数据有序性：

单分区有序性：单分区会根据数据发送的先后顺序进行排序。
多分区有序性：由于是多分区在消费者消费时无法保证取到的数据是有序的，但是可以先把所有数据全部取出来，然后手动进行排序。

单分区有序：由于在 Sender 线程中最多缓存 5 个请求，第一个请求没有应答前可以发送第二个请求，就可能出现第一个请求失败后重试导致数据乱序，但是在 Kafka1.0 之后会缓存生产者发送的最近 5 个请求的元数据，会根据幂等性序列号进行排序然后再进行数据持久化。

/**
 * 保证单分区数据有序的前提条件：(也可以将最大请求数设置为1，只有一个请求缓存)
 */
properties.put(ProducerConfig.ENABLE_IDEMPOTENCE_CONFIG, true);
// sender 线程缓存最大请求数
properties.put(ProducerConfig.MAX_IN_FLIGHT_REQUESTS_PER_CONNECTION, 5);

4、Kafka 之 Broker

Zookeeper 模式：在 kafka2.8.0 之前是需要依赖 zookeeper 组件，由 zookeeper 负责集群元数据管理、控制器的选举等。

KRaft 模式：在 KRaft 中，一部分 broker 节点被指定为控制器，这些 Controller 提供 Zookeeper 的共识服务，集群的所有元数据以主题方式存储在 kafka 中。

注意：每一个 Broker 节点既可以充当 Broker，也可以充当 Controller 角色，两者也可以同时充当。

4.1、Broker 节点上下线

新建节点：修改新增节点配置，启动节点服务到集群中。

# -t 的参数就是生成的唯一集群id，每个节点都要根据这个id去执行命令
./bin/kafka-storage.sh format -t gfCReVjpRqWi3RzL-sg7Lw -c ./config/kraft/server.properties
# 启动 kafka 服务
./bin/kafka-server-start.sh -daemon ./config/kraft/server.properties

新建负载均衡计划：即使新增了节点，但是以前数据依然不会对新节点做负载均衡，需要我们自己去对旧数据做负载均衡。

创建负载均衡计划 json 文件：vim topic-to-move.json

{
    "version": 1, // 版本号固定1
    "topics": [ // 需要做负载均衡的主题名称
        {
            "topic": "topic-1"
        },
        {
            "topic": "topic-2"
        },
        {
            "topic": "topic-3"
        }
    ]
}

生成计划：

# --bootstrap-server：连接服务，--topic-to-move-json-file：指定负载均衡计划文件，--broker-list "0,1,2,3"：指定负载均衡的broker的id
./bin/kafka-reassign-partitions.sh --bootstrap-server 192.168.32.135:9092 --topics-to-move-json-file ./json/topic-to-move.json --broker-list "0,1,2,3" --generate

新计划 json 文件：vim increase-replication-factor.json，将生成的计划复制进去，然后执行计划。

# 执行计划命令
./bin/kafka-reassign-partitions.sh --bootstrap-server 192.168.32.135:9092 --reassignment-json-file ./json/increase-replication-factor.json --execute
# 验证是否执行成功
./bin/kafka-reassign-partitions.sh --bootstrap-server 192.168.32.135:9092 --reassignment-json-file ./json/increase-replication-factor.json --verify

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HIqaBd3l-1692610909244)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20230816113532281.png)]

节点下线：节点下线只需要将在均衡计划中主题对应的节点去掉需要下线节点 id，然后执行对应计划就可以，然后将节点关机。

4.2、Broker 副本

Kafka 副本：用于提高数据的可靠性，默认副本 1 个，生产环境一般配置 2 个。太多副本会增加磁盘存储空间也会增加网络上数据传输，降低效率。Kafka 中副本分为 Leader 副本和 Follower 副本，但是生产者和消费者都只会去操作 Leader 副本，Follower 副本只是用于存放备份数据。AR = ISR + OSR

AR：Kafka 分区中所有副本。
ISR：与 Leader 保持数据同步的 Follower 副本集合，如果 Follower 默认 30s 未向 Leader 副本同步数据，则会被踢出集合。
OSR：表示 Follower 与 Leader 副本同步超过延迟时间的副本。

Leader 选举：当 Leader 宕机以后，Follower 会根据一定规则选举出新的 Leader，在集群中由某个 Controller 节点用于选举新的 Leader。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dAYoxwlS-1692610909244)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20230816175330559.png)]

Broker 故障：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RlGuLYGG-1692610909244)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20230817093910619.png)]

LEO：每个副本的最后一个 offset，LEO 是每个副本最新的 offset + 1。
HW(高水位)：所有副本中最小的 LEO。

Follower 故障：首先会被踢出 ISR 队列，其它正常的 Broker 继续同步数据。当故障 Follower 重新上线后，它会读取磁盘记录的上次 HW 记录，并将 log 数据高于 HW 的数据截取掉，然后从 HW 部分开始向后继续从 Leader 同步数据，当数据同步到所有副本的 HW 水平就可以重新加入 ISR 队列。

Leader 故障：首先会被踢出 ISR 队列，然后选举出新的 Leader，为保证数据一致性，其它的 Follower 会将高于 HW 的数据裁剪掉，然后和新的 Leader 进行同步。

注意：这只能保证副之间数据一致性，但是不能保证数据不丢失或者不重复(旧 Leader 可能存在还未同步的数据)。

手动调整 Broker 副本：kafka 默认副本是均分分配在每个 Broker 上，可能出现指定副本需求。

创建副本分配文件：vim increase-replication-factor.json，将 topic-1 主题的副本放在 0、1 节点上。

{
    "version":1,
    "partitions":[
        {
            "topic":"topic-1",
            "partition":0,
            "replicas":[
                0,
                1
            ]
        },
        {
            "topic":"topic-1",
            "partition":1,
            "replicas":[
                0,
                1
            ]
        },
        {
            "topic":"topic-1",
            "partition":2,
            "replicas":[
                1,
                0
            ]
        },
        {
            "topic":"topic-1",
            "partition":3,
            "replicas":[
                1,
                0
            ]
        }
    ]
}

执行副本分配计划：

# 执行
./bin/kafka-reassign-partitions.sh --bootstrap-server 192.168.32.135:9092 --reassignment-json-file ./json/increase-replication-factor.json --execute
# 验证
./bin/kafka-reassign-partitions.sh --bootstrap-server 192.168.32.135:9092 --reassignment-json-file ./json/increase-replication-factor.json --verify

Leader Partition 自动平衡：正常情况 kafka 会将分区均匀分配到每一个 Broker 上。当某个 Leader 宕机，新 Leader 可能会集中在其它几台 Broker 上，这可能造成负载不均衡的情况，但是生产中一般会关闭这个功能，因为触发自动平衡很耗性能。

auto.leader.rebalance.enable：是否开启分区自动平衡，默认开启。
leader.imbalance.per.broker.percentage：默认值是10%，broker 中允许 Leader 不平衡比例，如果操作这个比例就会触发自动平衡。
leader.imbalance.check.interval.seconds：默认值 300s，检查 Leader 是否平衡的间隔时间。

增加分区副本：创建副本分配文件：vim increase-replication-factor.json，将 topic-1 主题的副本进行重新规划，然后执行计划。

4.3、Broker 文件存储机制

Broker 数据存储：一个 topic 可以分在多个 partition 上进行存储，一个 topic 下的分区有一个topic名-partition号的 log 文件夹，在这个文件夹下存储着生产者产生的数据，生产者生产的数据会不断追加在 log 文件末尾。

为了防止 log 文件过大导致数据定位效率低下，kafka 采取分片、索引机制。将 log 分片成一个个 Segment，每个Segment 默认大小是 1GB，每个 Segment 由 .index、.log、.timeindex 以及其它文件组成。(文件名称以当前 Segment 的第一条消息的 offset 命名)

.index：作为稀疏索引，每往 log 文件中写入 4KB 数据，就会向 index 文件中添加一条索引。
.log：存放数据文件。
.timeindex：时间戳索引文件，默认 kafka 数据保留7天，会根据这个文件去清除数据。

数据删除策略：kafka 默认数据保留7天，可以设置对应参数修改数据删除时间。

log.retention.hours：单位小时，默认168小时(7天)，优先级最低。
log.retention.minutes：单位分钟，如果设置这个值，小时单位就失效。
log.retention.ms：单位毫秒，如果设置这个值，分钟单位失效。
log.retention.check.interval.ms：设置检查周期，默认5分钟检查数据是否过期。
log.cleanup.policy=delete/compact：设置数据的删除策略。

delete：将过期数据删除。

基于时间(默认)：以 Segment 中所有记录的最大时间戳作为该文件时间戳，到了时间就把整个 Segment 文件删除。
基于大小：当数据超过存储容量，就会删除最早的 Segment 文件。

compact：数据压缩，将相同 key 的数据只保留最后一个版本数据，压缩后的 offset 不是连续的，如果不存在对应 offset 的数据就会拿去下一个 offset 的数据。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-N0W88klu-1692610909246)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20230817161834876.png)]

Kafka 高效读写：

kafka 本身是一个分布式集群，并且采用分区技术，对于生产者和消费者在操作数据提高了并行度。
读数据采用稀疏索引，在 .index 文件中存放了数据索引，可以快速定位数据。
采用顺序读写磁盘，在 .log 文件写入数据是追加数据到文件末端，顺序写数据速度快。
kafka 采用也缓存技术和零拷贝技术，kafka 应用层不关心存储的数据，不会对数据进行处理，所以保存数据时 kafka 会把数据交给操作系统的页缓存，再由操作系统完成数据持久化。零拷贝指消费者再消费数据时，先会查看页缓存中是否有数据，如果没有数据操作系统会从磁盘中读取数据到页缓存，然后操作系统直接通过网卡发送给消费者，并没有将数据加载到 kafka 的应用内存中。

5、Kafka 之消费者

消费方式：

pull 拉模式：消费者主动从 broker 拉取数据，kafka 采用该方式可以根据消费者的消费能力自定义数据拉取速度，但是存在 broker 没有数据，导致消费者循环拉取数据为空。
push 推模式：broker 主动向消费者推送消息，但是每个消费者消费速率不一样，可能出现消息来不及处理。

消费者工作流程：

offset：每个消费者对于每个分区都有一个消息偏移量，记录消费者消费到哪个位置了，这个 offset 数据会被持久化到 kafka 的 __consumer_offsets 这个主题中，即使消费者重启，也会从下一个消息进行消费。

5.1、消费者组

消费者组：由多个 consumer 组成，当消费者的 groupId 相同时这些消费者就属于同一个消费者组。

消费者组中的消费者负责消费不同分区数据，一个分区只能由一个组内的一个消费者消费。
消费者组之间相互不干扰，组之间可以消费同一个分区。
如果消费者数量多于分区数量，则多出来的消费者就会闲置。

消费者组初始化：每个 broker 节点都有一个 coordinator 协调器组件，辅助实现消费者组的初始化和分区分配，指定消费者组中消费者应该消费哪个分区。

coordinator 的选择：由消费者组 groupId 决定，（groupId 的 hash 值）% 50，（50 是消费者 __consumer_offsets 主题的分区数），找到 __consumer_offsets 在哪个分区上，就由这个分区上的 coordinator 协调器进行负责消费者组消费。
Consumer Leader 选择：由 coordinator 协调器从消费组中随机选择一个消费者作为 Leader，coordinator 会把消费的 topic 信息发送给Leader，再由 Leader 分配消费任务，具体哪个消费者消费哪个分区，然后将任务发送给 coordinator。
coordinator 分配任务：coordinator 会把 Leader 的分配任务发送给消费组中的所有消费者，按照规则进行消费。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-N5lznpgr-1692610909246)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20230818104642229.png)]

注意：所有消费者都和协调器保存 3s 的心跳包，也会有一个连接超时时间，默认 45 s 超过 45s 没有心跳包，那么这个消费者就会被移除，就会触发自动平衡重新分配任务。如果某个消费者某次处理数据时间超过 5 分钟，也会触发自动平衡，将任务交给其它消费者。

消费者消费流程：

fetch.min.bytes：每批次拉取最小大小，默认 1KB，如果不满足这个大小即使有消息也不会拉取。
fetch.max.wait.ms：一批数据未到达超时时间，默认500ms，超过这个时间就会拉取一次数据，即使没有达到最小拉取大小。
fetch.max.bytes：每批次最大抓取大小，默认50MB。
max.poll.records：一次拉取数据返回消息的最大条数，默认 500 条。

5.2、Java 消费者 API

消费者消费一个主题：

public static void main(String[] args) {
    Properties properties = new Properties();
    // 连接集群
    properties.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG,"192.168.32.135:9092,192.168.32.136:9092");
    // 设置消费者的消费组id
    properties.put(ConsumerConfig.GROUP_ID_CONFIG,"test2");
    // 设置key和value的反序列化
    properties.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
    properties.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
    
    KafkaConsumer<String, String> consumer = new KafkaConsumer<>(properties);
    ArrayList<String> topics = new ArrayList<>();
    topics.add("topic-1");
    // 设置订阅的主题
    consumer.subscribe(topics);

    // 进行拉取数据
    while (true){
        // 间隔多少秒拉取一次数据
        ConsumerRecords<String, String> records = consumer.poll(Duration.ofSeconds(1));
        // 拉取的数据
        for (ConsumerRecord<String, String> record : records) {
            System.out.println(record);
        }
    }
}

消费某一个分区：

// 消费某个主题下的某个分区
List<TopicPartition> topicPartitions = new ArrayList<>();
// 指定主题和分区
TopicPartition partition = new TopicPartition("topic-1", 0);
topicPartitions.add(partition);
consumer.assign(topicPartitions);

// 执行消费
while (true){
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofSeconds(1));
    for (ConsumerRecord<String, String> record : records) {
        System.out.println(record);
    }
}

5.3、消费者分区分配

消费分区策略：在消费者 Leader 分配消费任务时，会根据对应的分配策略分配任务。kafka 中主要分配策略：Range、RoundRobin、Sticky、CooperativeSticky，默认使用 Range + CooperativeSticky，可以使用组合分配策略。

// 设置消费分区策略
properties.put(ConsumerConfig.PARTITION_ASSIGNMENT_STRATEGY_CONFIG, RangeAssignor.class.getName() + "," + CooperativeStickyAssignor.class.getName());

Range：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NM0FNFcW-1692610909247)(https://jx-image-storage.oss-cn-hangzhou.aliyuncs.com/image/image-20230818145123076.png)]

注意：如果消费者组去消费多个主题，就可能存在数据倾斜问题，每个主题多出来的分区就会全部由前面的消费者进行消费。

RoundRobin：轮询消费，所有主题的所有分区和所有消费者进行排序，然后针对分区轮询指定消费者进行消费。

Sticky：粘性分配，尽量均衡分配分区，与 Range 相似，但是不是按照顺序进行分配分区，而是随机将分区分配给消费者。

5.4、消费者 offset 维护

消费者 offset ：表示消费者消费分区已经消费的位置，0.9版本之前，offset 是存放在 Zookeeper 中，o.9 版本之后是存放在 kafka 的 __consumer_offset 这个主题下的。主题的 key：groupId + tpoic + 分区号，value：offset 值，每隔一段时间就会将这个 topic 进行 compact 数据压缩。

自动 offset 维护：kafka 提供了自动提交 offset 功能，每当消费者消费数据，消费者可以自动向 __consumer_offset 主题提交 offset 数据。

enbale.auto.commit：是否开启自动提交 offset 功能，默认是 true。
auto.commit.interval.ms：自动提交 offset 的时间间隔，默认是 5s，单位是毫秒。

// 设置是否自动提交 offset
properties.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, true);
// 设置自动提交的时间
properties.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, 1000);

手动提交 offset 维护：自动提交 offset 不能掌握提交的时间，有时候需要手动去提交 offset。

同步提交：需要将最新一批消息提交完成才会继续拉取数据，提交 offset 并且会自动失败重试。
异步提交：处理数据完成后，发出提交 offset 请求后，就继续拉取数据，不会等 offset 提交是是否成功。

// 关闭自动提交
properties.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, false);

// 进行拉取数据
while (true){
    // 间隔多少秒拉取一次数据
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofSeconds(1));
    // 拉取的数据
    for (ConsumerRecord<String, String> record : records) {
        System.out.println(record);
    }
    // 提交 offset
    consumer.commitSync(); // 同步提交
    consumer.commitAsync(); // 异步提交，可以指定异步提交后的回调方法
}

指定 offset 消费：

earliest：对于同一个消费组，如果从未提交过 offset，自动将偏移量重置为最早偏移量，从头开始消费。但是如果这个消费组提交过 offset，那么效果和 lastest 效果一样。
latest（默认值）：如果没有提交过 offset，只能消费最新的消息，对于历史消息不能消费；如果提交过 offset，那么就从 offset 位置继续消费。
none：如果消费者组从未提交过 offset，那么就向消费者推送错误，如果有就继续按照 offset 消费数据。

指定 offset 进行消费：直接指定 offset 不行，需要等消费者分区完成后再指定 offset 才会生效。

// 设置订阅的主题，设置消费者分区事件
consumer.subscribe(topics, new ConsumerRebalanceListener() {
    // 消费者分区前，例如提交偏移量、释放资源
    @Override
    public void onPartitionsRevoked(Collection<TopicPartition> partitions) {

    }
    // 设置偏移量、初始化资源
    @Override
    public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
        // 指定消费的偏移量
        for (TopicPartition partition : partitions) {
            // 手动指定消费者从分区哪个 offset 开始消费
            consumer.seek(partition, 100);
        }
    }
});
// 进行拉取数据
while (true){
    // 间隔多少秒拉取一次数据
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofSeconds(1));
    // 拉取的数据
    for (ConsumerRecord<String, String> record : records) {
        System.out.println(record);
    }
}

按照时间消费：指定开始消费的时间，可以根据时间去获取 offset 值。

Map<TopicPartition, Long> timeForOffset = new HashMap<>();
// 设置消费者分区事件
consumer.subscribe(topics, new ConsumerRebalanceListener() {
    // 消费者分区前，例如提交偏移量、释放资源
    @Override
    public void onPartitionsRevoked(Collection<TopicPartition> partitions) {

    }
    // 设置偏移量、初始化资源
    @Override
    public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
        // 指定消费的偏移量
        for (TopicPartition partition : partitions) {
            // 设置对应消费的时间戳，key：指定分区，value：消费开始位置的时间戳，从当前时间前一天的消息进行消费
            timeForOffset.put(partition, System.currentTimeMillis() - 1000 * 60 * 60 * 24 * 10);
        }
        // 将时间转换成 offset
        Map<TopicPartition, OffsetAndTimestamp> offsets = consumer.offsetsForTimes(timeForOffset);
        // 将转换后的 offset 指定给消费者
        for (TopicPartition partition : partitions) {
            OffsetAndTimestamp offsetAndTimestamp = offsets.get(partition);
            consumer.seek(partition, offsetAndTimestamp.offset());
        }
    }
});

// 进行拉取数据
while (true){
    // 间隔多少秒拉取一次数据
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofSeconds(1));
    // 拉取的数据
    for (ConsumerRecord<String, String> record : records) {
        System.out.println(record);
    }
}

5.5、消费者常见问题

重复消费：消费者消费消息后但是没有到自动提交时间，这时消费者宕机后面重启后就会从上一次自动提交的位置进行消费，就会出现重复消费。

漏消费：设置为手动提交时，当消费者拉取数据后就手动提交 offset，但是消费者在进行处理数据时出现宕机，并没有正常消费数据，但是已经手动提交了 offset 下一次重启就会跳过没有正常消费的数据。

数据积压：当 kafka 中数据过多，消费者端不能够及时消费，导致数据时间过期会删除数据。例如：kafka 有三天数据需要消费，但是消费者消费这些数据需要4天，有些数据消费不及时就会丢失。

增加 topic 的分区数量，同时增加消费者数量。消费者=分区数，并行消费。
修改 fetch.min.bytes单次拉取大小，提高拉取效率。
修改 max.poll.records 单次最多拉取消息条数，默认 500 条并且对应修改拉取的最大大小。

6、Kafka-Eagle 监控

安装 MySQL 环境。
停止 kafka 集群，并修改 kafka 启动运行内存。

# 修改启动命令
vim ./bin/kafka-server-stop.sh

# 修改对应内存
# 内存参数
export KAFKA_ HEAP_OPTS="-server -Xms2G -Xmx2G --XX:PermSize=128m -XX:+UseG1GC -XX:MaxGCPauseMillis=200 -XX:ParallelGCThreads=8 -XX:ConcGCThreads=5 -XX:InitiatingHeapOccupancyPercent=70"
# Eagle 监控端口
export JMX_PORT="9999"

下载安装包并解压，官网地址：https://www.kafka-eagle.org/。
配置 Java 环境变量和 EFAK 环境变量。

# java 环境变量
vi /etc/profile
export JAVA_HOME=/usr/java/jdk1.8
export PATH=$PATH:$JAVA_HOME/bin

# EFAK 环境变量
vi /etc/profile
export KE_HOME=/data/soft/new/efak
export PATH=$PATH:$KE_HOME/bin

修改配置，vim ./config/system-config.properties。

# Zookeeper 配置方式
efak.zk.cluster.alias=cluster2
cluster2.zk.list=xdn10:2181,xdn11:2181,xdn12:2181

# 端口
efak.webui.port=8048

######################################
# kafka mysql jdbc driver address
######################################
efak.driver=com.mysql.cj.jdbc.Driver
efak.url=jdbc:mysql://192.168.32.143:3306/ke?useUnicode=true&characterEncoding=UTF-8&zeroDateTimeBehavior=convertToNull
efak.username=root
efak.password=xxxx

cluster1.efak.offset.storage=kafka

启动 ./bin/ke.sh start，然后通过 ip地址:端口可以直接访问。

注意：kafka-eagle 暂时只支持 kafka 的 Zookeeper 方式，不支持 Kraft 协议的方式。

Docker 安装 kafka-ui：

# 安装命令
docker run -p 9876:8080 \
    --name kafka-ui \
    -e KAFKA_CLUSTERS_0_NAME=kafka-1 \
    -e KAFKA_CLUSTERS_0_BOOTSTRAPSERVERS=192.168.32.135:9092,192.168.32.136:9092 \
    -e TZ=Asia/Shanghai \
    -e SERVER_SERVLET_CONTEXT_PATH="/" \
	-e AUTH_TYPE="LOGIN_FORM" \
	-e SPRING_SECURITY_USER_NAME=admin \
	-e SPRING_SECURITY_USER_PASSWORD="admin" \
	-e LANG=C.UTF-8 \
	-d provectuslabs/kafka-ui:latest

7、Spring Boot 整合 Kafka

导入依赖：

<dependency>
    <groupId>org.springframework.bootgroupId>
    <artifactId>spring-boot-starter-webartifactId>
    <version>2.7.13version>
dependency>
<dependency>
    <groupId>org.springframework.kafkagroupId>
    <artifactId>spring-kafkaartifactId>
    <version>2.8.0version>
dependency>

7.1、Kafka 生产者

修改配置：

spring:
  # kafka 相关配置
  kafka:
    bootstrap-servers: 192.168.32.135:9092,192.168.32.136:9092,192.168.32.136:9092
    # 生产者配置
    producer:
      key-serializer: org.apache.kafka.common.serialization.StringSerializer
      value-serializer: org.apache.kafka.common.serialization.StringSerializer
      retries: 3
      acks: -1
      compression-type: snappy
      buffer-memory: 64MB
      batch-size: 32KB

编写生产者代码：

// 注入kafka
@Resource
private KafkaTemplate<String, String> kafkaTemplate;

@GetMapping("/test1")
public void produce(String msg){
    for (int i=0;i<1000;i++){
        kafkaTemplate.send("topic-boot", UUID.randomUUID().toString() + i, UUID.randomUUID().toString());
    }
}

7.2、Kafka 消费者

修改配置：

spring:
  # kafka 相关配置
  kafka:
    bootstrap-servers: 192.168.32.135:9092,192.168.32.136:9092,192.168.32.137:9092
    # 消费者配置
    consumer:
      group-id: test
      key-deserializer: org.apache.kafka.common.serialization.StringDeserializer
      value-deserializer: org.apache.kafka.common.serialization.StringDeserializer

编写代码：

// 消费者进行消费，id:全局唯一标识
@KafkaListener(id = "consumer1", groupId = "test-1", topics = {"topic-boot","topic-1"})
public void consumer(ConsumerRecord<?, ?> record){
    // msg：接收到的数据
    System.out.println(record);
}

你可能感兴趣的:(kafka,学习,笔记)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象