运维小菜

Kafka 3.x 三万三千字精讲（侧重原理）

Kafka 3.x

一、Kafka原理
- 1.Kafka基础架构
- - 1）发布订阅模式
  - 2）架构模型
- 2.生产消息原理
- - 1）原理概述
  - 2）数据可靠性
- 3.broker工作原理
- - 1）kafka在zk上存储的信息
  - 2）副本Leader选举流程
- 4. 故障处理（Offset / HW / LEO）
- - 1）正常情况
  - 2）Follower故障
  - 3）Leader故障
- 5.Topic副本存储原理
- - 1）存储机制
  - 2）.log / .index / .timeindex
  - 3）存储细节
  - 4）分区副本分配
  - - a. 自动分区
    - b.手动分区
- 6.消费者原理
- - 1）消费者组
  - 2）消费流程
  - 3）消费者组初始化
  - 4）消费者组的工作流程
  - 5）消费分配策略
  - - a. Range模式
    - b. RoundRobinAssignor
    - c. StickyAssignor
二、Kafka集群安装
- 1.初始安装
- - 1）下载kafka安装包
  - 2）集群规划
  - 3）集群安装
  - 4）集群启动与关闭
- 2.节点上线与下线
- - 1）新节点上线
  - 2）副本再分配
  - 3）老节点下线
三、kafka命令行操作
- 1.topic相关的命令
- - 1）常用参数
  - 2）创建topic
  - 3）查看topic信息
  - 4）查看、修改、删除topic
- 2.生产者与消费者相关命令
四、Kafka的Java API
五、附录
六、鸣谢

一、Kafka原理

1.Kafka基础架构

1）发布订阅模式

生产者生产数据，将数据分批分主题地发送到消息队列中
订阅者（消费者）消费数据，可以有多个消费者消费同一批消息

2）架构模型

Producer负责接收外部数据，将数据按照不同的partition（每个topic会被分成多个Partition）发送到kafka集群的不同节点
为提高可用性，每个partition都会有若干个副本，副本分别存在于一个leader和若干Follower之上，对于不同的partition，leader和Follower为不同的kafka节点，Consumer消费数据都是直接消费leader上的数据，leader所在节点宕机之后，flower之一会变成新的leader
Consumer按照功能会分成不同的goup，每个group里有若干Consumer，每个consumer在消费数据时对应一个Partition
zookeeper会记录kafka集群中每个节点运行的状态、每个partition对应的leader与Follower是谁等等元数据信息（2.8.0版本之后zookeeper可选，可使用craft模式）

2.生产消息原理

1）原理概述

在消息发送的过程中，涉及到了两个线程——main 线程和 Sender 线程。在 main 线程中创建了一个双端队列RecordAccumulator。main 线程将消息发送给 RecordAccumulator，Sender 线程不断从 RecordAccumulator 中拉取消息发送到Kafka Broker

（1）producer在本地开启main线程，外部数据通过send方法发送数据，过程中经过拦截器（类似于数据清洗过程）、序列化器（kafka的序列化器）和分区器（将数据分成不同的分区partition）
（2）RecordAccumulator在内存中按分区创建若干分区队列（DQueue），该内存默认值为32M。队列中每16K为一个批次（ProducerBatch）（该批次达到16k才会被发送，参数batch.size,linger.ms为0时该参数无效）
（3）Sender线程负责发送数据，它按照broker创建若干请求队列，每个队列对应一个broker，每个队列最多缓存5个request
（4）selector负责建立传输管道向各brocker发送数据
（5）kafka集群有Leader与Follower之间的数据同步机制（replication）

调优参数

batch.size：批次大小，默认16k
linger.ms：等待时间，修改为5-100ms
compression.type：压缩snappy
RecordAccumulator：缓冲区大小，修改为64m

2）数据可靠性

数据从producer发送到broker有三种应答（acknowledge）级别–【0，1，-1】
Ack = 0：生产者发送数据，不需要等待数据落盘应答；弊端：极有可能可造成数据丢失（丢数）
Ack = 1：生产者发送数据，需要等待Leader收到数据后应答；弊端：可能造成同步Follower失败，Follower丢数（因为不需要Follower应答）
Ack = 1-：生产者发送数据，需要等待Leader和ISR里的所有Follower收到数据后应答；
如果仅设置Ack = -1，则弊端是可能因为某个或某几个Follower无应答而阻塞。

针对此弊端，kafka的解决方式为，由Leader维护一个同步副本集（ISR，in-sync replica set），这里面是和Leader保持同步的brokerid（格式：leader：0，isr:0,1,2）
如果Follower长时间（参数：replica.lag.time.max.ms，默认30秒）与Leader无法通信，则Leader会将该Follower将被移出ISR。

如果分区副本设置为1个，或者ISR里应答的最小副本数量（ min.insync.replicas 默认为1）设置为1，和ack=1的效果是一样的，仍然有丢数的风险（leader：0，isr:0）

综上：数据完全可靠条件 = (ACK= -1) + 分区副本大于等于2 + ISR里应答的最小副本数量大于等于2

生产环境中，acks=0很少使用；acks=1，一般用于传输普通日志，允许丢个别数据；acks=-1，一般用于传输和钱相关的数据，对可靠性要求比较高的场景

3.broker工作原理

1）kafka在zk上存储的信息

登录zk查看kfk目录

[hadoop@hadoop102 bin]$ ./zkCli.sh
[zk: localhost:2181(CONNECTED) 0] ls /kafka
[admin, brokers, cluster, config, consumers, controller, controller_epoch, feature, 
isr_change_notification, latest_producer_id_block, log_dir_event_notification]

重要的data：

所有在线的broker

[zk: localhost:2181(CONNECTED) 1] ls /kafka/brokers/ids
[0, 1, 2]

每个topic下的每个分区以及对应的Leader与ISR

[zk: localhost:2181(CONNECTED) 3] ls /kafka/brokers/topics/test/partitions
[0, 1, 2]

[zk: localhost:2181(CONNECTED) 5] get /kafka/brokers/topics/test/partitions/0/state
{"controller_epoch":2,"leader":1,"version":1,"leader_epoch":3,"isr":[1,2]}

controller的"leader" 辅助leader选举

[zk: localhost:2181(CONNECTED) 8] get /kafka/controller
{"version":1,"brokerid":0,"timestamp":"1649940120345"}

2）副本Leader选举流程

（1）kfk集群各broker启动后在zk的/kafka/brocker/ids下注册（掉线后也会在zk中注销）
（2）每个broker里都有一个controller，kfk集群启动后各个broker尝试去zk的/kafka/controller下注册信息，第一个注册到的为controller的"leader"，该"leader"会监听/kafka/brocker/ids中AR的变化
（3）正式选举：后选Leader为ISR中的broker，然后采用一定的算法(比如AR中排在最前面)选出Leader

查看AR：（Replicas后的副本集合）

[hadoop@hadoop103 bin]$ ./kafka-topics.sh --topic test01 --bootstrap-server hadoop102:9092,hadoop103:9092 --describe
Topic: test01   TopicId: Sfwa2XLZTAOAb0ST5NiqYA PartitionCount: 3       ReplicationFactor: 3    Configs: segment.bytes=1073741824
        Topic: test01   Partition: 0    Leader: 2       Replicas: 2,1,0 Isr: 2,1,0
        Topic: test01   Partition: 1    Leader: 1       Replicas: 1,0,2 Isr: 1,0,2
        Topic: test01   Partition: 2    Leader: 0       Replicas: 0,2,1 Isr: 0,2,1

（4）重新选举：原来的leader挂了，则有controller的"leader"监听到/brocker/ids中的节点变化，并更新ISR中的信息重新进行选举。

4. 故障处理（Offset / HW / LEO）

首先介绍几个概念：

Offset：partition中的每个消息都有一个连续的序号，用于partition唯一标识一条消息，可以理解为每个offset就是一条消息
LEO（Log End Offset）：ISR分区副本最后一条消息的待写位！即每个副本最大offset+1=LEO
ISR（In-Sync Replica ）：分区所有副本中offset最小的副本他最后一条消息后的待写位置（即所有副本的最小LEO）。也是该副本的LEO

1）正常情况

（1）broker0为Leader，Producer首先将消息发送给Leader，然后Follower主动同步Leader中的数据，
（2）鉴于Leader和Follower接收消息的时间不同，所以每个broker的LEO不同，broker1、broker2中的消息量会比broker0中的少一些，LEO就会小一些
（3）此时该分区的HW为5，也就是broker1的HW
（4）没有故障发生时，该分区的ISR为[0,1,2]，即三个副本都同时正常在线

2）Follower故障

（1）当某个Follower（比如broker2）故障时，该broker记录的HW为5，LEO为7
（2）其他broker继续正常工作，Leader接收新消息，其LEO变为10，broker1继续同步消息，其LEO变为8，该分区的HW即变为8
（3）故障的节点恢复运行后，首先将其故障前记录的HW及HW之后的数据删掉，如下：

（4）然后再向Leader同步数据，当同步数据达到当前的HW之后，该broker重新加入ISR

3）Leader故障

（1）Leader故障后，ISR为[1,2],重新选举新Leader（比如为broker1）
（2）如果此时存活的Follower的LEO大于新Leader的LEO，则会被要求删掉高于HW的部分，新leader继续接收消息

（3）Leader故障可能导致数据丢失或重复

5.Topic副本存储原理

1）存储机制

（1）Topic为逻辑上的概念，每个Topic在物理上分为一个或多个Partition，每个Partition按Replica存储在不同的Broker上，命名方式为–[topicName-partitionNo]
（2）一个Partition在Broker上按Segment存储，每个Segment默认为1G
（3）每个Segment由一个.log文件、一个.index文件，一个.timeindex文件组成

创建单分区2副本的topic用于测试

[hadoop@hadoop102 datas]$ kafka-topics.sh --create --topic saveTest --bootstrap-server hadoop102:9092 --partitions 1 --replication-factor 2
Created topic saveTest.

生产大于1G的数据，这里个人虚拟机5分钟大概写了2.5G的数据，生产中会很快，代码见本文附录
查看数据存储路径

[hadoop@hadoop102 saveTest-0]$ pwd
/opt/module/kafka/datas/saveTest-0
[hadoop@hadoop102 saveTest-0]$ du -sh *
[hadoop@hadoop102 saveTest-0]$ du -sh *
516K    00000000000000000000.index
1.0G    00000000000000000000.log
768K    00000000000000000000.timeindex
516K    00000000000038751300.index
1.0G    00000000000038751300.log
4.0K    00000000000038751300.snapshot
768K    00000000000038751300.timeindex
160K    00000000000077106001.index
314M    00000000000077106001.log
4.0K    00000000000077106001.snapshot
236K    00000000000077106001.timeindex
4.0K    leader-epoch-checkpoint
4.0K    partition.metadata

2）.log / .index / .timeindex

（1）每个Segment中的.log文件、.index文件，.timeindex文件都以当前Segment的第一个offset命名
（2）当前Segment包含了由本Segment的第一个offset到下一个Segment第一个offset - 1的所有消息

.log文件是Segment的日志文件，包含实际的消息数据
.index文件是偏移量索引文件
.timeindex文件是时间戳索引文件
查看.log与.index文件的命令

[hadoop@hadoop102 saveTest-0]$ kafka-run-class.sh kafka.tools.DumpLogSegments --files ./00000000000077106001.index | head
Dumping ./00000000000077106001.index
offset: 77107170 position: 16377
offset: 77107755 position: 32754
offset: 77108340 position: 49131
offset: 77108925 position: 65508
offset: 77109510 position: 81885
offset: 77110095 position: 98262
offset: 77110680 position: 114639
offset: 77111265 position: 131016
offset: 77111850 position: 147393
[hadoop@hadoop102 saveTest-0]$ kafka-run-class.sh kafka.tools.DumpLogSegments --files ./00000000000077106001.log | head -n 5
Dumping ./00000000000077106001.log
Starting offset: 77106001
baseOffset: 77106001 lastOffset: 77106585 count: 585 baseSequence: -1 lastSequence: -1 producerId: -1 producerEpoch: -1 partitionLeaderEpoch: 0 isTransactional: false isControl: false position: 0 CreateTime: 1650165099963 size: 16377 magic: 2 compresscodec: none crc: 1202492431 isvalid: true
baseOffset: 77106586 lastOffset: 77107170 count: 585 baseSequence: -1 lastSequence: -1 producerId: -1 producerEpoch: -1 partitionLeaderEpoch: 0 isTransactional: false isControl: false position: 16377 CreateTime: 1650165099964 size: 16377 magic: 2 compresscodec: none crc: 3290634006 isvalid: true
baseOffset: 77107171 lastOffset: 77107755 count: 585 baseSequence: -1 lastSequence: -1 producerId: -1 producerEpoch: -1 partitionLeaderEpoch: 0 isTransactional: false isControl: false position: 32754 CreateTime: 1650165099967 size: 16377 magic: 2 compresscodec: none crc: 3691937790 isvalid: true

3）存储细节

（1）.index存储offset和position，使用稀疏存储方式，大概每4K消息在.index中存储一条信息
（2）.index中存储的offset为相对offset（有时候也是绝对offset，不知道为啥，有待考证），即相对于.index文件名的offset，确保offset的值本身不会占用太大空间，

绝对offset = 相对offset + 文件名

（3）.log文件中主要有三个数据 baseOffset,lastOffset,position，且.index中的position和.index文件中的position是一个意思
（4）如何定位一条消息？（比如定位绝对offset为600的消息）

（二分查找）首先根据绝对offset定位出.index文件（第一个文件名大于600的前一个文件）
根据绝对offset计算出相对offset，比如相对offset = 600 -522 = 78
（二分查找）同理在.index中定位出该offset对应的position（第一个大于相对offset的offset的前一个offset对应的offset），比如65对应的6415
同理在.log中定位出第一个大于该position的前一个position，比如6410
（顺序查找）在.log文件中从6410往下找，直到找到offset为6415的数据

（5）查看.log中详细的每条数据，添加参数 --print-data-log

[hadoop@hadoop102 saveTest-0]$ kafka-run-class.sh kafka.tools.DumpLogSegments --files ./00000000000077106001.log --print-data-log | head -n 20
Dumping ./00000000000077106001.log
Starting offset: 77106001
baseOffset: 77106001 lastOffset: 77106585 count: 585 baseSequence: -1 lastSequence: -1 producerId: -1 producerEpoch: -1 partitionLeaderEpoch: 0 isTransactional: false isControl: false position: 0 CreateTime: 1650165099963 size: 16377 magic: 2 compresscodec: none crc: 1202492431 isvalid: true
| offset: 77106001 CreateTime: 1650165099960 keySize: -1 valueSize: 20 sequence: -1 headerKeys: [] payload: dataFormIdea77106001
| offset: 77106002 CreateTime: 1650165099960 keySize: -1 valueSize: 20 sequence: -1 headerKeys: [] payload: dataFormIdea77106002
| offset: 77106003 CreateTime: 1650165099960 keySize: -1 valueSize: 20 sequence: -1 headerKeys: [] payload: dataFormIdea77106003
| offset: 77106004 CreateTime: 1650165099960 keySize: -1 valueSize: 20 sequence: -1 headerKeys: [] payload: dataFormIdea77106004
| offset: 77106005 CreateTime: 1650165099960 keySize: -1 valueSize: 20 sequence: -1 headerKeys: [] payload: dataFormIdea77106005
| offset: 77106006 CreateTime: 1650165099961 keySize: -1 valueSize: 20 sequence: -1 headerKeys: [] payload: dataFormIdea77106006

4）分区副本分配

a. 自动分区

创建16个分区3个副本的topic

[hadoop@hadoop102 bin]$ kafka-topics.sh --create --topic partitionsTest --bootstrap-server hadoop102:9092 --partitions 16 --replication-factor 3
Created topic partitionsTest.
[hadoop@hadoop102 bin]$ kafka-topics.sh --describe --topic partitionsTest --bootstrap-server hadoop102:9092
Topic: partitionsTest   TopicId: NS4cElLyTi-VgHD9vdaByA PartitionCount: 10      ReplicationFactor: 3    Configs: segment.bytes=1073741824
        Topic: partitionsTest   Partition: 0    Leader: 1       Replicas: 1,0,2 Isr: 1,0,2
        Topic: partitionsTest   Partition: 1    Leader: 0       Replicas: 0,2,3 Isr: 0,2,3
        Topic: partitionsTest   Partition: 2    Leader: 2       Replicas: 2,3,1 Isr: 2,3,1
        Topic: partitionsTest   Partition: 3    Leader: 3       Replicas: 3,1,0 Isr: 3,1,0
        Topic: partitionsTest   Partition: 4    Leader: 1       Replicas: 1,2,3 Isr: 1,2,3
        Topic: partitionsTest   Partition: 5    Leader: 0       Replicas: 0,3,1 Isr: 0,3,1
        Topic: partitionsTest   Partition: 6    Leader: 2       Replicas: 2,1,0 Isr: 2,1,0
        Topic: partitionsTest   Partition: 7    Leader: 3       Replicas: 3,0,2 Isr: 3,0,2
        Topic: partitionsTest   Partition: 8    Leader: 1       Replicas: 1,3,0 Isr: 1,3,0
        Topic: partitionsTest   Partition: 9    Leader: 0       Replicas: 0,1,2 Isr: 0,1,2

可以看出，Leader以及Replicas会均匀的分布在ISR中，尽量保证数据的可靠性

b.手动分区

由于各broker服务器资源不同，配置不同，自动分区只能保证"均匀",不能保证"公平"，这里假设broker3资源较少，将broker3上一部分副本转移到其他broker上

（1）创建分区配置文件


[hadoop@hadoop102 ~]$ vi test_partitions_manually.json
[hadoop@hadoop102 ~]$ cat test_partitions_manually.json
{
 "version":1,
 "partitions":[{"topic":"partitionsTest","partition":0,"replicas":[0,1,2]},
                         {"topic":"partitionsTest","partition":1,"replicas":[0,1,2]},
                         {"topic":"partitionsTest","partition":2,"replicas":[1,0,2]},
                         {"topic":"partitionsTest","partition":3,"replicas":[2,0,1]},
                         {"topic":"partitionsTest","partition":4,"replicas":[1,0,2]},
                         {"topic":"partitionsTest","partition":5,"replicas":[2,0,1]}]
}

（2）执行重新分区计划

[hadoop@hadoop102 ~]$ kafka-reassign-partitions.sh --bootstrap-server hadoop102:9092 --reassignment-json-file test_partitions_manually.json --execute
Current partition replica assignment

{"version":1,"partitions":[{"topic":"partitionsTest","partition":0,"replicas":[1,0,2],"log_dirs":["any","any","any"]},{"topic":"partitionsTest","partition":1,"replicas":[0,2,3],"log_dirs":["any","any","any"]},{"topic":"partitionsTest","partition":2,"replicas":[2,3,1],"log_dirs":["any","any","any"]},{"topic":"partitionsTest","partition":3,"replicas":[3,1,0],"log_dirs":["any","any","any"]},{"topic":"partitionsTest","partition":4,"replicas":[1,2,3],"log_dirs":["any","any","any"]},{"topic":"partitionsTest","partition":5,"replicas":[0,3,1],"log_dirs":["any","any","any"]}]}

Save this to use as the --reassignment-json-file option during rollback
Successfully started partition reassignments for partitionsTest-0,partitionsTest-1,partitionsTest-2,partitionsTest-3,partitionsTest-4,partitionsTest-5

（3）验证分区计划

[hadoop@hadoop102 ~]$ kafka-reassign-partitions.sh --bootstrap-server hadoop102:9092 --reassignment-json-file test_partitions_manually.json --verify
Status of partition reassignment:
Reassignment of partition partitionsTest-0 is complete.
Reassignment of partition partitionsTest-1 is complete.
Reassignment of partition partitionsTest-2 is complete.
Reassignment of partition partitionsTest-3 is complete.
Reassignment of partition partitionsTest-4 is complete.
Reassignment of partition partitionsTest-5 is complete.

Clearing broker-level throttles on brokers 0,1,2,3
Clearing topic-level throttles on topic partitionsTest

（4）重新查看分区

[hadoop@hadoop102 ~]$ kafka-topics.sh --describe --topic partitionsTest --bootstrap-server hadoop102:9092
Topic: partitionsTest   TopicId: NS4cElLyTi-VgHD9vdaByA PartitionCount: 16      ReplicationFactor: 3    Configs: segment.bytes=1073741824
        Topic: partitionsTest   Partition: 0    Leader: 0       Replicas: 0,1,2 Isr: 1,0,2
        Topic: partitionsTest   Partition: 1    Leader: 0       Replicas: 0,1,2 Isr: 0,2,1
        Topic: partitionsTest   Partition: 2    Leader: 2       Replicas: 1,0,2 Isr: 2,1,0
        Topic: partitionsTest   Partition: 3    Leader: 2       Replicas: 2,0,1 Isr: 1,0,2
        Topic: partitionsTest   Partition: 4    Leader: 1       Replicas: 1,0,2 Isr: 1,2,0
        Topic: partitionsTest   Partition: 5    Leader: 0       Replicas: 2,0,1 Isr: 0,1,2
        Topic: partitionsTest   Partition: 6    Leader: 2       Replicas: 2,1,0 Isr: 2,1,0
        Topic: partitionsTest   Partition: 7    Leader: 3       Replicas: 3,0,2 Isr: 3,0,2
        Topic: partitionsTest   Partition: 8    Leader: 1       Replicas: 1,3,0 Isr: 1,3,0
        Topic: partitionsTest   Partition: 9    Leader: 0       Replicas: 0,1,2 Isr: 0,1,2

（5）副本数增加
副本数不能通过kafka-topic.sh命令行直接增加可以使用如下方式调整（可增可减可调整）

[hadoop@hadoop102 ~]$ vi test_increase-replication.json
[hadoop@hadoop102 ~]$ cat test_increase-replication.json
{
        "version": 1,
        "partitions": [{
                "topic": "partitionsTest",
                "partition": 0,
                "replicas": [0, 1]
        }, {
                "topic": "partitionsTest",
                "partition": 1,
                "replicas": [0, 1, 2, 3]
        }, {
                "topic": "partitionsTest",
                "partition": 2,
                "replicas": [1, 2, 3]
        }]
}

[hadoop@hadoop102 ~]$ kafka-reassign-partitions.sh --bootstrap-server hadoop102:9092 --reassignment-json-file test_increase-replication.json --execute
Current partition replica assignment

{"version":1,"partitions":[{"topic":"partitionsTest","partition":0,"replicas":[0,1,2],"log_dirs":["any","any","any"]},{"topic":"partitionsTest","partition":1,"replicas":[0,1,2],"log_dirs":["any","any","any"]},{"topic":"partitionsTest","partition":2,"replicas":[1,0,2],"log_dirs":["any","any","any"]}]}

Save this to use as the --reassignment-json-file option during rollback
Successfully started partition reassignments for partitionsTest-0,partitionsTest-1,partitionsTest-2
[hadoop@hadoop102 ~]$ kafka-topics.sh --describe --topic partitionsTest --bootstrap-server hadoop102:9092
Topic: partitionsTest   TopicId: NS4cElLyTi-VgHD9vdaByA PartitionCount: 16      ReplicationFactor: 2    Configs: segment.bytes=1073741824
        Topic: partitionsTest   Partition: 0    Leader: 0       Replicas: 0,1   Isr: 1,0
        Topic: partitionsTest   Partition: 1    Leader: 0       Replicas: 0,1,2,3       Isr: 0,2,1,3
        Topic: partitionsTest   Partition: 2    Leader: 2       Replicas: 1,2,3 Isr: 2,1,3
        Topic: partitionsTest   Partition: 3    Leader: 2       Replicas: 2,0,1 Isr: 1,0,2
        Topic: partitionsTest   Partition: 4    Leader: 1       Replicas: 1,0,2 Isr: 1,2,0
        Topic: partitionsTest   Partition: 5    Leader: 0       Replicas: 2,0,1 Isr: 0,1,2
        Topic: partitionsTest   Partition: 6    Leader: 2       Replicas: 2,1,0 Isr: 2,1,0
        Topic: partitionsTest   Partition: 7    Leader: 3       Replicas: 3,0,2 Isr: 3,0,2
        Topic: partitionsTest   Partition: 8    Leader: 1       Replicas: 1,3,0 Isr: 1,3,0
        Topic: partitionsTest   Partition: 9    Leader: 0       Replicas: 0,1,2 Isr: 0,1,2
        Topic: partitionsTest   Partition: 10   Leader: 2       Replicas: 2,0,3 Isr: 2,0,3

6.消费者原理

1）消费者组

（1）每个consumer都有一个groupid，groupid相同的consumer为一个消费者组（CG）
（2）每个消费者组可以消费不同partition中的消息
（3）相同消费者组总的不同消费者消费不同的partition中的消息
（4）一个消费者可以消费多个partition中的消息，但一个partition中的消息只能由同一个消费者组中的一个消费者消费
（5）如果消费者来自不同组则可以由多个消费者消费，即不同消费者组之间的消费者互不影响
（6）如果一个消费者组中的消费者数量超过了partition数量，则同一时间必定有消费者处于空闲状态

2）消费流程

（1）生产者生产数据，将Topic分成多个Partition发送到kafka集群各个Broker的leader中，然后Follower向Leader同步数据
（2）消费者（组）消费数据，在kafka中会创建一个__consumer_offsets的Topic，默认50个分区,用来记录消费者消费到哪儿了

[hadoop@hadoop102 datas]$ kafka-topics.sh --describe --topic __consumer_offsets --bootstrap-server hadoop102:9092
Topic: __consumer_offsets       TopicId: pXqSKyGjQP68NH8u9EhnvQ PartitionCount: 50      ReplicationFactor: 1    Configs: compression.type=producer,cleanup.policy=compact,segment.bytes=104857600
        Topic: __consumer_offsets       Partition: 0    Leader: 2       Replicas: 2     Isr: 2
        Topic: __consumer_offsets       Partition: 1    Leader: 1       Replicas: 1     Isr: 1
        Topic: __consumer_offsets       Partition: 2    Leader: 0       Replicas: 0     Isr: 0
        Topic: __consumer_offsets       Partition: 3    Leader: 2       Replicas: 2     Isr: 2
        Topic: __consumer_offsets       Partition: 4    Leader: 1       Replicas: 1     Isr: 1
        Topic: __consumer_offsets       Partition: 5    Leader: 0       Replicas: 0     Isr: 0
……

[hadoop@hadoop103 __consumer_offsets-37]$  kafka-run-class.sh kafka.tools.DumpLogSegments --files 00000000000000000000.log --print-data-log
Dumping 00000000000000000000.log
Starting offset: 0
baseOffset: 0 lastOffset: 0 count: 1 baseSequence: -1 lastSequence: -1 producerId: -1 producerEpoch: -1 partitionLeaderEpoch: 0 isTransactional: false isControl: false position: 0 CreateTime: 1649581940063 size: 397 magic: 2 compresscodec: none crc: 296324366 isvalid: true
| offset: 0 CreateTime: 1649581940063 keySize: 26 valueSize: 301 sequence: -1 headerKeys: [] key: console-consumer-31930 payload:consumerrangeFconsumer-console-consumer-31930-1-83803557-6ebe-486d-a46c-3bcb8d19fd68���FFconsumer-console-consumer-31930-1-83803557-6ebe-486d-a46c-3bcb8d19fd68��!consumer-console-consumer-31930-1/192.168.10.103����test���� test����
baseOffset: 1 lastOffset: 1 count: 1 baseSequence: -1 lastSequence: -1 producerId: -1 producerEpoch: -1 partitionLeaderEpoch: 0 isTransactional: false isControl: false position: 397 CreateTime: 1649594571140 size: 127 magic: 2 compresscodec: none crc: 1099527437 isvalid: true
| offset: 1 CreateTime: 1649594571140 keySize: 26 valueSize: 32 sequence: -1 headerKeys: [] key: console-consumer-31930 payload:consumer������
baseOffset: 2 lastOffset: 2 count: 1 baseSequence: -1 lastSequence: -1 producerId: -1 producerEpoch: -1 partitionLeaderEpoch: 2 isTransactional: false isControl: false position: 524 CreateTime: 1649940721504 size: 94 magic: 2 compresscodec: none crc: 1432751996 isvalid: true
| offset: 2 CreateTime: 1649940721504 keySize: 26 valueSize: -1 sequence: -1 headerKeys: [] key: console-consumer-31930

也可使用命令直接查看

[hadoop@hadoop102 kafka]$ bin/kafka-console-consumer.sh --topic __consumer_offsets --bootstrap-server hadoop102:9092 --consumer.config config/consumer.properties --formatter "kafka.coordinator.group.GroupMetadataManager\$OffsetsMessageFormatter" --from-beginning 
 
[offset,hadoop,1]::OffsetAndMetadata(offset=7, leaderEpoch=Optional[0], metadata=, commitTimestamp=1622442520203, expireTimestamp=None) 
[offset,hadoop,0]::OffsetAndMetadata(offset=8, leaderEpoch=Optional[0], metadata=, commitTimestamp=1622442520203, expireTimestamp=None)

3）消费者组初始化

（1）每个Broker上都有一个Coordinator，辅助实现消费者组的初始化和分区的分配
（2）每个Consumer消费数据前会首先找到对应的Coordinator，请求加入组

Coordinator节点选择 = GroupId的hashcode值 % 50（ __consumer_offsets的分区数量）
Consumer在找Coordinator时先根据上面的公式找到__consumer_offsets，然后确定该__consumer_offsets所在的Broker上的Coordinator

（3）Coordinator会选出一个Consumer作为改组内所有Consumer的Leader
（4）Coordinator将所有消费者要消费的Topic情况发送个Leader
（5）Leader统筹制定消费方案，并将方案发送给Coordinator
（6）Coordinator将消费方案同步给所有Consumer

消费方案再平衡：
每个消费者都会和coordinator保持心跳（默认3s），一旦超时（session.timeout.ms 默认45s），该消费者会被从组内移除，并触发再平衡（消费方案变更）；或者消费者处理消息的时间过长（max.poll.interval.ms 默认5分钟），也会触发再平衡

4）消费者组的工作流程

（1）消费者创建ConsumerNetworkClient客户端，与各个Broker交互，从Broker中pull数据

pull 数据的几个参数
Fetch.min.bytes每批次最小抓取大小，默认1字节
fetch.max.wait.ms 超时时间，默认500ms，也就是不到1字节但到了500ms，也进行pull
Fetch.max.bytes每批次最大抓取大小，默认50m

（2）通过回调函数onSuccess将数据拉取到本地的消息队列completeFetches
（3）consumer从队列中拉取数据，经过反序列化、拦截器后处理数据完成消费

5）消费分配策略

a. Range模式

首先对同一个 topic 里面的分区按照序号进行排序，并对消费者按照字母顺序进行排序。
通过 partitions数/consumer数来决定每个消费者应该消费几个分区。如果除不尽，那么前面几个消费者将会多消费1个分区。

例如：现在有 7 个分区，3 个消费者，排序后的分区将会是0,1,2,3,4,5,6；消费者排序完之后将会是C0,C1,C2。
例如，7/3 = 2 余 1 ，除不尽，那么消费者 C0 便会多消费 1 个分区。 8/3=2余2，除不尽，那么C0和C1分别多消费一个。

弊端：
数据倾斜：如果只是针对 1 个 topic 而言，C0消费者多消费1个分区影响不是很大。但是如果有 N 多个 topic，那么针对每个 topic，消费者 C0都将多消费 1 个分区，topic越多，C0消费的分区会比其他消费者明显多消费 N 个分区。

b. RoundRobinAssignor

RoundRobin 针对集群中所有Topic而言。
RoundRobin 轮询分区策略，是把所有的 partition 和所有的consumer 都列出来，然后按照 hashcode 进行排序，最后通过轮询算法来分配 partition 给到各个消费者。

c. StickyAssignor

kafka 在 0.11.x 版本支持了 StrickyAssignor, 翻译过来叫粘滞策略，它主要有两个目的：
1.分区的分配尽可能的均匀
2.分区的分配尽可能和上次分配保持相同
当两者发生冲突时，第一个目标优先于第二个目标。鉴于这两个目标， StickyAssignor 分配策略的具体实现要比 RangeAssignor 和 RoundRobinAssi gn or 这两种分配策略要复杂得多，假设我们有这样一个场景

假设消费组有 3 个消费者：C0,C1,C2，它们分别订阅了 4 个 Topic(t0,t1,t2,t3),并且每个主题有两个分区(p0,p1),也就是说，整个消费组订阅了 8 个分区：t0p0 、 t0p1 、 t1p0 、 t1p1 、 t2p0 、 t2p1 、t3p0 、 t3p1 ,那么最终的分配场景结果为

C0: t0p0、t1p1 、 t3p0

C1: t0p1、t2p0 、 t3p1

C2: t1p0、t2p1

这种分配方式有点类似于轮询策略，但实际上并不是，因为假设这个时候，C1 这个消费者挂了，就势必会造成重新分区（reblance），如果是轮询，那么结果应该是：
C0: t0p0、t1p0、t2p0、t3p0
C2: t0p1、t1p1、t2p1、t3p1
然后，strickyAssignor 它是一种粘滞策略，所以它会满足分区的分配尽可能和上次分配保持相同，所以分配结果应该是：
C0: t0p0、t1p1、t3p0、t2p0
C2: t1p0、t2p1、t0p1、t3p1
也就是说，C0 和 C2 保留了上一次是的分配结果，并且把原来 C1 的分区分配给了 C0 和 C2。这种策略的好处是使得分区发生变化时，由于分区的“粘性，减少了不必要的分区移动

二、Kafka集群安装

1.初始安装

前提：安装zookeeper集群 zookeeper集群安装

1）下载kafka安装包

地址

2）集群规划

3）集群安装

三台机器操作基本一致，只有配置broker.id不一致
（1）传包到/opt/module,并解压，更名为kafka

[hadoop@hadoop102 module]$ ll kafka_2.12-3.0.0.tgz
-rw-rw-r-- 1 hadoop hadoop 86486610 4月   9 17:03 kafka_2.12-3.0.0.tgz
[hadoop@hadoop102 module]$ tar -xvf kafka_2.12-3.0.0.tgz
[hadoop@hadoop102 module]$ mv kafka_2.12-3.0.0 kafka
[hadoop@hadoop102 module]$ ls -l
总用量 84460
drwxr-xr-x  7 hadoop hadoop  105 9月   9 2021 kafka
-rw-rw-r--  1 hadoop hadoop  86486610 4月   9 17:03 kafka_2.12-3.0.0.tgz
drwxrwxr-x  8 hadoop hadoop  160 4月   4 20:50 zookeeper-3.5.7

（2）修改配置文件

[hadoop@hadoop102 config]$ vi server.properties
# 以下为建议修改的参数
broker.id=0  # 每个机器不能相同
log.dirs=/opt/module/kafka/datas #自定义
zookeeper.connect=hadoop102:2181,hadoop103:2181,hadoop104:2181/kafka #配置连接 Zookeeper 集群地址（在 zk 根目录下创建/kafka，方便管理）

（3）设置环境变量并source

[hadoop@hadoop102 etc]$ tail profile
#JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_212
export PATH=$PATH:$JAVA_HOME/bin

#hadoop
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

#KAFKA_HOME
export KAFKA_HOME=/opt/module/kafka
export PATH=$PATH:$KAFKA_HOME/bin

[hadoop@hadoop102 etc]$ source /etc/profile

4）集群启动与关闭

先启动zk集群

[hadoop@hadoop102 kafka]$ zk.sh start

三台机器分别启动kafka

[hadoop@hadoop102 kafka]$ bin/kafka-server-start.sh -daemon  config/server.properties 
[hadoop@hadoop103 kafka]$ bin/kafka-server-start.sh -daemon  config/server.properties 
[hadoop@hadoop104 kafka]$ bin/kafka-server-start.sh -daemon  config/server.properties

查看zk与kafka的java进程
[hadoop@hadoop102 etc]$ jps | grep -v Jps
2432 Kafka
1708 QuorumPeerMain

三台机器分别关闭kafka

[hadoop@hadoop102 kafka]$ bin/kafka-server-stop.sh 
[hadoop@hadoop103 kafka]$ bin/kafka-server-stop.sh 
[hadoop@hadoop104 kafka]$ bin/kafka-server-stop.sh

关闭zk集群

[hadoop@hadoop102 etc]$ zk.sh stop

2.节点上线与下线

1）新节点上线

新节点安装jdk与kafka（参考初始安装），复制原节点的配置文件，修改broker.id，启动kafka

[hadoop@hadoop105 ~]$ java -version
java version "1.8.0_212"
Java(TM) SE Runtime Environment (build 1.8.0_212-b10)
Java HotSpot(TM) 64-Bit Server VM (build 25.212-b10, mixed mode)
[hadoop@hadoop105 ~]$ cd /opt/module/kafka/bin/
[hadoop@hadoop105 bin]$ ./kafka-server-start.sh -daemon  ../config/server.properties
[hadoop@hadoop105 bin]$ jps
1858 Jps
1834 Kafka

zk查看brokers

# 新节点kafka启动前
[zk: localhost:2181(CONNECTED) 1] ls /kafka/brokers/ids
[0, 1, 2]
# 启动后
[zk: localhost:2181(CONNECTED) 2] ls /kafka/brokers/ids
[0, 1, 2, 3]

2）副本再分配

（1）创建再分配需要的json（在原有节点）

[hadoop@hadoop102 ~]$ vim test-topic.json
[hadoop@hadoop102 ~]$ cat test-topic.json
{
 "topics": [

     {"topic": "test01"}

 ],

 "version": 1
}

（2）获取再分配计划

[hadoop@hadoop102 ~]$ kafka-reassign-partitions.sh --bootstrap-server hadoop102:9092 --topics-to-move-json-file  test-topic.json --broker-list "0,2,3" --generate
# 当前分配
Current partition replica assignment
{"version":1,"partitions":[{"topic":"test01","partition":0,"replicas":[2,1,0],"log_dirs":["any","any","any"]},{"topic":"test01","partition":1,"replicas":[1,0,2],"log_dirs":["any","any","any"]},{"topic":"test01","partition":2,"replicas":[0,2,1],"log_dirs":["any","any","any"]}]}
# 计划分配
Proposed partition reassignment configuration
{"version":1,"partitions":[{"topic":"test01","partition":0,"replicas":[0,2,3],"log_dirs":["any","any","any"]},{"topic":"test01","partition":1,"replicas":[2,3,0],"log_dirs":["any","any","any"]},{"topic":"test01","partition":2,"replicas":[3,0,2],"log_dirs":["any","any","any"]}]}

（3）创建再分配计划配置（拷贝上一步计划分配里的json）

[hadoop@hadoop102 ~]$ vi reassignment.json
[hadoop@hadoop102 ~]$ cat reassignment.json
{
    "version":1,
    "partitions":[
        {
            "topic":"test01",
            "partition":0,
            "replicas":[
                0,
                2,
                3
            ],
            "log_dirs":[
                "any",
                "any",
                "any"
            ]
        },
        {
            "topic":"test01",
            "partition":1,
            "replicas":[
                2,
                3,
                0
            ],
            "log_dirs":[
                "any",
                "any",
                "any"
            ]
        },
        {
            "topic":"test01",
            "partition":2,
            "replicas":[
                3,
                0,
                2
            ],
            "log_dirs":[
                "any",
                "any",
                "any"
            ]
        }
    ]
}

（4）执行再分配计划

-执行之前

[hadoop@hadoop102 bin]$ ./kafka-topics.sh --topic test01 --bootstrap-server hadoop102:9092,hadoop103:9092 --describe
Topic: test01   TopicId: Sfwa2XLZTAOAb0ST5NiqYA PartitionCount: 3       ReplicationFactor: 3    Configs: segment.bytes=1073741824
        Topic: test01   Partition: 0    Leader: 2       Replicas: 2,1,0 Isr: 1,0,2
        Topic: test01   Partition: 1    Leader: 1       Replicas: 1,0,2 Isr: 1,0,2
        Topic: test01   Partition: 2    Leader: 1       Replicas: 0,2,1 Isr: 1,0,2

-执行

[hadoop@hadoop102 ~]$ kafka-reassign-partitions.sh --bootstrap-server hadoop102:9092 --reassignment-json-file  reassignment.json --execute
Current partition replica assignment

{"version":1,"partitions":[{"topic":"test01","partition":0,"replicas":[2,1,0],"log_dirs":["any","any","any"]},{"topic":"test01","partition":1,"replicas":[1,0,2],"log_dirs":["any","any","any"]},{"topic":"test01","partition":2,"replicas":[0,2,1],"log_dirs":["any","any","any"]}]}

Save this to use as the --reassignment-json-file option during rollback
Successfully started partition reassignments for test01-0,test01-1,test01-2

-验证

[hadoop@hadoop102 ~]$ kafka-reassign-partitions.sh --bootstrap-server hadoop102:9092 --reassignment-json-file reassignment.json  --verify
Status of partition reassignment:
Reassignment of partition test01-0 is complete.
Reassignment of partition test01-1 is complete.
Reassignment of partition test01-2 is complete.

Clearing broker-level throttles on brokers 0,1,2,3
Clearing topic-level throttles on topic test01

-执行之后

[hadoop@hadoop102 ~]$ kafka-topics.sh --topic test01 --bootstrap-server hadoop102:9092,hadoop103:9092 --describe
Topic: test01   TopicId: Sfwa2XLZTAOAb0ST5NiqYA PartitionCount: 3       ReplicationFactor: 3    Configs: segment.bytes=1073741824
        Topic: test01   Partition: 0    Leader: 2       Replicas: 0,2,3 Isr: 0,2,3
        Topic: test01   Partition: 1    Leader: 2       Replicas: 2,3,0 Isr: 0,2,3
        Topic: test01   Partition: 2    Leader: 3       Replicas: 3,0,2 Isr: 0,2,3

3）老节点下线

针对所有topic进行副本再分配（注意在获取再分配计划时–broker-list 参数要将要下线的brokerID去掉），然后直接下线（kill掉kafka进程，关机，砸服务器随意）即可。

三、kafka命令行操作

1.topic相关的命令

使用脚本：kafka-topics.sh

[hadoop@hadoop102 bin]$ pwd
/opt/module/kafka/bin
[hadoop@hadoop102 bin]$ ls -l kafka-topics.sh
-rwxr-xr-x 1 hadoop hadoop 863 9月   9 2021 kafka-topics.sh

1）常用参数

–bootstrap-server hostname:port,[hostname:port] 连接的kafka的broker的主机名与端口号

–topic topicName 操作的topic名称

–create 创建topic

–delete 删除topic

–alter 修改topic

–list 查看topic列表

–describe 查看topic描述

– partitions num 设置分区数

–replication-factor num 设置分区副本数

–config name=value 更新默认配置

2）创建topic

！！！必须指定分区数partitions与每个分区的副本数replication-factor

[hadoop@hadoop102 bin]$ ./kafka-topics.sh --topic fisrtTopic --bootstrap-server hadoop102:9092,hadoop103:9092 --create --partitions 2 --replication-factor 2
Created topic fisrtTopic.

3）查看topic信息

[hadoop@hadoop102 bin]$ ./kafka-topics.sh --topic fisrtTopic --bootstrap-server hadoop102:9092,hadoop103:9092 --describe
Topic: fisrtTopic       TopicId: Hry2LNbNQkeVzLQwCOPEIA PartitionCount: 2       ReplicationFactor: 2    Configs: segment.bytes=1073741824
        Topic: fisrtTopic       Partition: 0    Leader: 1       Replicas: 1,0   Isr: 1,0
        Topic: fisrtTopic       Partition: 1    Leader: 0       Replicas: 0,2   Isr: 0,2

其中，PartitionCount为分区数，ReplicationFactor为副本数，segment.bytes为存储单位，默认以1G为单位存储
下面是每个topic的基本信息，数字表示BrokerID，即server.properties配置的broker.id

4）查看、修改、删除topic

查看topic列表

[hadoop@hadoop102 bin]$ ./kafka-topics.sh --topic fisrtTopic --bootstrap-server hadoop102:9092,hadoop103:9092 --list
fisrtTopic

修改topic分区数（只能增加，不能减少）

[hadoop@hadoop102 bin]$ ./kafka-topics.sh --topic fisrtTopic --bootstrap-server hadoop102:9092,hadoop103:9092 --alter --partitions 3

删除topic

[hadoop@hadoop102 bin]$ ./kafka-topics.sh --topic fisrtTopic --bootstrap-server hadoop102:9092,hadoop103:9092 --delete
[hadoop@hadoop102 bin]$ ./kafka-topics.sh --topic fisrtTopic --bootstrap-server hadoop102:9092,hadoop103:9092 --list 
[hadoop@hadoop102 bin]$

2.生产者与消费者相关命令

使用脚本kafka-console-producer.sh与kafka-console-consumer.sh

[hadoop@hadoop102 bin]$ ll kafka-console-*.sh
-rwxr-xr-x 1 hadoop hadoop 945 9月   9 2021 kafka-console-consumer.sh
-rwxr-xr-x 1 hadoop hadoop 944 9月   9 2021 kafka-console-producer.sh

生产数据

[hadoop@hadoop103 config]$ kafka-console-producer.sh -topic secondtopicaa --bootstrap-server hadoop102:9092          
>somedata

消费数据–from-beginning参数可消费历史数据

[hadoop@hadoop102 config]$ kafka-console-consumer.sh --bootstrap-server hadoop102:9092 --from-beginning --topic secondtopic
somedata

四、Kafka的Java API

本文着重原理，API相关知识移步以下链接（非本人所写，但感觉比较全面）：

Kafka API详解

kafka API详解

五、附录

生产大于1G的数据

import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerConfig;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.common.serialization.StringSerializer;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.util.Properties;

public class KafkaTest {
    public KafkaProducer<String, String> kafkaProducer;
    @Before
    public void config(){
        Properties properties = new Properties();
        properties.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "hadoop102:9092,hadoop103:9092");
        properties.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());
        properties.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,StringSerializer.class.getName());

        kafkaProducer = new KafkaProducer<>(properties);
    }

    @Test
    public  void reallyMethod() {
        for (int i = 0; i < 1000000000; i++) {
            kafkaProducer.send(new ProducerRecord<>("saveTest","dataFormIdea" + i));
        }
    }

    @After
    public void close(){
        kafkaProducer.close();
    }
}

六、鸣谢

感谢尚硅谷，此文根据尚硅谷课程而写，bili连接尚硅谷HBase教程

你可能感兴趣的:(hadoop,kafka,hadoop,大数据,分布式)

Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
Kafka系列之：Dead Letter Queue死信队列DLQ 快乐骑行^_^ Kafka Kafka系列 Dead Letter Queue 死信队列 DLQ
Kafka系列之：DeadLetterQueue死信队列DLQ一、死信队列二、参数errors.tolerance三、创建死信队列主题四、在启用安全性的情况下使用死信队列更多内容请阅读博主这篇博客：Kafka系列之：KafkaConnect深入探讨-错误处理和死信队列一、死信队列死信队列（DLQ）仅适用于接收器连接器。当一条记录以JSON格式到达接收器连接器时，但接收器连接器配置期望另一种格式，如
消息中间件巡检搬砖小常消息中间件运维笔记 RocketMQ kafka 中间件巡检运维
除资源使用情况外，消息中间件RocketMQ、kafka还可以巡检哪些？一、RocketMQ巡检1、检查broker写入耗时是否有压力2、检查brokerbusy的数量与频率3、主题发送TPS、发送错误率巡检4、从节点消费情况检查5、集群各broker消息流转情况巡检二、Kafka巡检1、检查是否有分区发生ISR频繁扩张收缩2、检查分区leader选举值是否处于正常水平3、检查controller
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
RocketMQ 之死信队列 firepation RocketMQ rocketmq
在分布式消息系统中，消息的可靠传递和处理至关重要。然而，由于各种原因（如消息处理失败、消费超时等），一些消息可能无法被正常消费。这些无法被消费的消息如果不加以处理，会影响系统的稳定性和数据一致性。为了解决这一问题，RocketMQ提供了死信队列（DeadLetterQueue，DLQ）机制。本文将深入探讨RocketMQ的死信队列，包括其实现原理、应用场景以及使用示例。什么是死信队列？死信队列是一
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
分布式选举算法＜一＞ Bully算法
分布式选举算法详解：Bully算法引言在分布式系统中，节点故障是不可避免的。当主节点（Leader）发生故障时，系统需要快速选举出新的主节点来保证服务的连续性。Bully算法是一种经典的分布式选举算法，以其简单高效的特点被广泛应用于各种分布式系统中。什么是Bully算法？Bully算法是一种基于优先级的分布式选举算法。每个节点都有一个唯一的ID，ID值越大的节点优先级越高。当主节点故障时，优先级最
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
Python爬虫实战：基于最新技术的定时签到系统开发全解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言人工智能自动化知识图谱
摘要本文详细介绍了如何使用Python开发一个功能完善的定时签到爬虫系统。文章从爬虫基础知识讲起，逐步深入到高级技巧，包括异步请求处理、浏览器自动化、验证码破解、分布式架构等最新技术。我们将通过一个完整的定时签到项目案例，展示如何构建一个稳定、高效且具有良好扩展性的爬虫系统。文中提供了大量可运行的代码示例，涵盖requests、aiohttp、selenium、playwright等多种技术方案，
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
web3中的ipfs 财神爷首席大弟子 web3 去中心化区块链
什么是web3：是基于区块链技术的分布式网络，主要目标是建立一个去中心化与信任化的互联网去中心化以及是信任化区块链：将所有的交易记录和什么护具存储在分布式网络中，每一个node都有完整的数据副本任何一个node修改都需要得到其他节点的认可，确保数据的真实性和和可信度web3有一些关键技术和标准，例如以太坊，IPFS，ENS，ERC标准等以太坊：以太币是一个开源的有智能合约功能的公共区块链平台，通过
使用ceph-ansible部署分布式存储Ceph-octopus版本降世神童云计算技术专栏分布式 ceph ansible
使用ceph-ansible部署分布式存储Ceph-octopus版本1.Ceph基础概念及部署方式1.1.Ceph基本概念1.2.Ceph部署方式2.系统初始化配置3.Ceph集群部署3.1.Ansible安装与配置3.2.ceph-ansible安装与配置3.2.1.下载ceph-ansible3.2.2.安装ceph-ansible依赖3.2.3.修改ceph配置文件3.3.开始部署ceph
2024年运维最新分布式存储ceph osd 常用操作_ceph查看osd对应硬盘(1)，2024年最新Linux运维编程基础教程 2401_83944328 程序员运维分布式 ceph
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
【赵渝强老师】基于PostgreSQL的分布式数据库：Citus
由于PostgreSQL具有强大的功能和良好的可扩展性，因此基于PostgreSQL很容易就可以实现分布式架构。Citus便是具体的一种实现方式。它以扩展的插件形式与PostgreSQL进行集成，且独立于PostgreSQL内核，部署也比较简单。Citus是现在非常流行的基于PostgreSQL的分布式解决方案。一、Citus基础下面是百度百科中对分布式数据库的定义：分布式数据库系统通常使用较小的
Hive简介
文章目录Hive简介Hive特点Hive和RDBMS的对比Hive的架构Hive的数据组织Hive数据类型Hive简介1、Hive由Facebook实现并开源2、是基于Hadoop的一个数据仓库工具3、可以将结构化的数据映射为一张数据库表4、并提供HQL(HiveSQL)查询功能5、底层数据是存储在HDFS上6、Hive的本质是将SQL语句转换为MapReduce任务运行7、使不熟悉MapRedu
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
使用HarmonyOS 5和CodeGenie辅助工具开发鸿蒙运动健康类应用的项目总结哼唧唧_ CodeGenie 运动健康 Harmony OS5 harmonyos 华为
一、项目背景与目标随着鸿蒙生态在穿戴设备、智能家居领域的快速扩展，我团队基于HarmonyOS5操作系统，开发了一款面向运动健康场景的智能应用——“Harmony健康伴侣”。项目采用华为官方推出的智能编程助手CodeGenie进行辅助开发，旨在验证CodeGenie在提升鸿蒙应用开发效率与质量方面的实际效果。二、核心功能实现该应用深度融合HarmonyOS分布式能力，支持跨设备无缝协同，主要功能包
万物智联时代启航：鸿蒙OS重塑全场景开发新生态黑巧克力可减脂鸿蒙开发鸿蒙系统
目录HarmonyOS简介：分布式操作系统，开启万物智联新时代HarmonyOS发展历程：从破局到引领核心特性：分布式技术三支柱应用场景：全场景覆盖的鸿蒙生态什么选择鸿蒙开发？技术红利与市场蓝海结语：拥抱鸿蒙，赢在万物智联起点HarmonyOS简介：分布式操作系统，开启万物智联新时代什么是鸿蒙？HarmonyOS（鸿蒙操作系统）是华为自主研发的面向全场景的分布式操作系统，其核心使命是打破设备孤岛，
Python爬虫：从图片或扫描文档中提取文字数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据挖掘 c++
1.引言随着大数据技术的不断进步，图像数据逐渐成为了许多行业中重要的数据源之一。图像中不仅包含了丰富的视觉信息，还可能蕴含着大量的文字数据。对于科研、企业、政府等多个领域而言，如何从图片或扫描文档中提取出有价值的文字信息是一个亟待解决的问题。在这一过程中，OCR（OpticalCharacterRecognition，光学字符识别）技术成为了解决这一问题的重要工具。在本文中，我们将探讨如何使用Py
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？架构师李肯嵌入式物联网开发进阶 c语言面试性能优化
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？我相信大部分初中级C程序员在面试的过程中，可能都被问过关于memcpy函数的问题，甚至需要手撕memcpy。本文从另一个角度带你领悟一下memcpy的面试题，你可以看看是否能接得住？文章目录1写在前面2源码实现2.1函数申明2.2简单的功能实现2.3满足大数据量拷贝的功能实现3源码测试4小小总结5更多分享1写在前面假如你遇到下面的面试
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST