记录:466
场景:一个KafkaProducer在一个Topic发布消息,多个消费者KafkaConsumer订阅Kafka的Topic。每个KafkaConsumer指定一个特定的ConsumerGroup,达到一条消息被多个不同的ConsumerGroup消费。
版本:JDK 1.8,Spring Boot 2.6.3,kafka_2.12-2.8.0,kafka-clients-3.0.0。
Kafka集群安装:https://blog.csdn.net/zhangbeizhen18/article/details/131156084
1.基础概念
Topic:Kafka根据Topic对消息进行归类,发布到Kafka的每条消息都需要指定一个Topic。
Producer:消息生产者,向Broker发送消息的客户端。
Consumer:消息消费者,从Broker读取消息的客户端。
ConsumerGroup:每个Consumer属于一个特定的ConsumerGroup,一条消息可以被多个不同的ConsumerGroup消费;但是一个ConsumerGroup中只能有一个Consumer能够消费该消息。
publish:发布,使用Producer向Kafka写入数据。
subscribe:订阅,使用Consumer从Kafka读取数据。
2.微服务中配置Kafka信息
2.1在pom.xml添加依赖
pom.xml文件:
org.apache.kafka
kafka-clients
3.0.0
解析:使用原生的kafka-clients,版本:3.0.0。操作kafka集群的Topic。
3.配置Kafka生产者和消费者
使用原生的kafka-clients,需配置KafkaProducer和KafkaConsumer,把Kafka集群的配置信息注入到这两个对象,便可以操作了生产者和消费者。
配置细节在官网的configuration:https://kafka.apache.org/documentation/
3.1配置KafkaProducer生产者
(1)示例代码
@Configuration
public class KafkaClusterConfig {
@Bean
public KafkaProducer kafkaProducer() {
Map configs = new HashMap<>();
//kafka集群
Collection cluster = Lists.newArrayList("192.168.19.161:29092",
"192.168.19.162:29092",
"192.168.19.163:29092");
configs.put("bootstrap.servers", cluster);
//客户端发送服务端失败的重试次数
configs.put("retries", 2);
//多个记录被发送到同一个分区时,生产者将尝试将记录一起批处理成更少的请求.
//此设置有助于提高客户端和服务器的性能,配置控制默认批量大小(以字节为单位)
configs.put("batch.size", 16384);
//生产者可用于缓冲等待发送到服务器的记录的总内存字节数(以字节为单位)
configs.put("buffer-memory", 33554432);
//生产者producer要求leader节点在考虑完成请求之前收到的确认数,用于控制发送记录在服务端的持久化
//acks=0,设置为0,则生产者producer将不会等待来自服务器的任何确认.该记录将立即添加到套接字(socket)缓冲区并视为已发送.在这种情况下,无法保证服务器已收到记录,并且重试配置(retries)将不会生效(因为客户端通常不会知道任何故障),每条记录返回的偏移量始终设置为-1.
//acks=1,设置为1,leader节点会把记录写入本地日志,不需要等待所有follower节点完全确认就会立即应答producer.在这种情况下,在follower节点复制前,leader节点确认记录后立即失败的话,记录将会丢失.
//acks=all,acks=-1,leader节点将等待所有同步复制副本完成再确认记录,这保证了只要至少有一个同步复制副本存活,记录就不会丢失.
configs.put("acks", "-1");
//指定key使用的序列化类
Serializer keySerializer = new StringSerializer();
//指定value使用的序列化类
Serializer valueSerializer = new StringSerializer();
//创建Kafka生产者
KafkaProducer kafkaProducer = new KafkaProducer(configs, keySerializer, valueSerializer);
return kafkaProducer;
}
}
(2)解析代码
把Kafka的配置信息注入到KafkaProducer,并创建KafkaProducer对象。
使用@Configuration和@Bean注解把KafkaProducer对象注入到Spring的IOC容器,在Spring环境就可以使用KafkaProducer了。
KafkaProducer的底层使用配置类是ProducerConfig,在配置时可以参考。
全称:org.apache.kafka.clients.producer.ProducerConfig。
3.2配置KafkaConsumer的公用配置信息
(1)示例代码
@Configuration
public class KafkaClusterConfig {
@Bean("consumerConfig")
public Map consumerConfigs() {
Map configs = new HashMap<>();
//kafka集群
Collection cluster = Lists.newArrayList("192.168.19.161:29092",
"192.168.19.162:29092",
"192.168.19.163:29092");
configs.put("bootstrap.servers", cluster);
//开启consumer的偏移量(offset)自动提交到Kafka
configs.put("enable.auto.commit", true);
//consumer的偏移量(offset) 自动提交的时间间隔,单位毫秒
configs.put("auto.commit.interval", 5000);
//在Kafka中没有初始化偏移量或者当前偏移量不存在情况
//earliest, 在偏移量无效的情况下, 自动重置为最早的偏移量
//latest, 在偏移量无效的情况下, 自动重置为最新的偏移量
//none, 在偏移量无效的情况下, 抛出异常.
configs.put("auto.offset.reset", "latest");
//请求阻塞的最大时间(毫秒)
configs.put("fetch.max.wait", 500);
//请求应答的最小字节数
configs.put("fetch.min.size", 1);
//心跳间隔时间(毫秒)
configs.put("heartbeat-interval", 3000);
//一次调用poll返回的最大记录条数
configs.put("max.poll.records", 500);
return configs;
}
@Bean("keyDeserializer")
public Deserializer consumerKeyDeserializer() {
//指定key使用的反序列化类
Deserializer keyDeserializer = new StringDeserializer();
return keyDeserializer;
}
@Bean("valueDeserializer")
public Deserializer consumerValueDeserializer() {
//指定value使用的反序列化类
Deserializer valueDeserializer = new StringDeserializer();
return valueDeserializer;
}
}
(2)解析代码
配置消费者KafkaConsumer公用配置信息:@Bean("consumerConfig")、 @Bean("keyDeserializer")、 @Bean("valueDeserializer")。
在创建KafkaConsumer时,只需获取公用consumerConfig、keyDeserializer、valueDeserializer设置到KafkaConsumer。
4.生产者(ZhejiangProvinceProducerController)
(1)示例代码
@RestController
@RequestMapping("/hub/example/province/producer")
@Slf4j
public class ZhejiangProvinceProducerController {
//1.注入Kafka生产者
@Autowired
private KafkaProducer kafkaProducer;
//2.定义Kafka的Topic
private final String topicName = "hub-topic-province-notice";
@GetMapping("/f01_1")
public Object f01_1(String msgContent) {
try {
//3.获取业务数据
String uuid = UUID.randomUUID().toString().replace("-", "");
long now = System.currentTimeMillis();
String msgKey = "province" + ":" + uuid + ":" + now;
MsgDto msgDto = MsgDto.buildDto(uuid, now, msgContent);
String msgData = JSONObject.toJSONString(msgDto);
log.info("ZhejiangProvince生产者向Kafka集群的Topic: {},写入Key:", topicName);
log.info(msgKey);
log.info("ZhejiangProvince生产者向Kafka集群的Topic: {},写入Data:", topicName);
log.info(msgData);
//4.使用KafkaProducer向Kafka集群写入数据
ProducerRecord producerRecord = new ProducerRecord<>(topicName, msgKey, msgData);
kafkaProducer.send(producerRecord);
} catch (Exception e) {
log.info("ZhejiangProvince生产者写入Topic异常.");
e.printStackTrace();
}
return "写入成功";
}
}
(2)解析代码
使用KafkaProducer 向Kafka集群的Topic:hub-topic-province-notice写入JSON字符串数据,发布一条消息,给订阅的消费者消费。
5.消费者一(HangzhouCityConsumer)
(1)示例代码
@Component
@Slf4j
public class HangzhouCityConsumer implements CommandLineRunner {
//1.注入消费者配置信息,key和value的序列化对象
@Autowired
private Deserializer keyDeserializer;
@Autowired
private Deserializer valueDeserializer;
//2.定义Kafka的Topic
private final String topicName = "hub-topic-province-notice";
@Override
public void run(String... args) throws Exception {
//3.创建线程并传入线程任务执行的Runnable
Thread thread = new Thread(new HangzhouCityConsumer.ThreadRunnable());
//4.启动线程
thread.start();
}
//在线程中使用KafkaConsumer实时监听Kafka集群的Topic
public class ThreadRunnable implements Runnable {
@Override
public void run() {
log.info("HangzhouCityConsumer启动线程监听Kafka集群的Topic: {}", topicName);
Collection topics = Lists.newArrayList(topicName);
//1.指定消费组(一条消息可以被多个不同的ConsumerGroup消费)
Map configs = new HashMap<>();
Map consumerConfig = SpringUtil.getBean("consumerConfig");
configs.putAll(consumerConfig);
configs.put("group.id", "hub-topic-province-notice-group-hangzhou");
//2.创建Kafka消费者(传入消费者配置和key和value的序列化对象)
KafkaConsumer kafkaConsumer = new KafkaConsumer(configs, keyDeserializer, valueDeserializer);
//3.订阅Kafka的Topic
kafkaConsumer.subscribe(topics);
while (true) {
//4.使用KafkaConsumer的poll按照指定周期轮询Kafka集群指定Topic的消息
ConsumerRecords consumerRecords = kafkaConsumer.poll(Duration.ofMillis(1000));
//5.遍历从Kafka集群中读取数据集ConsumerRecords
for (ConsumerRecord consumerRecord : consumerRecords) {
//6.从ConsumerRecord中取出消费数据
String msgKey = (String) consumerRecord.key();
String msgData = (String) consumerRecord.value();
log.info("HangzhouCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Key:", topicName);
log.info(msgKey);
log.info("HangzhouCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Data:", topicName);
log.info(msgData);
}
}
}
}
}
(2)解析代码
从配置类中获取配置信息consumerConfig、keyDeserializer、valueDeserializer。
使用group.id属性指定消费组:hub-topic-province-notice-group-hangzhou。
使用KafkaConsumer的subscribe方法订阅Topic:hub-topic-province-notice。
使用KafkaConsumer的poll方法轮询Topic:hub-topic-province-notice,消费Topic的消息数据存入到记录结果集:ConsumerRecords。
遍历结果集ConsumerRecords获取具体数据。
6.消费者二(NingboCityConsumer)
(1)示例代码
@Component
@Slf4j
public class NingboCityConsumer implements InitializingBean {
//1.注入消费者配置信息,key和value的序列化对象
@Autowired
private Deserializer keyDeserializer;
@Autowired
private Deserializer valueDeserializer;
//2.定义Kafka的Topic
private final String topicName = "hub-topic-province-notice";
@Override
public void afterPropertiesSet() throws Exception {
//3.创建线程,在线程中使用KafkaConsumer实时监听Kafka集群的Topic
Thread thread = new Thread(() -> {
log.info("NingboCity启动线程监听Topic: {}", topicName);
Collection topics = Lists.newArrayList(topicName);
//1.指定消费组(一条消息可以被多个不同的ConsumerGroup消费)
Map configs = new HashMap<>();
Map consumerConfig = SpringUtil.getBean("consumerConfig");
configs.putAll(consumerConfig);
configs.put("group.id", "hub-topic-province-notice-group-ningbo");
//2.创建Kafka消费者
KafkaConsumer kafkaConsumer = new KafkaConsumer(configs, keyDeserializer, valueDeserializer);
//3.订阅Kafka的Topic
kafkaConsumer.subscribe(topics);
while (true) {
ThreadUtil.sleep(200);
//4.使用KafkaConsumer的poll按照指定周期轮询Kafka集群指定Topic的消息
ConsumerRecords consumerRecords = kafkaConsumer.poll(Duration.ofMillis(1000));
for (ConsumerRecord consumerRecord : consumerRecords) {
//5.KafkaConsumer从集群中监听的消息存储在ConsumerRecord
String msgKey= (String) consumerRecord.key();
String msgData = (String) consumerRecord.value();
log.info("NingboCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Key:",topicName);
log.info(msgKey);
log.info("NingboCityConsumer从Kafka集群中的Topic:{},消费的原始数据的Data:",topicName);
log.info(msgData);
}
}
});
//9.启动线程
thread.start();
}
}
(2)解析代码
从配置类中获取配置信息consumerConfig、keyDeserializer、valueDeserializer。
使用group.id属性指定消费组:hub-topic-province-notice-group-ningbo。
使用KafkaConsumer的subscribe方法订阅Topic:hub-topic-province-notice。
使用KafkaConsumer的poll方法轮询Topic:hub-topic-province-notice,消费Topic的消息数据存入到记录结果集:ConsumerRecords。
遍历结果集ConsumerRecords获取具体数据。
7.测试
(1)使用Postman测试,调用生产者写入数据
请求RUL:http://127.0.0.1:18210/hub-210-kafka/hub/example/province/producer/f01_1
参数:msgContent="浙江省全力发展经济"
(2)生产者日志
ZhejiangProvince生产者向Kafka集群的Topic: hub-topic-province-notice,写入Key:
province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150
ZhejiangProvince生产者向Kafka集群的Topic: hub-topic-province-notice,写入Data:
{"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}
(3)消费者一日志
HangzhouCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Key:
province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150
HangzhouCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Data:
{"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}
(4)消费者二日志
NingboCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Key:
province:b9418d4ae1f44a198684abfa59aaec2a:1687791091150
NingboCityConsumer从Kafka集群中的Topic:hub-topic-province-notice,消费的原始数据的Data:
{"msgContent":"浙江省全力发展经济","publicTime":"2023-06-26 22:51:31","uuid":"b9418d4ae1f44a198684abfa59aaec2a"}
(5)结论
每个Consumer指定一个特定的ConsumerGroup,一条消息可以被多个不同的ConsumerGroup消费。
8.辅助类
@Data
@Builder
public class MsgDto implements Serializable {
private String uuid;
private String publicTime;
private String msgContent;
public static MsgDto buildDto(String uuid,
long publicTime,
String msgContent) {
return builder().uuid(uuid)
.publicTime(DateUtil.formatDateTime(new Date(publicTime)))
.msgContent(msgContent).build();
}
}
以上,感谢。
2023年6月26日