Kafka快速入门(五)——Kafka管理

一、Kafka工具脚本简介

1、Kafka工具脚本简介

Kafka默认提供了很多个命令行脚本,用于实现各种各样的功能和运维管理。默认情况下,不加任何参数或携带--help运行Kafka shell脚本根据,会得到脚本的使用方法说明。
connect-standalone.sh用于启动单节点的Standalone模式的Kafka Connect组件。
connect-distributed.sh用于启动多节点的Distributed模式的Kafka Connect组件。
kafka-acls.sh脚本用于设置Kafka权限,比如设置哪些用户可以访问Kafka的哪些TOPIC的权限。
kafka-delegation-tokens.sh用于管理Delegation Token。基于Delegation Token的认证是一种轻量级的认证机制,是对SASL认证机制的补充。
kafka-topics.sh用于管理所有TOPIC。
kafka-console-producer.sh用于生产消息。
kafka-console-consumer.sh用于消费消息。
kafka-producer-perf-test.sh用于生产者性能测试。
kafka-consumer-perf-test.sh用于消费者性能测试。
kafka-delete-records.sh用于删除Kafka的分区消息,由于Kafka有自己的自动消息删除策略,使用率不高。
kafka-dump-log.sh用于查看Kafka消息文件的内容,包括消息的各种元数据信息、消息体数据。
kafka-log-dirs.sh用于查询各个Broker上的各个日志路径的磁盘占用情况。
kafka-mirror-maker.sh用于在Kafka集群间实现数据镜像。
kafka-preferred-replica-election.sh用于执行Preferred Leader选举,可以为指定的主题执行更换Leader的操作。
kafka-reassign-partitions.sh用于执行分区副本迁移以及副本文件路径迁移。
kafka-run-class.sh用于执行任何带main方法的Kafka类。
kafka-server-start.sh用于启动Broker进程。
kafka-server-stop.sh用于停止Broker进程。
kafka-streams-application-reset.sh用于给Kafka Streams应用程序重设位移,以便重新消费数据。
kafka-verifiable-producer.sh用于测试验证生产者的功能。
kafka-verifiable-consumer.sh用于测试验证消费者功能。
trogdor.sh是Kafka的测试框架,用于执行各种基准测试和负载测试。
kafka-broker-api-versions.sh脚本主要用于验证不同Kafka版本之间服务器和客户端的适配性。

2、Kafka API兼容性测试

本文使用Kafka 2.4版本,kafka-broker-api-versions.sh需要指定Kafka Broker,测试相应版本的API兼容性。
kafka-broker-api-versions.sh --bootstrap-server kafka-test:9092
Kafka快速入门(五)——Kafka管理_第1张图片
Produce表示Produce请求,Produce请求是Kafka所有请求类型中的第一号请求,序号是0。0 to 8表示Produce请求在Kafka 2.4中总共有9个版本,序号分别是0到8。usable:8表示当前连入本Kafka Broker的客户端API能够使用的版本号是8,即最新的版本。
当使用低版本的kafka-broker-api-versions.sh脚本连接高版本的Kafka Broker时,Produce请求信息的usable表示低版本的客户端API只能发送版本号是usable值的Produce请求类型。
在Kafka 0.10.2.0版本前,Kafka是单向兼容的,高版本的Broker能够处理低版本Client发送的请求,低版本的Broker不能处理高版本的Client请求。Kafka 0.10.2.0版本开始,Kafka正式支持双向兼容,低版本的Broker也能处理高版本Client的请求。

3、Kafka性能测试

Java生产者性能测试脚本:
kafka-producer-perf-test.sh --topic test-topic --num-records 10000000 --throughput -1 --record-size 1024 --producer-props bootstrap.servers=kafka-host:port acks=-1 linger.ms=2000 compression.type=lz4
Java消费者性能测试脚本:
kafka-consumer-perf-test.sh --broker-list kafka-host:port --messages 10000000 --topic test

二、TOPIC管理

1、创建TOPIC

kafka-topics.sh --bootstrap-server broker_host:port --create --topic my_topic_name --partitions 1 --replication-factor 1
--create表示创建TOPIC,--partitions表示TOPIC的分区数量,--replication-factor表示每个分区下的副本数。从Kafka 2.2版本开始,Kafka社区推荐用--bootstrap-server参数替换--zookeeper参数用于指定Kafka Broker。
Kafka社区推荐使用--bootstrap-server的原因主要有:
(1)使用--zookeeper会绕过Kafka的安全体系。即使为Kafka集群设置安全认证,限制TOPIC的创建,如果使用--zookeeper的命令,依然能成功创建任意TOPIC,不受认证体系的约束。
(2)使用--bootstrap-server与Kafka集群进行交互,越来越成为使用Kafka的标准操作。未来,越来越少的命令和API需要与ZooKeeper进行连接。

2、查询TOPIC

查询Kafka集群所有TOPIC的命令:
kafka-topics.sh --bootstrap-server broker_host:port --list
查询单个TOPIC详细数据的命令如下:
kafka-topics.sh --bootstrap-server broker_host:port --describe --topic topic_name
如果describe命令不指定具体的TOPIC名称,那么Kafka默认会返回当前用户的所有可见TOPIC的详细数据。

3、生产消息

kafka-console-producer.sh --bootstrap-server kafka:9092 --topic test
启动生产者,并将Terminal输入写入TOPIC。

4、消费消息

kafka-console-consumer.sh --bootstrap-server kafka:9092 --topic test --from-beginning
启动消费者,从TOPIC消费消息数据。

5、修改TOPIC分区数量

Kafka目前不允许减少某个TOPIC的分区数,因此修改TOPIC的分区数量就是增加分区数量,可以使用kafka-topics脚本,结合--alter参数来增加某个TOPIC的分区数。
kafka-topics.sh --bootstrap-server broker_host:port --alter --topic topic_name --partitions 新分区数
指定的分区数一定要比原有分区数大,否则Kafka会抛出InvalidPartitionsException异常。

6、修改TOPIC级别参数

设置TOPIC级别参数max.message.bytes。
kafka-configs.sh --zookeeper zookeeper_host:port --entity-type topics --entity-name topic_name --alter --add-config max.message.bytes=10485760
设置常规的TOPIC级别参数使用--zookeeper,设置动态参数使用--bootstrap-server。

7、修改TOPIC限速

当某个TOPIC的副本在执行副本同步机制时,为了不消耗过多的带宽,可以设置Leader副本和Follower副本使用的带宽。设置TOPIC各个分区的Leader副本和Follower副本在处理副本同步时,不得占用超过100MBps(104857600)的带宽,必须先设置Broker端参数leader.replication.throttled.rate 和 follower.replication.throttled.rate,命令如下:
kafka-configs.sh --zookeeper zookeeper_host:port --alter --add-config 'leader.replication.throttled.rate=104857600,follower.replication.throttled.rate=104857600' --entity-type brokers --entity-name 0
--entity-name参数用于指定Broker ID。如果TOPIC的副本分别在多个Broker上,需要依次为相应Broker执行。为TOPIC的所有副本都设置限速,可以统一使用通配符*来表示,命令如下:
kafka-configs.sh --zookeeper zookeeper_host:port --alter --add-config 'leader.replication.throttled.replicas=*,follower.replication.throttled.replicas=*' --entity-type topics --entity-name test

8、删除TOPIC

删除TOPIC命令如下:
kafka-topics.sh --bootstrap-server broker_host:port --delete --topic topic_name
删除TOPIC操作是异步的,执行完删除命令不代表TOPIC立即就被删除,仅仅是被标记成“已删除”状态而已。Kafka会在后台默默地开启TOPIC删除操作,通常需要耐心地等待一段时间。

9、Kafka内置TOPIC

Kafka有两个内TOPIC:__consumer_offsets__transaction_state,内置TOPIC默认都有50个分区。
Kafka 0.11前,当Kafka自动创建__consumer_offsets时,会综合考虑当前运行的Broker台数和Broker端参数offsets.topic.replication.factor值,然后取两者的较小值作为__consumer_offsets的副本数,__consumer_offsets通常在只有一台Broker启动时被创建,因此副本数为1。Kafka 0.11版本后,Kafka会严格遵守offsets.topic.replication.factor值。如果当前运行的Broker数量小于offsets.topic.replication.factor值,Kafka会创建主题失败,并显式抛出异常。
直接查看消费者组提交的位移数据:
kafka-console-consumer.sh --bootstrap-server kafka_host:port --topic __consumer_offsets --formatter "kafka.coordinator.group.GroupMetadataManager\$OffsetsMessageFormatter" --from-beginning
直接读取TOPIC消息,查看消费者组的状态信息:
kafka-console-consumer.sh --bootstrap-server kafka_host:port --topic __consumer_offsets --formatter "kafka.coordinator.group.GroupMetadataManager\$GroupMetadataMessageFormatter" --from-beginning
__transaction_state内置TOPIC的信息查看需要指定kafka.coordinator.transaction.TransactionLog\$TransactionLogMessageFormatter。

10、修改TOPIC副本数

创建内置__consumer_offsets的副本配置json 文件,显式提供50个分区对应的副本数。replicas中的3台Broker排列顺序不同,目的是将Leader副本均匀地分散在Broker上。文件具体格式如下:

{"version":1, "partitions":[
 {"topic":"__consumer_offsets","partition":0,"replicas":[0,1,2]}, 
  {"topic":"__consumer_offsets","partition":1,"replicas":[0,2,1]},
  {"topic":"__consumer_offsets","partition":2,"replicas":[1,0,2]},
  {"topic":"__consumer_offsets","partition":3,"replicas":[1,2,0]},
  ...
  {"topic":"__consumer_offsets","partition":49,"replicas":[0,1,2]}
]}

执行kafka-reassign-partitions脚本:
kafka-reassign-partitions.sh --zookeeper zookeeper_host:port --reassignment-json-file reassign.json --execute

11、错误处理

(1)删除TOPIC失败
造成TOPIC删除失败最常见的原因有两个:副本所在的Broker宕机;待删除TOPIC的部分分区依然在执行迁移过程。
强制删除TOPIC的方法:
A、手动删除ZooKeeper节点/admin/delete_topics下以待删除TOPIC为名的znode。
B、手动删除TOPIC在磁盘上的分区目录。
C、在ZooKeeper中执行rmr /controller,触发Controller重选举,刷新Controller缓存。可能会造成大面积的分区Leader重选举。可以不执行,只是Controller缓存中没有清空待删除TOPIC,不影响使用。
(2)内置__consumer_offsets占用太多磁盘空间
如果__consumer_offsets消耗过多的磁盘空间,需要显式地用jstack 命令查看一下kafka-log-cleaner-thread前缀的线程状态。通常都是因为线程挂掉无法及时清理__consumer_offsets,此时需要重启相应的 Broker。

三、Kafka动态配置

1、Kafka动态配置简介

Kafka安装目录的config/server.properties文件可以用于配置静态参数(Static Configs)。通常会指定server.properties文件的路径来启动Broker。如果要设置Broker端的任何参数,必须在server.properties文件中显式地增加一行对应的配置,启动Broker进程,令参数生效。通常会一次性设置好所有参数后,再启动Broker,但如果需要变更任何参数时,必须重启Broker。
但生产环境中如果每次修改Broker端参数都需要重启Broker,Kafka集群的可用性必然受到限制,因此Kafka 1.1.0版本中正式引入动态Broker参数(Dynamic Broker Configs),即修改参数值后,无需重启Broker就能立即生效。Kafka 2.3版本中Broker端参数有200多个,但Kafka社区并没有将每个参数都升级成动态参数,仅把一部分参数升级为可动态调整。
在Kafka 1.1后官方文档的Broker Configs表中增加了Dynamic Update Mode列,有3类值,分别是read-only、per-broker和cluster-wide。
(1)read-only。read-only类型参数是静态参数,只有重启Broker,才能令修改生效。
(2)per-broker。per-broker类型参数属于动态参数,修改后,只会在对应的Broker上生效。
(3)cluster-wide。cluster-wide类型参数也属于动态参数,修改后,会在整个集群范围内生效,对所有Broker都生效。
通过运行无参数的kafka-configs.sh脚本,其说明文档会列出当前动态Broker参数。

2、Kafka动态参数应用场景

Broker动态参数使用场景非常广泛,包括但不限于以下几种:
(1)动态调整Broker端各种线程池大小,实时应对突发流量。
(2)动态调整Broker端连接信息或安全配置信息。
(3)动态更新SSL Keystore有效期。
(4)动态调整Broker端Compact操作性能。
(5)实时变更JMX指标收集器(JMX Metrics Reporter)。
通常,当Kafka Broker入站流量(inbound data)激增时,会造成Broker端请求积压(Backlog)。此时可以动态增加网络线程数和I/O线程数,快速处理积压请求。当流量洪峰过后,可以将线程数调整回原值,减少对资源的浪费。整个过程不需要重启Broker,并且可以将调整线程数的操作,封装进定时任务中,以实现自动扩缩容。

3、Kafka动态参数保存

Kafka将Broker动态参数保存在ZooKeeper中。
Kafka快速入门(五)——Kafka管理_第2张图片
changes是用来实时监测动态参数变更的,不会保存参数值。
topics是用来保存Kafka TOPIC级别参数的,不属于Broker动态参数,但能够动态变更。
users和 clients则是用于动态调整客户端配额(Quota)的znode节点。所谓配额,是指Kafka运维人员限制连入集群的客户端的吞吐量或者是限定使用的CPU资源。
/config/brokers znode才是保存动态Broker参数的地方。znode有两大类子节点,第一类子节点就只有一个,即< default >,保存cluster-wide范围的动态参数;第二类以broker.id为名,保存特定Broker的per-broker范围参数。

4、Kafka动态参数配置

配置动态Broker参数的工具行命令是Kafka自带的kafka-configs脚本。
设置cluster-wide范围动态参数,需要显式指定--entity-default。
kafka-configs.sh --bootstrap-server kafka-host:port --entity-type brokers --entity-default --alter --add-config unclean.leader.election.enable=true
可以使用--describe命令查看cluster-wide范围动态Broker参数设置:
kafka-configs.sh --bootstrap-server kafka-host:port --entity-type brokers --entity-default --describe
设置per-broker范围参数命令如下:
kafka-configs.sh --bootstrap-server kafka-host:port --entity-type brokers --entity-name 1 --alter --add-config unclean.leader.election.enable=false
可以使用--describe命令查看per-broker范围动态Broker参数设置:
kafka-configs.sh --bootstrap-server kafka-host:port --entity-type brokers --entity-name 1 --describe
删除cluster-wide范围参数命令如下:
kafka-configs.sh --bootstrap-server kafka-host:port --entity-type brokers --entity-default --alter --delete-config unclean.leader.election.enable
删除per-broker范围参数命令如下:
kafka-configs.sh --bootstrap-server kafka-host:port --entity-type brokers --entity-name 1 --alter --delete-config unclean.leader.election.enable

5、常用Broker动态参数

(1)log.retention.ms
修改日志留存时间,可以在Kafka集群层面动态变更日志留存时间。(2)num.io.threads和num.network.threads。
在实际生产环境中,Broker端请求处理能力经常要按需扩容。
(3)SSL相关的参数。
SSL相关的主要4个参数:ssl.keystore.type、ssl.keystore.location、ssl.keystore.password和ssl.key.password。动态实时调整SSL参数,可以创建过期时间很短的SSL证书。每当动态调整SSL参数时,Kafka底层会重新配置Socket连接通道并更新Keystore。
(4)num.replica.fetchers
通常,Follower副本拉取速度比较慢,常见的做法是增加num.replica.fetchers参数值,确保有充足的线程可以执行Follower副本向Leader 副本的拉取。通过调整动态参数,不需要再重启Broker,就能立即在 Follower端生效。

四、Kafka消费者组位移

1、Kafka消费者组位移

传统消息中间件(RabbitMQ 或 ActiveMQ)处理和响应消息的方式是破坏性的(destructive),即一旦消息被成功处理,就会被从Broker上删除。而Kafka是基于日志结构(log-based)的消息引擎,消费者在消费消息时,仅仅从磁盘文件上读取数据,不会删除消息数据,并且位移数据是由消费者控制的,因此能够很容易地修改位移,实现重复消费历史数据的功能。

2、位移策略

位移策略根据位移维度和时间维度分为七种。位移维度是指根据位移值来重设,即直接把消费者的位移值重设成指定的位移值;时间维度是可以给定一个基准时间,让消费者把位移调整成大于基准时间的最小位移。
Kafka快速入门(五)——Kafka管理_第3张图片
Earliest策略表示将位移调整到TOPIC当前最早位移处。最早位移不一定是0,因为在生产环境中,太过久远的消息通常会被Kafka自动删除,所以当前最早位移很可能是一个大于0的值。如果想要重新消费主题的所有消息,那么可以使用Earliest策略。
Latest策略表示把位移重设成最新末端位移。如果想跳过所有历史消息,从最新的消息处开始消费,可以使用Latest策略。
Current策略表示将位移调整成消费者当前提交的最新位移。
Specified-Offset策略则是比较通用的策略,表示消费者把位移值调整到指定的位移处。如消费者程序在处理某条错误消息时,可以手动地跳过此消息的处理。
Shift-By-N策略表示跳过的位移的相对数值,可以是负数,负数表示把位移重设成当前位移的前N条位移处。
DateTime策略表示将位移重置到指定时间后的最早位移处。如想重新消费昨天的数据,可以使用DateTime策略重设位移到昨天0点。
Duration策略表示指定相对的时间间隔,然后将位移调整到距离当前给定时间间隔的位移处,具体格式是 PnDTnHnMnS,是一个符合ISO-8601规范的Duration格式,以字母P开头,后面由4部分组成,即 D、H、M和S,分别表示天、小时、分钟和秒。如果想将位移调回到15分钟前,可以指定PT0H15M0S。

3、重设消费者组位移

重设消费者组位移的方式有两种,一种是通过消费者API来实现,一种是通过kafka-consumer-groups.sh命令行脚本来实现。
(1)消费者API方式
通过Java API重设位移,需要调用KafkaConsumer的seek系列方法。

void seek(TopicPartition partition, long offset);
void seek(TopicPartition partition, OffsetAndMetadata offsetAndMetadata);
void seekToBeginning(Collection partitions);
void seekToEnd(Collection partitions);

每次调用seek方法只能重设一个分区的位移。OffsetAndMetadata是一个封装Lon 型的位移和自定义元数据的复合类。seekToBeginning和seekToEnd拥有一次重设多个分区的能力。
设置Earliest位移策略的Java代码如下:

Properties consumerProperties = new Properties();
consumerProperties.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, false);
consumerProperties.put(ConsumerConfig.GROUP_ID_CONFIG, groupID);
consumerProperties.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
consumerProperties.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
consumerProperties.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
consumerProperties.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, brokerList);

String topic = "test";  // 要重设位移的Kafka主题 
try (final KafkaConsumer consumer = 
  new KafkaConsumer<>(consumerProperties)) {
         consumer.subscribe(Collections.singleton(topic));
         consumer.poll(0);
         consumer.seekToBeginning(
  consumer.partitionsFor(topic).stream().map(partitionInfo ->          
  new TopicPartition(topic, partitionInfo.partition()))
  .collect(Collectors.toList()));
} 

消费者程序必须要禁止自动提交位移。
组ID要设置成要重设的消费者组的组ID。
调用seekToBeginning方法时,需要一次性构造主题的所有分区对象。
必须要调用带长整型的poll方法,而不要调用consumer.poll(Duration.ofSecond(0))。
设置Latest位移策略的Java代码如下:

consumer.seekToEnd(consumer.partitionsFor(topic).stream().map(partitionInfo->new TopicPartition(topic, partitionInfo.partition())).collect(Collectors.toList()));
设置Current 位移策略的Java代码如下:
consumer.partitionsFor(topic).stream().map(info->new TopicPartition(topic,info.partition())).forEach(tp->{long committedOffset = consumer.committed(tp).offset();consumer.seek(tp, committedOffset);
});

partitionsFor方法获取给定主题的所有分区,然后依次获取对应分区上的已提交位移,最后通过seek方法重设位移到已提交位移处。
(2)命令行脚本方式
Kafka 0.11版本中,引入了通过kafka-consumer-groups.sh脚本重设消费者位移的功能。
Earliest策略直接指定–to-earliest:
kafka-consumer-groups.sh --bootstrap-server kafka-host:port --group test-group --reset-offsets --all-topics --to-earliest –execute
Latest策略直接指定–to-latest:
kafka-consumer-groups.sh --bootstrap-server kafka-host:port --group test-group --reset-offsets --all-topics --to-latest --execute
Current策略直接指定–to-current:
kafka-consumer-groups.sh --bootstrap-server kafka-host:port --group test-group --reset-offsets --all-topics --to-current --execute
Specified-Offset策略直接指定–to-offset:
kafka-consumer-groups.sh --bootstrap-server kafka-host:port --group test-group --reset-offsets --all-topics --to-offset <offset> --execute
Shift-By-N策略直接指定–shift-by N:
kafka-consumer-groups.sh --bootstrap-server kafka-host:port --group test-group --reset-offsets --shift-by <offset_N> --execute
DateTime策略直接指定–to-datetime:
kafka-consumer-groups.sh --bootstrap-server kafka-host:port --group test-group --reset-offsets --to-datetime 2020-03-08T12:00:00.000 --execute
Duration策略直接指定–by-duration:
kafka-consumer-groups.sh --bootstrap-server kafka-host:port --group test-group --reset-offsets --by-duration PT0H60M0S --execute

五、Kafka AdminClient工具

1、AdminClient引入

Kafka管理工具脚本的缺陷如下:
(1)只能运行在控制台,集成度差,不能集成到应用程序、运维框架、监控平台。
(2)通过连接ZooKeeper来提供服务,会绕过Kafka的用户认证机制,不安全。
(3)需要使用Kafka服务器端的代码。
基于上述缺陷,Kafka 0.11版本正式推出Java客户端版的AdminClient。

2、AdminClient功能特性

(1)主题管理:包括主题的创建、删除和查询。
(2)权限管理:包括具体权限的配置与删除。
(3)配置参数管理:包括Kafka各种资源的参数设置、详情查询。Kafka资源包括Broker、主题、用户、Client-id等。
(4)副本日志管理:包括副本底层日志路径的变更和详情查询。
(5)分区管理:即创建额外的主题分区。
(6)消息删除:即删除指定位移前的分区消息。
(7)Delegation Token管理:包括Delegation Token创建、更新、过期和详情查询。
(8)消费者组管理:包括消费者组的查询、位移查询和删除。
(9)Preferred领导者选举:推选指定主题分区的Preferred Broker为领导者。

3、AdminClient工作原理

AdminClient采用双线程设计:前端主线程和后端I/O线程,前端线程负责将用户要执行的操作转换成对应的请求,然后再将请求发送到后端I/O线程的队列中;而后端I/O线程从队列中读取相应的请求,然后发送到对应的Broker节点上,然后把执行结果保存起来,以便等待前端线程的获取。AdminClient内部大量使用生产者-消费者模式将请求生成与处理解耦。
Kafka快速入门(五)——Kafka管理_第4张图片
前端主线程会创建名为Call的请求对象实例,Call主要任务由两个:
(1)构建对应的请求对象。如果要创建主题,创建CreateTopicsRequest;如果查询消费者组位移,创建OffsetFetchRequest。
(2)指定响应的回调逻辑。如从Broker端接收到CreateTopicsResponse后要执行的动作。一旦创建好Call实例,前端主线程会将其放入到新请求队列(New Call Queue)中,此时前端主线程的任务完成,只需要等待结果返回即可。
后端I/O线程使用3个队列来承载不同时期的请求对象,分别是新请求队列、待发送请求队列和处理中请求队列。新请求队列的线程安全由Java的monitor锁来保证。为了确保前端主线程不会因为monitor锁被阻塞,后端I/O线程会定期地将新请求队列中的所有Call实例全部搬移到待发送请求队列中进行处理。待发送请求队列和处理中请求队列只由后端I/O线程处理,因此无需任何锁机制来保证线程安全。
当I/O线程在处理某个请求时,会显式地将请求保存在处理中请求队列。一旦处理完成,I/O线程会自动地调用Call对象中的回调逻辑完成最后的处理。最后,I/O线程会通知前端主线程结果已经准备完毕,前端主线程能够及时获取到执行操作的结果。AdminClient使用Java Object对象的wait和notify实现的通知机制。
后端I/O线程名字的前缀是kafka-admin-client-thread。如果AdminClient程序貌似在正常工作,但执行的操作没有返回结果或者hang住,可能是因为I/O线程出现问题导致的。

4、构造和销毁AdminClient实例

如果正确地引入kafka-clients依赖,那么应该可以在编写Java程序时看到AdminClient对象,完整类路径是org.apache.kafka.clients.admin.AdminClient。创建AdminClient实例需要手动构造一个Properties对象或Map对象,然后传给对应的方法。最常见而且必须要指定的参数是bootstrap.servers参数。

Properties props = new Properties();
props.put(AdminClientConfig.BOOTSTRAP_SERVERS_CONFIG, "kafka-host:port");
props.put("request.timeout.ms", 600000);
AdminClient client = AdminClient.create(props);

AdminClient实例销毁需要显式调用close方法。

5、AdminClient实例

(1)创建Topic

String newTopicName = "test-topic";
try (AdminClient client = AdminClient.create(props)) {
         NewTopic newTopic = new NewTopic(newTopicName, 10, (short) 3);
         CreateTopicsResult result = client.createTopics(Arrays.asList(newTopic));
         result.all().get(10, TimeUnit.SECONDS);
}

(2)消费者组位移查询

String groupID = "test-group";
try (AdminClient client = AdminClient.create(props)) {
         ListConsumerGroupOffsetsResult result = client.listConsumerGroupOffsets(groupID);
         Map offsets = 
                  result.partitionsToOffsetAndMetadata().get(10, TimeUnit.SECONDS);
         System.out.println(offsets);
}

(3)Broker磁盘占用查询

try (AdminClient client = AdminClient.create(props)) {
     DescribeLogDirsResult ret = client.describeLogDirs(Collections.singletonList(targetBrokerId)); // 指定Broker id
     long size = 0L;
     for (Map logDirInfoMap : ret.all().get().values()) {
              size += logDirInfoMap.values().stream().map(logDirInfo -> logDirInfo.replicaInfos).flatMap(
                       topicPartitionReplicaInfoMap ->
                       topicPartitionReplicaInfoMap.values().stream().map(replicaInfo -> replicaInfo.size))
                       .mapToLong(Long::longValue).sum();
     }
     System.out.println(size);
}

AdminClient的describeLogDirs方法获取指定Broker上所有分区主题的日志路径信息。

六、Kafka认证机制

1、Kafka认证机制简介

Kafka 0.9.0.0版本开始,Kafka正式引入认证机制,实现基础的安全用户认证,用于将Kafka上云或进行多租户管理。Kafka 2.3版本支持基于SSL和基于SASL的安全认证机制。
SSL认证主要是指Broker和客户端的双路认证(2-way authentication)。通常,SSL加密(Encryption)已经启用了单向认证,即客户端认证Broker的证书(Certificate)。如果要做SSL认证,需要启用双路认证,即Broker也要认证客户端的证书。SSL通常用于通信加密,使用SASL来做Kafka认证实现。
Kafka支持通过SASL做客户端认证,SASL是提供认证和数据安全服务的框架。Kafka支持的SASL机制有5种,在不同版本中被引入,因此需要根据Kafka版本选择其所支持的认证机制。
(1)GSSAPI:基于Kerberos认证机制使用的安全接口,在0.9版本中被引入,用于已经实现Kerberos认证机制的场景。
(2)PLAIN:基于简单的用户名/密码认证的机制,在0.10版本中被引入,与SSL加密搭配使用。PLAIN是一种认证机制,而PLAINTEXT是未使用SSL时的明文传输。PLAIN认证机制的配置和运维成本相对较小,适合于小型公司Kafka集群。但PLAIN认证机制不能动态地增减认证用户,必须重启Kafka集群才能令变更生效。由于所有认证用户信息全部保存在静态文件中,所以只能重启Broker,才能重新加载变更后的静态文件。
(3)SCRAM:主要用于解决PLAIN机制安全问题的新机制,在0.10.2版本中被引入。通过将认证用户信息保存在ZooKeeper的方式,避免了动态修改需要重启Broker的弊端。可以使用Kafka提供的命令动态地创建和删除用户,无需重启整个集群。
(4)OAUTHBEARER:基于OAuth 2认证框架的新机制,在2.0版本中被引进。OAuth是一个开发标准,允许用户授权第三方应用访问用户在某网站上的资源,而无需将用户名和密码提供给第三方应用。Kafka不提倡单纯使用OAUTHBEARER,因为其生成的JSON Web Token不安全,必须配以SSL加密才能用在生产环境中。
(5)Delegation Token:用于补充SASL认证机制的轻量级认证机制,在1.1.0版本被引入。如果要使用Delegation Token,需要先配置好SASL 认证,然后再利用Kafka提供的API获取对应的Delegation Token。Broker和客户端在做认证时可以直接使用token,不用每次都去KDC 获取对应的ticket(Kerberos 认证)或传输Keystore文件(SSL认证)。

2、Kafka认证机制比较

Kafka快速入门(五)——Kafka管理_第5张图片

3、SASL/SCRAM-SHA-256 配置实例

(1)创建用户
配置SASL/SCRAM首先需要创建能否连接Kafka集群的用户。创建3个用户,分别是admin用户、producer用户和consumer用户。admin用户用于实现Broker间通信,producer用于生产消息,consumer用于消费消息。
创建admin:
kafka-configs.sh --zookeeper zookeeper-test:2181 --alter --add-config 'SCRAM-SHA-256=[password=123456],SCRAM-SHA-512=[password=123456]' --entity-type users --entity-name admin
创建producer:
kafka-configs.sh --zookeeper zookeeper-test:2181 --alter --add-config 'SCRAM-SHA-256=[password=123456],SCRAM-SHA-512=[password=123456]' --entity-type users --entity-name producer
创建consumer:
kafka-configs.sh --zookeeper zookeeper-test:2181 --alter --add-config 'SCRAM-SHA-256=[password=123456],SCRAM-SHA-512=[password=123456]' --entity-type users --entity-name consumer
用户查看:
kafka-configs.sh --zookeeper zookeeper-test:2181 --describe --entity-type users --entity-name consumer
(2)创建JAAS文件
配置用户后,需要为每个Broker创建一个对应的JAAS文件。

KafkaServer {
org.apache.kafka.common.security.scram.ScramLoginModule required
username="admin"
password="123456";
};

配置Broker的server.properties文件:

sasl.enabled.mechanisms=SCRAM-SHA-256
sasl.mechanism.inter.broker.protocol=SCRAM-SHA-256
security.inter.broker.protocol=SASL_PLAINTEXT
listeners=SASL_PLAINTEXT://localhost:9092

(3)启动Broker
KAFKA_OPTS=-Djava.security.auth.login.config=/opt/kafka/config/kafka-broker.jaas kafka-server-start.sh config/server.properties
(4)生产消息
创建Topic
kafka-topics.sh --bootstrap-server kafka-test:9092 --create --topic test --partitions 1 --replication-factor 1
创建Producer客户端配置:

security.protocol=SASL_PLAINTEXT
sasl.mechanism=SCRAM-SHA-256
sasl.jaas.config=org.apache.kafka.common.security.scram.ScramLoginModule required username="producer" password="123456";

生产消息:
kafka-console-producer.sh --broker-list kafka-test:9092 --topic test --producer.config producer.conf
(5)消费消息
创建Consumer客户端配置consumer.conf:

security.protocol=SASL_PLAINTEXT
sasl.mechanism=SCRAM-SHA-256
sasl.jaas.config=org.apache.kafka.common.security.scram.ScramLoginModule required username="consumer" password="123456";

(6)动态增减用户
删除用户:
kafka-configs.sh --zookeeper zookeeper-test:2181 --alter --delete-config 'SCRAM-SHA-512' --entity-type users --entity-name producer
创建用户:
kafka-configs.sh --zookeeper zookeeper:2181 --alter --add-config 'SCRAM-SHA-256=[iterations=8192,password=123456]' --entity-type users --entity-name test
修改Producer客户端配置:

security.protocol=SASL_PLAINTEXT
sasl.mechanism=SCRAM-SHA-256
sasl.jaas.config=org.apache.kafka.common.security.scram.ScramLoginModule required username="test" password="123456";

创建每一个客户端,Producer或Consumer都需要指定相应的配置文件。

七、Kafka授权机制

1、Kafka授权机制简介

Kafka 授权机制(Authorization)采用ACL(Access-Control List,访问控制列表)权限模型。Kafka提供了一个可插拔的授权实现机制,会将配置的所有ACL项保存在ZooKeeper下的/kafka-acl节点中。可以通过Kafka自带的kafka-acls.sh脚本动态地对ACL项进行增删改查,并让其立即生效。

2、ACL开启

Kafka开启ACL的方法只需要在Broker端的配置文件中增加一行设置即可,即在server.properties文件中配置authorizer.class.name参数。
authorizer.class.name=kafka.security.auth.SimpleAclAuthorizer
authorizer.class.name参数指定了ACL授权机制的实现类。Kafka提供了Authorizer接口,允许开发者实现自己的授权机制,但通常是直接使用Kafka自带的SimpleAclAuthorizer实现类。设置authorizer.class.name参数,并且启动Broker后,Broker默认会开启ACL授权验证。

3、超级用户设置

开启ACL授权后,必须显式地为不同用户设置访问某项资源的权限,否则,在默认情况下,没有配置任何ACL的资源是不能被访问的。但超级用户能够访问所有的资源,即使没有为超级用户设置任何ACL项。超级用户的设置只需要在Broker端的配置文件server.properties中设置super.users参数。
super.users=User:superuser1;User:superuser2
如果需要一次性指定多个超级用户,使用分号作为分隔符。
Kafka支持将所有用户都配置成超级用户的用法。如果在server.properties文件中设置allow.everyone.if.no.acl.found=true,那么所有用户都可以访问没有设置任何ACL的资源。但在生产环境中,特别是对安全有较高要求的环境中,采用白名单机制要比黑名单机制更安全。

4、ACL授权配置

在Kafka中,配置授权的方法是通过kafka-acls.sh脚本。
kafka-acls.sh --authorizer-properties zookeeper.connect=zookeeper-test:2181 --add --allow-principal User:test --operation All --topic '*' --cluster
All表示所有操作,topic中的星号则表示所有主题,指定--cluster则说明要为用户test设置的是集群权限。
kafka-acls.sh --authorizer-properties zookeeper.connect=zookeeper-test:2181 --add --allow-principal User:'*' --allow-host '*' --deny-principal User:BadUser --deny-host 192.168.1.120 --operation Read --topic test
User的星号表示所有用户,allow-host的星号则表示所有IP地址。允许所有的用户使用任意的IP地址读取名为test的TOPIC数据,禁止BadUser用户和192.168.1.120的IP地址访问test下的消息。

5、Kafka ACL权限列表

Kafka提供了细粒度的授权机制,kafka-acls.sh直接指定--producer能同时获得Producer所需权限,指定--consumer可以获得 Consumer所需权限。Kafka授权机制可以不配置认证机制而单独使用,如只为IP地址设置权限。
kafka-acls.sh --authorizer-properties zookeeper.connect=zookeeper-test:2181 --add --deny-principal User:* --deny-host 192.168.1.120 --operation Write --topic test
禁止Producer在192.168.1.120 IP上向test发送数据。

6、云环境多租户权限设置

如果Kafka集群部署在云上,对于多租户需要设置合理的认证机制,并为每个连接Kafka集群的客户端授予合适权限。
(1)开启ACL
authorizer.class.name=kafka.security.auth.SimpleAclAuthorizer
(2)开启白名单机制
在Kafka的server.properties文件中,不要设置allow.everyone.if.no.acl.found=true。
(3)为SSL用户授权
使用kafka-acls.sh为SSL用户授予集群的权限。我们以前面的例子来进行一下说明。在配置 SSL 时,指定用户的 Distinguished Name 为“CN=Xi Hu, OU=YourDept, O=YourCompany, L=Beijing, ST=Beijing, C=CN”。在设置 Broker 端参数时,指定 security.inter.broker.protocol=SSL,即强制指定 Broker 间的通讯也采用 SSL 加密。
kafka-acls.sh --authorizer-properties zookeeper.connect=zookeeper-test:2181 --add --allow-principal User:"CN=Xi Hu,OU=YourDept,O=YourCompany,L=Beijing,ST=Beijing,C=CN" --operation All --cluster
(4)为客户端授权
为生产者授予producer权限:
kafka-acls.sh --authorizer-properties zookeeper.connect==zookeeper-test:2181 --add --allow-principal User:"CN=Xi Hu,OU=YourDept,O=YourCompany,L=Beijing,ST=Beijing,C=CN" --producer --topic 'test'
为消费者授予consumer权限:
kafka-acls.sh --authorizer-properties zookeeper.connect=zookeeper-test:2181 --add --allow-principal User:"CN=Xi Hu,OU=YourDept,O=YourCompany,L=Beijing,ST=Beijing,C=CN" --consumer --topic 'test' --group '*'

八、MirrorMaker

1、MirrorMaker简介

通常,大多数业务需求使用一个Kafka集群即可满足,但有些场景确实会需要多个Kafka集群同时工作,比如为了便于实现灾难恢复,可以在两个机房分别部署单独的Kafka集群。如果其中一个机房出现故障,可以很容易地把流量切换到另一个正常运转的机房。如果要为地理相近的客户提供低延时的消息服务,而主机房离客户很远时,可以在靠近客户的机房部署一套Kafka集群,服务于客户,从而提供低延时的服务。
为了在多个Kafka集群间实现数据同步,Kafka提供了跨集群数据镜像工具MirrorMaker。通常,数据在单个集群下不同节点之间的拷贝称为备份,而数据在集群间的拷贝称为镜像(Mirroring)。
MirrorMaker本质是一个消费者+生产者的程序。消费者负责从源集群(Source Cluster)消费数据,生产者负责向目标集群(Target Cluster)发送消息。整个镜像流程如下:
Kafka快速入门(五)——Kafka管理_第6张图片
MirrorMaker连接的源集群和目标集群,会实时同步消息。实际场景中,用户会部署多套Kafka集群,用于实现不同的目的。
Kafka快速入门(五)——Kafka管理_第7张图片
源集群负责主要的业务处理,目标集群1可以用于执行数据分析,目标集群2则充当源集群的热备份。

2、MirrorMaker脚本工具

Kafka默认提供MirrorMaker命令行工具kafka-mirror-maker脚本,其常见用法是指定生产者配置文件、消费者配置文件、线程数以及要执行数据镜像的TOPIC正则表达式。
kafka-mirror-maker.sh --consumer.config config/consumer.properties --producer.config config/producer.properties --num.streams 8 --whitelist ".*"
--consumer.config:指定MirrorMaker中消费者的配置文件地址,最主要的配置项是bootstrap.servers,即MirrorMaker从哪个Kafka集群读取消息。由于MirrorMaker有可能在内部创建多个消费者实例并使用消费者组机制,因此还需要设置group.id参数。另外,需要配置auto.offset.reset=earliest,否则MirrorMaker只会拷贝在其启动后到达源集群的消息。
--producer.config:指定MirrorMaker内部生产者组件的配置文件地址。必须显式地指定参数bootstrap.servers,配置拷贝的消息要发送到的目标集群。
--num.streams:MirrorMaker要创建多少个KafkaConsumer实例,会在后台创建并启动多个线程,每个线程维护专属的消费者实例。
--whitelist:接收一个正则表达式。所有匹配该正则表达式的TOPIC都会被自动地执行镜像。“.*”表示要同步源集群上的所有TOPIC。

3、跨集群数据镜像实例

(1)配置生产者和消费者
生产者配置文件producer.config:

producer.properties:
bootstrap.servers=kafka-test1:9092

消费者配置文件consumer.config:

consumer.properties:
bootstrap.servers=kafka-test2:9092
group.id=mirrormaker
auto.offset.reset=earliest

(2)MirrorMaker工具启动
kafka-mirror-maker.sh --producer.config producer.config --consumer.config consumer.config --num.streams 4 --whitelist ".*"
如果MirrorMaker内部消费者会使用轮询策略(Round-robin)来为消费者实例分配分区,需要consumer.properties文件中增加配置:
partition.assignment.strategy=org.apache.kafka.clients.consumer.RoundRobinAssignor
(3)结果验证
kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list kafka-test:9092 --topic test --time -2
-1和-2分别表示获取某分区最新的位移和最早的位移,两个位移值的差值就是分区当前的消息数。
MirrorMaker在执行消息镜像的过程中,如果发现要同步的Topic在目标集群上不存在,会根据目标集群的Kafka Broker端参数num.partitions和default.replication.factor默认值,自动将Topic创建出来。在生产环境中,推荐提前把要同步的所有主题按照源集群上的规格在目标集群上地创建出来,避免在源集群某个分区的消息同步到目标集群后位于其它分区中。MirrorMaker默认会同步内置Topic,在镜像位移主题时,如果发现目标集群尚未创建位移主题,会根据Broker端参数offsets.topic.num.partitions和offsets.topic.replication.factor来创建位移Topic,默认配置是50个分区,每个分区3个副本。在Kafka 0.11.0.0版本前,Kafka不会严格依照offsets.topic.replication.factor参数值,即如果设置offsets.topic.replication.factor参数值为3,而当前存活的Broker数量少于3,位移主题依然能被成功创建,副本数会取offsets.topic.replication.factor参数值和存活Broker数之间的较小值。从Kafka 0.11.0.0版本开始,Kafka会严格遵守设定offsets.topic.replication.factor参数值,如果发现存活Broker数量小于参数值,就会直接抛出异常,通知主题创建失败。

4、其它跨集群数据镜像工具

(1)uReplicator
Uber公司在使用MirrorMaker过程中发现了一些缺陷,比如MirrorMaker中的消费者使用的是消费者组机制,会不可避免地会碰到很多Rebalance问题。因此,Uber研发了uReplicator,使用Apache Helix作为集中式的TOPIC分区管理组件来管理分区的分配,并且重写消费者程序,替代MirrorMaker下的消费者,从而避免Rebalance各种问题。
(2)Brooklin Mirror Maker
针对MirrorMaker工具不易实现管道化的缺陷,LinkedIn进行针对性的改进并对性能进行优化研发了Brooklin Mirror Maker。
(3)Confluent Replicator
Replicator是Confluent提供的企业级的跨集群镜像方案,可以便捷地提供Kafka TOPIC在不同集群间的迁移,同时还能自动在目标集群上创建与源集群上配置一模一样的TOPIC,极大地方便运维管理。