Kafka

kafka如何防止消息丢失?
ack=all且分区ISR数量大于等于2可以保证百分百不会丢失

kafka怎么防止消息重复消费(幂等性)?
全局消息唯一ID
生产者拦截器生成唯一ID作为消息key
消费者执行业务操作数据库和提交offset偏移量这两个操作无法百分百保证事务的原子性(kafka宕机或者数据库宕机)
可以放弃偏移量,用数据库事务的方式百分百保证不会重复消费
消费者连接的数据库建一张本地消息表,消息ID字段唯一索引
消费消息执行业务操作完数据库后往本地消息表中插入消息ID,如果消息重复了就会报唯一冲突就会事务回滚

kafka消息积压怎么优化?
1.增加消费者数量
2.增加分区数量,提高并行消费能力
3.调整消费者的消费能力和参数设置,增加每次拉取的消息数量(fetch size),调整消费者的批量处理配置(batch size)
4.水平扩展 Kafka 集群
5.优化生产者和消费者的性能,异步发送批量发送
6.监控和调整配置: 及时监控 Kafka 集群的状态和指标,例如消息积压量、消费者位移的情况等

kafka高水位机制?

reblance机制?
1.RoundRobinAssignor(轮询分配器):这是一种基本的分配策略,按照消费者实例的顺序依次分配分区,确保每个消费者实例获得近乎相等数量的分区。
2.RangeAssignor(范围分配器):这种策略将分区划分为若干范围,并将每个消费者实例分配一到多个连续范围内的分区。适用于需要将相邻分区分配给同一个消费者的场景。
3.StickyAssignor(粘性分配器):这种策略在一定程度上保持了消费者实例与分区之间的粘性关系,使得消费者在重平衡时尽量保持分区的分配稳定性。
4.CooperativeStickyAssignor(协作粘性分配器):这是一种改进版的粘性分配器,它在粘性的基础上增加了协作机制,通过消费者之间的协调来更好地处理重平衡,降低重平衡带来的消费者停滞时间。

kafka的ack应答级别?
0:生产者发送过来的数据,不需要等数据落盘应答
1:生产者发送过来的数据,Leader收到数据后应答
all:生产者发送过来的数据,Leader和ISR队列里面所有接待你收齐数据后应答。

kafka分区策略?
1.指定分区
2.没指定分区但有key,则将key的hash值取余则为分区号
3.没指定分区也没key,采用粘性分区,随机采用一个分区并一直使用这个分区直到batch满了再选用别的分区

kafka的生产者批量发送参数?
batch.size 批次大小
linger.ms 等待时间
compress.type 压缩类型
RecordAccumulator 缓冲区大小

kafka的消息是顺序的吗?
单个分区中的消息在特定条件下是的
未开启幂等性时max.in.flight.requests.per.connection=1
开启幂等性时max.in.flight.requests.per.connection小于或等于5,会在kafka内存中重新排序
多个分区中的消息无法保证全局的顺序性

你可能感兴趣的:(java,kafka)