【大数据面试】Kafka面试题与答案

  1. 介绍下Kafka,Kafka的作用?Kafka的组件?适用场景?

  2. Kafka作为消息队列,它可解决什么样的问题?

  3. 说下Kafka架构

  4. 说下Kafka的特点,优缺点

  5. Kafka相比于其它消息组件有什么好处?

  6. Kafka生产者与消费者

  7. Kafka分区容错性

  8. Kafka的消费端的数据一致性

  9. Kafka的leader挂掉之后处理方法

  10. 说下Kafka的ISR机制

  11. Kafka的选举机制

  12. Kafka的ISR、OSR和ACK介绍,ACK分别有几种值?

  13. Kafka的工作原理?

  14. Kafka怎么保证数据不丢失,不重复?

  15. Kafka分区策略

  16. Kafka如何尽可能保证数据可靠性?

  17. Kafka数据丢失怎么处理?

  18. Kafka如何保证全局有序?

  19. 牛产者消费者模式与发布订阅模式有何异同?

  20. Kafka的消费者组是如何消费数据的

  21. Kafka的offset管理

  22. Kafka为什么同一个消费者组的消费者不能消费相同的分区?

  23. 如果有一条offset对应的数据,消费完成之后,手动提交失败,如何处理?

  24. 正在消费一条数据,Kafka挂了,重启以后,消费的offset是哪一个

  25. Kafka支持什么语义,怎么实现ExactlyOnce?

  26. Kafka的消费者和消费者组有什么区别?为什么需要消费者组?

  27. Kafka producer的写入数据过程?

  28. Kafka producer的ack设署

  29. Kafka的ack机制,解决了什么问题?

  30. Kafka读取消息是推还是拉的模式?有什么好?

  31. Kafka如何实现高吞吐的原理?

  32. 说下Kafka中的Partition?

  33. Kafka是如何进行数据备份的?

  34. Kafka里面存的数据格式是什么样的?

  35. Kafka是如何清理过期文件的?

  36. Kafka的一条message中包含了哪些信息?

  37. Kafka如何保证数据的ExactlyOnce?

  38. Kafka消费者怎么保证ExactlyOnce

  39. Kafka监控实现?

  40. Kafka中的数据能彻底删除吗?

  41. Kafka复制机制?

  42. Kafka分区多副本机制?

  43. Kafka分区分配算法

  44. Kafka蓄水池机制

  45. Kafka如何实现享等性?

  46. Kafka的offset存在哪?

  47. Kafka中如何保证数据一致性?

  48. Kafka新旧API区别

  49. Kafka消息在磁盘上的组织方式

  50. Kafka在哪些地方会有选举过程,使用什么工具支持选举?

  51. Kafka搭建过程要配置什么参数?

  52. Kafka的单播和多播

  53. Kafka的高水位和Leader Epoch

  54. Kafka的分区器、拦截器、序列化器?

  55. Kafka连接Spark Streaming的几种方式

  56. Kafka的生成者客户端有几个线程?

  57. Kafka怎么防止脑裂

  58. Kafka高可用体现在哪里

  59. Zookeeper在Kafka的作用

你可能感兴趣的:(大数据,面试,大数据,面试,kafka)