kafka 笔记

  • kafka是一个分布式的消息缓存系统
  • kafka集群中的服务器都叫做broker
  • kafka有两类客户端,一类叫producer(消息生产者),一类叫做consumer(消息消费者),客户端和broker服务器之间采用tcp协议连接
  • kafka中不同业务系统的消息可以通过topic进行区分,而且每一个消息topic都会被分区,以分担消息读写的负载
  • 每一个分区都可以有多个副本,以防止数据的丢失
  • 某一个分区中的数据如果需要更新,都必须通过该分区所有副本中的leader来更新
  • 消费者可以分组,比如有两个消费者组A和B,共同消费一个topic:order_info,A和B所消费的消息不会重复。
    比如 order_info 中有100个消息,每个消息有一个id,编号从0-99,那么,如果A组消费0-49号,B组就消费50-99号
  • 消费者在具体消费某个topic中的消息时,可以指定起始偏移量

你可能感兴趣的:(Hadoop)