Kafka-概述,消息队列,基础架构

Kafka-概述,消息队列,基础架构

文章目录

  • Kafka-概述,消息队列,基础架构
    • 概述
    • 消息队列
    • Kafka基础架构

概述

Kafka是一个分布式的基于发布 / 订阅模式消息队列(Message Queue),主要应用于大数据实时处理领域。

消息队列

传统消息队列的应用场景
Kafka-概述,消息队列,基础架构_第1张图片
使用消息队列的好处

1)解耦

允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束。

2)可恢复性

系统的一部分组件失效时,不会影响到整个系统。消息队列降低了进程间的耦合度,所以即使一个处理消息的进程挂掉,加入队列中的消息仍然可以在系统恢复后被处理。

3)缓冲

有助于控制和优化数据流经过系统的速度,解决生产消息和消费消息的处理速度不一致的情况。

4)灵活性 & 峰值处理能力(削峰)

在访问量剧增的情况下,应用仍然需要继续发挥作用,但是这样的突发流量并不常见。如果为以能处理这类峰值访问为标准来投入资源随时待命无疑是巨大的浪费。使用消息队列能够使关键组件顶住突发的访问压力,而不会因为突发的超负荷的请求而完全崩溃。

5)异步通信

很多时候,用户不想也不需要立即处理消息。消息队列提供了异步处理机制,允许用户把一个消息放入队列,但并不立即处理它。想向队列中放入多少消息就放多少,然后在需要的时候再去处理它们。

消息队列的两种模式

(1)点对点模式一对一,消费者主动拉取数据,消息收到后消息清除

这个模型的特点是,发送到 Queue 的消息,只能被一个消费者进行处理。生产者将消息放入消息Queue 后,由消费者主动的去拉取消息进行消费。

消息被消费以后,Queue 中不再有存储,所以消费者不可能消费到已经被消费的消息。Queue 支持存在多个消费者,但是对一个消息而言,只会有一个消费者可以消费。
Kafka-概述,消息队列,基础架构_第2张图片
(2)发布/订阅模式一对多,消费者消费数据之后不会清除消息

消息生产者(发布)将消息发布到 topic 中,同时有多个消息消费者(订阅)消费该消息。和点对点方式不同,发布到 topic 的消息会被所有订阅者消费。
Kafka-概述,消息队列,基础架构_第3张图片

Kafka基础架构

Kafka-概述,消息队列,基础架构_第4张图片
1)Producer : 消息生产者,就是向 kafka broker 发消息的客户端;

2)Consumer : 消息消费者,向 kafka broker 取消息的客户端;

3)Consumer Group (CG): 消费者组,由多个 consumer 组成。消费者组内,每个消费者负责消费不同分区的数据,一个分区,只能由一个组内消费者 消费;消费者组之间互不影响,当消费者组内的消费者,发生变动时,会触发分区的重平衡。所有的消费者都属于某个消费者组,即消费者组是逻辑上的一个订阅者

4)Broker : kafka 集群中的一个节点,姑且认为一台 kafka 服务器就相当于一个 broker,kafka 集群内的每个 broker 都有一个不重复的编号。一个集群由多个 broker 组成。一个 broker 可以容纳多个 topic。

5)Topic : 可以理解为一个队列,kafka 的逻辑上的队列,生产者和消费者面向的都是一个 topic

6)Partition: 一个 topic 可以包含一个或多个 partition,每个 partition 的消息数据都是单独存储的。同一个 topic 在不同分区的数据是不重复的,partition 的表现形式就是一个一个的文件夹。为了实现扩展性,一个非常大的 topic 可以分布到多个 broker(即服务器)上,每个 partition 是一个有序的队列;

7)Replica: 副本,为保证集群中的某个节点发生故障时,该节点上的partition 数据不丢失,且 kafka 仍然能够继续工作。kafka 提供了副本机制,一个 topic 的每个分区都有若干个副本,一个 leader 和若干个 follower。在 kafka 中默认副本的最大数量是10个,且副本的数量不能大于Broker的数量,follower 和l eader 是在不同的机器上,同一机器对同一个分区也只可能存放一个副本(包括本身)

8)leader: 每个分区多个副本的"主",生产者发送数据的对象,以及消费者消费数据的对象都是 leader。

9)follower: 每个分区多个副本中的"从",实时从leader中同步数据,保持和leader数据的同步。leader发生故障时,某个follower会成为新的leader。

你可能感兴趣的:(Kafka,kafka,队列,大数据)