开源的消息引擎系统——kafka

Kafka是一款开源的消息引擎系统

开源的消息引擎系统——kafka_第1张图片

1.消息队列(MQ)

1.1什么是消息队列

消息队列不知道大家看到这个词的时候,会不会觉得它是一个比较高端的技术。消息队列,一般我们会简称它为MQ(Message Queue).消息队列是一种帮助开发人员解决系统间异步通信的中间件,常用于解决系统解耦和请求的削峰平谷的问题。

队列(Queue):
Queue 是一种先进先出的数据结构,容器

开源的消息引擎系统——kafka_第2张图片

消息(Message):

不同应用之间传送的数据。

消息队列:

我们可以把消息队列比作是一个存放消息的容器,当我们需要使用消息的时候可以取出消息供自己使用。消息队列是分布式系统中重要的组件,使用消息队列主要是为了通过异步处理提高系统性能和削峰、降低系统耦合性。队列 Queue 是一种先进先出的数据结构,所以消费消息时也是按照顺序来消费的。比如生产者发送消息1,2,3…对于消费者就会按照1,2,3…的顺序来消费。

开源的消息引擎系统——kafka_第3张图片

传统方式:

开源的消息引擎系统——kafka_第4张图片

MQ方式:

开源的消息引擎系统——kafka_第5张图片

开源的消息引擎系统——kafka_第6张图片

1.2 消息队列的应用场景

消息队列在实际应用中包括如下四个场景:

  1. 应用耦合:多应用间通过消息队列对同一消息进行处理,避免调用接口失败导致整个过程失败;

  2. 异步处理:多应用对消息队列中同一消息进行处理,应用间并发处理消息,相比串行处理,减少处理时间;

  3. 限流削峰:广泛应用于秒杀或抢购活动中,避免流量过大导致应用系统挂掉的情况;

  4. 消息驱动的系统:系统分为消息队列、消息生产者、消息消费者,生产者负责产生消息,消费者(可能有多个)负责对消息进行处理

下面详细介绍上述四个场景以及消息队列如何在上述四个场景中使用

1.2.1 异步处理

具体场景:

用户为了使用某个应用,进行注册,系统需要发送注册邮件并验证短信。

对这两个子系统操作的处理方式有两种:串行及并行。

涉及到三个子系统:注册系统、邮件系统、短信系统

1)串行方式:新注册信息生成后,先发送注册邮件,再发送验证短信;

image-20220930154154693

在这种方式下,需要最终发送验证短信后再返回给客户端。

  1. 并行处理:新注册信息写入后,由发短信和发邮件并行处理

开源的消息引擎系统——kafka_第7张图片

在这种方式下,发短信和发邮件 需处理完成后再返回给客户端。

假设以上三个子系统处理的时间均为50ms,且不考虑网络延迟,则总的处理时间:

串行:50+50+50=150ms

并行:50+50 = 100ms

如果引入消息队列, 在来看整体的执行效率:

开源的消息引擎系统——kafka_第8张图片

在写入消息队列后立即返回成功给客户端,则总的响应时间依赖于写入消息队列的时间,而写入消息队列的时间本身是可以很快的,基本可以忽略不计,因此总的处理时间为50ms,相比串行提高了2倍,相比并行提高了一倍;

1.2.2 应用耦合

具体场景:

用户使用QQ相册上传一张图片,人脸识别系统会对该图片进行人脸识别。
一般的做法是,服务器接收到图片后,图片上传系统立即调用人脸识别系统,调用完成后再返回成功,如下图所示:

调用方式:webService、Http协议(HttpClient、RestTemplate)、Tcp协议(Dubbo)

image-20220930154301159

该方法有如下缺点:

  1. 人脸识别系统被调失败,导致图片上传失败;

  2. 延迟高,需要人脸识别系统处理完成后,再返回给客户端,即使用户并不需要立即知道结果;

  3. 图片上传系统与人脸识别系统之间互相调用,需要做耦合;

若使用消息队列:

image-20220930154346124

客户端上传图片后,图片上传系统将图片信息批次写入消息队列,直接返回成功;人脸识别系统则定时从消息队列中取数据,完成对新增图片的识别。

图片上传系统并不需要关心人脸识别系统是否对这些图片信息的处理、以及何时对这些图片信息进行处理。

事实上,由于用户并不需要立即知道人脸识别结果,人脸识别系统可以选择不同的调度策略,按照闲时、忙时、正常时间,对队列中的图片信息进行处理。

1.2.3 限流削峰

具体场景:

购物网站开展秒杀活动,一般由于瞬时访问量过大,服务器接收过大,会导致流量暴增,相关系统无法处理请求甚至崩溃。

而加入消息队列后,系统可以从消息队列中取数据,相当于消息队列做了一次缓冲。

image-20220930154409477

该方法有如下优点:

请求先入消息队列,而不是由业务处理系统直接处理,做了一次缓冲,极大地减少了业务处理系统的压力;

队列长度可以做限制,事实上,秒杀时,后入队列的用户无法秒杀到商品,这些请求可以直接被抛弃,返回

动已结束或商品已售完信息;

1.2.4 消息事件驱动的系统

具体场景:
用户新上传了一批照片 ---->人脸识别系统需要对这个用户的所有照片进行聚类 -------> 由对账系统重新生成用户的人脸索引(加快查询)。
这三个子系统间由消息队列连接起来,前一个阶段的处理结果放入队列中,后一个阶段从队列中获取消息继续处理。

image-20220930154435873

该方法有如下优点:

避免了直接调用下一个系统导致当前系统失败;

每个子系统对于消息的处理方式可以更为灵活,可以选择收到消息时就处理,可以选择定时处理,也可以划分时间段按不同处理速度处理;

你可能感兴趣的:(java随笔,kafka,开源,java)