消息队列,简称MQ(Message Queue)
首先,队列是一种先进先出的数据结构。
在Java里边,已经实现了不少的队列了。
消息队列可以简单理解为:把要传输的数据放在队列中。
消息队列中有两个非常重要的名词:生产者、消费者
生产者:把数据放到消息队列
消费者:从消息队列里取数据
市面上的消息队列产品有很多,比如老牌的 ActiveMQ、RabbitMQ ,目前比较火的有Kafka ,和阿里巴巴捐赠给 Apache 的 RocketMQ ,连 redis 这样的 NoSQL 数据库也支持 MQ 功能。总之这块知名的产品就有十几种。
那么,用消息队列有什么好处呢?
以常见的订单系统为例:
用户点击【下单】按钮之后的业务逻辑可能包括:扣减库存、生成相应单据、发货、发短信通知等。
在业务发展初期这些逻辑可能放在一起同步执行,随着业务的发展订单量增长,需要提升系统服务的性能。
这时可以将一些不需要立即生效的操作拆分出来异步执行,比如发货、发短信通知等。
这种场景下就可以用 MQ ,在下单的主流程(比如扣减库存、生成相应单据)完成之后发送一条消息到 MQ 让主流程快速完结,而由另外的单独线程拉取MQ的消息(或者由 MQ 推送消息),当发现 MQ 中有发货或发短信之类的消息时,执行相应的业务逻辑。
简单的说就是原来 A服务 需要调用 B服务 的接口或者方法来进行数据的传递,这个时候使用消息队列的话,A服务 只需将数据发送到消息队列中,B服务 从消息队列中取出相应的数据即可,这样就实现了解耦。
异步其实就是 A服务 将数据发送到消息队列之后就可以进行返回或者执行其他过程,不需要等待 B服务 处理数据,从而来提高一些使用异步业务场景的效率问题。
我们再来想一个场景,比如现在我们每个月要做一次大促,大促期间的并发可能会很高,比如每秒5000个请求。假设我们现在有两台机器处理请求,并且每台机器只能每次处理2000个请求。
那多出来的1000个请求,可能就把我们整个系统搞崩了,所以,有一种办法,我们可以写到消息队列中:
服务器A和服务器B根据自己的能够处理的请求数去消息队列中拿数据,这样即便有每秒有1w个请求,那只是把请求放在消息队列中,去拿消息队列的消息由系统自己去控制,这样就不会把整个系统搞崩了。
可是 “明明JDK已经有不少的队列实现了,我们还需要消息队列中间件呢?”
其实很简单,JDK实现的队列种类虽然有很多种,但都是简单的内存队列。为什么说JDK是简单的内存队列呢?
下面我们来看看要实现消息队列可能要考虑什么问题。
无论是我们使用消息队列来做解耦、异步还是削峰,消息队列肯定不能是单机的。试着想一下,如果是单机的消息队列,万一这台机器挂了,那我们整个系统几乎就是不可用了,就出现了单点故障。
所以,当我们项目中使用消息队列,都是得集群/分布式的。要做集群/分布式就必然希望该消息队列能够提供现成的支持,而不是自己写代码手动去实现。
我们将数据写到消息队列上,服务器A和服务器B还没来得及消费消息队列的数据,就挂掉了。如果没有做任何的措施,我们的数据就丢了。
学过Redis的都知道,Redis可以将数据持久化磁盘上,万一Redis挂了,还能从磁盘将数据恢复过来。同样地,消息队列中的数据也需要存在别的地方,这样才尽可能减少数据的丢失。
那存在哪呢?
磁盘?数据库?同步存储还是异步存储?
不同的MQ针对消息丢失的处理和解决方案都有所不同,但是肯定都是从生产者和消费者两端进行分析的。
生产者端丢失消息
生产者要确保消息发送到了MQ,就会有回调确认机制的处理和事务的方式。
消息队列丢失消息
在消息队列中假如因为MQ挂了导致消息丢了,那么就可以将消息持久化,或者使用生产者端重发消息的方式解决。
消费者端丢消息
一般消费者丢了消息的原因就是从MQ中取到了消息,但是可能消费失败了需要重新消费,但是MQ中已经没有该条消息了,这样的话可以通过消费者端手动确认的机制,或者让生产者端重发消息的方式解决。
消费者怎么从消息队列里边得到数据?一般有两种办法:
1、生产者将数据放到消息队列中,消息队列有数据了,主动叫消费者去拿(俗称push)
2、消费者不断去轮训消息队列,看看有没有新的数据,如果有就消费(俗称pull)
除了这些,我们在使用的时候还得考虑各种的问题:
消息重复消费了怎么办?想保证消息是绝对有顺序的怎么做?………
虽然消息队列给我们带来了那么多的好处,但同时我们发现引入消息队列也会提高系统的复杂性。市面上现在已经有不少消息队列了,每种消息队列都有自己的特点,选哪种MQ还得好好考虑。
这次来讲下我用过的RabbitMQ吧:
RabbitMQ 是一个由 Erlang 语言开发的 AMQP 的开源实现。
AMQP : Advanced Message Queue,高级消息队列协议。它是应用层协议的一个开放标准,为面向消息的中间件设计,基于此协议的客户端与消息中间件可传递消息,并不受产品、开发语言等条件的限制。
RabbitMQ 最初起源于金融系统,用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。具体特点包括:
消息模型
所有 MQ 产品从模型抽象上来说都是一样的过程:消费者(consumer)订阅某个队列。生产者(producer)创建消息,然后发布到队列(queue)中,最后将消息发送到监听的消费者。
上面只是最简单抽象的描述,具体到 RabbitMQ 则有更详细的概念需要解释。上面介绍过 RabbitMQ 是 AMQP 协议的一个开源实现,所以其内部实际上也是 AMQP 中的基本概念:
*本文主要讲解了什么是消息队列,消息队列可以为我们带来什么好处,以及一个消息队列可能会涉及到哪些问题。希望给大家带来一定的帮助! *