MQ = Message Queue = 消息队列
消息队列:存放内容是消息的 FIFO(先入先出) 队列。是一种跨进程的通信机制,用于上下游传递消息。
1、流量消峰
举个例子,假如一个系统一秒最多可以处理一万次订单,这个处理能力在正常时段是绰绰有余的。但是在高峰的时候(例如双十一),一秒钟能达到两万次请求,这时候系统是处理不了这么多的,传统的方法是限制当请求超过一万之后不允许用户下单。而使用消息队列的话可以做为缓冲,把一秒内处理的订单分成一段时间来处理,当然这会影响到用户响应时间,但是比起不能下单的体验要好很多。
2、应用解耦
以电商系统为例,应用中有订单系统、库存系统、物流系统、支付系统。当用户创建一个订单时,如果耦合地调用库存、物流、支付系统,当某个系统出现故障,都会导致下单操作异常。但如果转变为基于消息队列方式后,问题就会减少很多,比如如果物流系统发送故障,需要几分钟来修复。在这段时间内,物流系统要处理地内存会被缓存在消息队列中,用户地下单操作可以正常完成。等物流系统恢复后,会继续处理订单信息,而这个过程用户感受不到物流系统出现了异常。
3、异步处理
举个例子,有两个系统 A 和 B。假如 A 调用 B,B 需要花费很长时间执行,但是 A 需要知道 B 什么时候可以执行完毕,以前一般有两种方式处理:一是 A 过一段时间去调用 B 的查询 api 。二是 A 提供一个 callback 接口,当 B 处理完时调用该接口通知 A 服务。但这两种方式都不是很优雅。使用消息队列后,可以这样做,A 调用 B 的服务后,只需要监听 B 处理完的消息,当 B 处理完后,会发送一条消息给 MQ,MQ 会将该消息发送给 A 服务。
ActiveMQ
优点:单机吞吐量万级,时效性 ms 级,可用性高,基于主从架构实现高可用性,不容易丢失数据。
缺点:官方社区维护越来越少,高吞吐量场景较少使用。
Kafka:
优点:为大数据而生,吞吐量高,多运用于大数据领域的实时计算和日志采集场景。
缺点:社区更新较慢。
RokectMQ:
优点:Java 语言实现,单机吞吐量十万级,支持 10 亿级别的消息堆积。
缺点:支持的客户端语言不多。
RabbitMQ:
优点:一个在 AMQP (高级消息队列协议)基础上完成的,主流的消息中间件之一,erlang 语言实现的高并发特性,吞吐量到万级,支持多种语言,社区活跃度高。
缺点:商业版收费。
Kafka:
适用于产生大量数据的互联网数据收集业务,建议大型公司使用,如果有日志采集功能,首选 kafka。
RocketMQ:
用于金融互联网领域。
RabbitMQ:
时效性微妙级,社区活跃度高,中小型公司优先选择。
RabbitMQ 是一个消息中间件,负责接收、存储、转发消息。类似生活中的快递站,负责接受快递,存储快递,转发快递。
生产者:负责产生数据
交换机:接收来自生产者的消息,并将消息推送到队列中。决定消息是要推送给特定队列,还是推送给多个队列,还是丢弃。
队列:存储消息。
消费者:接收消息。
1、简单模式
2、工作模式
3、发布/订阅模式
4、路由模式
5、主题模式
6、发布确认模式
Broker:接收和分发消息的应用,RabbitMQ Server 就是 Message Broker
Virtual host:出于多租户和安全因素设计的,把 AMQP 的基本组件划分到一个虚拟的分组中,类似
于网络中的 namespace 概念。当多个不同的用户使用同一个 RabbitMQ server 提供的服务时,可以划分出
多个 vhost,每个用户在自己的 vhost 创建 exchange/queue 等
Connection:publisher/consumer 和 broker 之间的 TCP 连接
Channel:如果每一次访问 RabbitMQ 都建立一个 Connection,在消息量大的时候建立 TCP
Connection 的开销将是巨大的,效率也较低。Channel 是在 connection 内部建立的逻辑连接,如果应用程序支持多线程,通常每个 thread 创建单独的 channel 进行通讯,AMQP method 包含了 channel id 帮助客
户端和 message broker 识别 channel,所以 channel 之间是完全隔离的。Channel 作为轻量级的
Connection 极大减少了操作系统建立 TCP connection 的开销
Exchange:message 到达 broker 的第一站,根据分发规则,匹配查询表中的 routing key,分发
消息到 queue 中去。常用的类型有:direct (point-to-point), topic (publish-subscribe) and fanout
(multicast)
Queue:消息最终被送到这里等待 consumer 取走
Binding:exchange 和 queue 之间的虚拟连接,binding 中可以包含 routing key,Binding 信息被保
存到 exchange 中的查询表中,用于 message 的分发依据
特点:一个生产者向一个队列发送消息,该队列负责消费消息,这也是最简单的一种模式。
该模式英文为 “Work Queues”,即工作队列,又称任务队列。
在这种模式下,一个生产者会对应一个消息队列,一个消息队列对应多个工作线程(消费者)。这些工作线程消费消息采用轮询的方式,且一个消息只能被消费一次。
假如现在生产者向队列发送消息,消息如下:
(aa,bb,cc,dd,ee)
第一次消费:会随机选择一个工作线程进行消费,假设是工作线程1,此时消费 aa
第二次消费:由于工作线程1已经消费了,轮到了工作线程2消费,消费了bb
第三次消费,工作线程3 消费了cc
第四次消费,工作线程1 消费了dd
.....
消费者完成一个任务可能需要一段时间,如果其中一个消费者处理一个长的任务并仅只完成了部分突然它挂掉了,此时消息就会丢失了。因为 RabbitMQ 一旦向消费者传递了一条消息,便立即将该消息标记为删除。
因此,为了保证消息在发送过程中不丢失,可以采用 RabbitMQ 的 应答机制。即消费者在接收到消息并且处理该消息之后,告诉 rabbitmq 它已经处理了,rabbitmq 可以把该消息删除了。
消息应答主要分为自动应答和手动应答。
自动应答:消息发送后立即被认为已经传送成功。但这种方式有个弊端,就是如果消息在接收到之前,消费者那边出现连接或者 channel 关闭,那么消息就丢失了。
手动应答可以设置是否批量应答。图一为批量应答,图二为不批量应答。
手动应答的好处是可以实现消息消费过程中不丢失,并且可以批量应答并且减少网络拥堵。
如果消费者由于某些原因失去连接(其通道已关闭,连接已关闭或 TCP 连接丢失),导致消息
未发送 ACK 确认,RabbitMQ 将了解到消息未完全处理,并将对其重新排队。如果此时其他消费者
可以处理,它将很快将其重新分发给另一个消费者。这样,即使某个消费者偶尔死亡,也可以确
保不会丢失任何消息。
我们可以看到消息 1 原本是由 C1 来消费的,但是 C1 失去连接了,导致消息没有应答。那么该消息会被分发给其它消费者消费(且仍然只消费一次).
由于消息从生产者那里发送出来时就会删除,因此我们在前面引入了应答机制,即只有当消费者成功应答了,生产者才会将其删除。但是如何保障当 RabbitMQ 服务停掉以后消息生产者发送过来的消息不丢失呢?我们知道,队列和消息默认存在内存中,因此,我们需要将队列和消息标志为持久化。
但是这种方式实际上存在一个弊端:在当消息刚准备存储在磁盘的时候 但是还没有存储完,消息还在缓存的一个间隔点。此时并没有真正写入磁盘。持久性保证并不强,但是这对于普通的简单任务而言,已经足够了,如果需要更强力的持久化策略,可以看后面的发布确认。
前面我们说到 RabbitMQ 采用轮询分发,但是这种策略不是很好。因为实际情况中消费者处理速度是不一样的。比如有个消费者处理速度很快,有个处理很慢,那如果还采用轮询的话,效率很低。只有给处理快的消费者干更多的活,才能提高效率。
我们可以通过设置**预取值,该值定义通道上允许的未确认消息的最大数量。**通过给处理快的消费者分配更多的预取值,可以提高总体效率。
生产者将信道设置成 confirm 模式,一旦信道进入 confirm 模式,所有在该信道上面发布的消
息都将会被指派一个唯一的 ID(从 1 开始),一旦消息被投递到所有匹配的队列之后,broker 就会
发送一个确认给生产者(包含消息的唯一 ID),这就使得生产者知道消息已经正确到达目的队列了,
如果消息和队列是可持久化的,那么确认消息会在将消息写入磁盘之后发出,broker 回传给生产
者确认消息,其中包含序列号。
confirm 模式的好处是他是异步的,且防止消息丢失。
确认发布分为:单个确认发布、批量确认发布、异步确认发布。
单个确认发布:每发一个就确认一个。
批量确认发布:每发一批就确认一批。
异步确认发布:生产者只负责发送消息,交换机依次确认消息后利用回调函数保证可靠性。
各自特点::
单独发布消息
:同步等待确认,简单,但吞吐量非常有限。
批量发布消息
:批量同步等待确认,简单,合理的吞吐量,一旦出现问题但很难推断出是哪条消息出现了问题。
异步处理
:最佳性能和资源使用,在出现错误的情况下可以很好地控制,但是实现起来稍微难些。
RabbitMQ 消息传递模型的核心思想是: 生产者生产的消息从不会直接发送到队列。相反,生产者只能将消息发送到交换机。
交换机的类型:
直接(direct), 主题(topic) ,标题(headers) , 扇出(fanout)
当我们指定为空字符串时,表示使用默认交换机,也就是无名交换机。
当我们需要一个队列时,我们可以不指定名称,而是通过创建一个随机名称或者让服务器选择也给随机队列名称,且当我们断开了消费者的连接,队列将被自动删除。
绑定:是交换机和队列之间的桥梁,它高速我们某个交换机和哪个队列绑定了关系。
直接交换机:消息只去到它绑定的routingKey 队列中去。
在上面这张图中,我们可以看到 X 绑定了两个队列,绑定类型是 direct。队列Q1 绑定键为 orange,队列 Q2 绑定键有两个:一个绑定键为 black,另一个绑定键为 green。
在这种绑定情况下,生产者发布消息到 exchange 上,绑定键为 orange 的消息会被发布到队列Q1。绑定键为 blackgreen 和的消息会被发布到队列 Q2,其他消息类型的消息将被丢弃。
当然如果 exchange 的绑定类型是direct,但是它绑定的多个队列的 key 如果都相同,在这种情
况下虽然绑定类型是 direct 但是它表现的就和 fanout 有点类似了。如上图。
扇出交换机的弊端:不能指定发送消息给哪个消费者,只能无脑的全部发。
直接交换机的弊端:设置的 routing_key 的匹配规则是固定的,不能灵活更改。
主题交换机:发送到类型是 topic 交换机的消息的 routing_key 不能随意写,必须满足一定的要求,它必须是一个单词列表,以点号分隔开。这些单词可以是任意单词。
特殊的:
*(星号)可以代替一个单词
#(井号)可以替代零个或多个单词
quick.orange.rabbit 被队列 Q1Q2 接收到
lazy.orange.elephant 被队列 Q1Q2 接收到
quick.orange.fox 被队列 Q1 接收到
lazy.brown.fox 被队列 Q2 接收到
lazy.pink.rabbit 虽然满足两个绑定但只被队列 Q2 接收一次
quick.brown.fox 不匹配任何绑定不会被任何队列接收到会被丢弃
quick.orange.male.rabbit 是四个单词不匹配任何绑定会被丢弃
lazy.orange.male.rabbit 是四个单词但匹配 Q2
死信:无法被消费的消息。
死信队列:无法被消费的消息将被流转到该队列。
producer 将消息投递到 broker 或者直接到queue 里了,consumer 从 queue 取出消息进行消费,但某些时候由于特定的原因导致 queue 中的某些消息无法被消费,这样的消息如果没有后续的处理,就变成了死信,有死信自然就有了死信队列。
应用场景:为了保证订单业务的消息数据不丢失,需要使用到 RabbitMQ 的死信队列机制,当消息
消费发生异常时,将消息投入死信队列中.还有比如说: 用户在商城下单成功并点击去支付后在指定时间未支付时自动失效。
1、消息 TTL 过期
2、队列达到最大长度(队列满了,无法再添加数据到 mq 中)
3、消息被拒绝(basic.reject 或 basic.nack)并且 requeue=false
在上节的死信队列案例中有一种情况是消息 TTL 过期,从而消息进入死信队列的过程。这种过程单独列出来就叫做延迟队列。
延迟队列:延时队列就是用来存放需要在指定时间被处理的元素的队列。即生产者正常发消息到队列,在队列中经过一定的延迟时间后进入死信队列,从而再被消费者消费。
延迟队列使用的场景有很多:
1、订单在十分钟之内未支付则自动取消
2、新创建的店铺,如果在十天内都没有上传过商品,则自动发送消息提醒。
3、用户注册成功后,如果三天内没有登陆则进行短信提醒。
4、用户发起退款,如果三天内没有得到处理则通知相关运营人员。
5、预定会议后,需要在预定的时间点前十分钟通知各个与会人员参加会议。
TTL 是 RabbitMQ 中一个消息或者队列的属性,表明一条消息或者该队列中的所有消息的最大存活时间,单位是毫秒。
创建两个队列 QA 和 QB,两者队列 TTL 分别设置为 10S 和 40S,然后在创建一个交换机 X 和死信交换机 Y,它们的类型都是direct,创建一个死信队列 QD,它们的绑定关系如下:
每增加一个新的时间需求,就要新增一个队列。
为了解决上面的问题,我们采用这种方案。
在这里新增了一个队列 QC,绑定关系如下,该队列不设置TTL 时间。
当有两条消息,第一条指定存在40秒才能消费,第二条指定存在2秒就可以消费。但结果我们会发现,两条消息都是经过了 40 秒才消费。
原因:队列的 先入先出 特性,导致后面本来 2秒就可以消费的消息要等待前面的消息出队,最终也得到 40 秒才能被消费。
这种问题可以通过 RabbitMQ 插件来实现延迟队列。
前面我们讲的发布确认的情况是指当消息从生产者那里发送出来并进入到匹配的队列时,交换机就会发布一个确认给生产者(包含消息 ID)。但是如果在更加极端的情况下:如果交换机或者队列之一消失了(即发生 RabbitMQ 重启),导致消息丢失,这种情况该怎么解决呢?答案是采用发布确认的高级版本。
问题存在:下订单场景。当用户执行支付,支付成功后,突然出现网络异常(此时金额已经扣了),用户不知道,于是再次点击付款,最终导致付款了两次。
解决:在单机系统中,我们只需要把操作放入一个事务即可,发生错误就回滚。
MQ 中存在的类似问题:
当消费者已经消费了消息1,准备给 MQ 发送 ack 确认时,发生了网络中断,此时生产者认为该消息没有消费,于是重新发送,或者发送给其它消费者,导致消息重复消费。
解决方法:保证 MQ 消费者的幂等性,使用全局 ID 或者写一个唯一标识(如 时间戳、UUID),每次消费消息时用该id先判断该消息是否已经消费过。
订单催付场景:但我们下单后,需要提醒用户支付,我们可以简单设置一个队列(可以通过 Redis 的 List 或者 RabbitMQ 实现),让需要发布提醒的信息都入队,但假如我们还有一个需求,即我们不是根据入队先后来提醒用户,而是对每个提醒都有一个优先级,即如果是大商家的订单就优先提醒,小额订单可以靠后提醒,那么就可以使用优先级队列。
默认情况下,当生产者将消息发送到 RabbitMQ 的时候,队列中的消息会尽可能的存储在内存之中,这样可以更加快速的将消息发送给消费者。即使是持久化的消息,在被写入磁盘的同时也会在内存中驻留一份备份。当 RabbitMQ 需要释放内存的时候,会将内存中的消息换页至磁盘中,这个操作会耗费较长的时间,也会阻塞队列的操作,进而无法接收新的消息。
惰性队列会尽可能的将消息存入磁盘中,而在消费者消费到相应的消息时才会被加载到内存中,它的一个重要的设计目标是能够支持更长的队列,即支持更多的消息存储。
单机 RabbitMQ 如果出现内存崩溃、或者机器断电或者主板故障等原因,就会导致消息丢失,而集群可以解决这个问题。
准备三台服务器
配置好集群(node1、node2、node3…)
虽然我们搭建了集群,但是存储一个队列时还是存储在一个节点上,那假如这个节点突然挂掉了,那这个队列不就丢失了吗?因此,我们需要配置镜像队列。
镜像队列:可以将队列镜像到集群中的其他 Broker 节点之上,如果集群中的一个节点失效了,队列能自动地切换到镜像中的另一个节点上以保证服务的可用性。简单地说:就是假设我们在节点1上有个 hello 队列,当我们配置了 参数为 2 的镜像队列后,我们的节点 1 就有 hello 队列和它的备份,当节点1 挂掉后,hello 队列的备份就会跑到另一个节点上(该节点没挂),并且会创建属于它的一个备份,这样就保证了队列不丢失。
存在问题:前面我们说到,当节点1挂掉时,队列的备份会跑到其它另一个节点上,不会导致队列消失,但是此时生产者并不知道队列1 挂掉了(我们的代码中硬编码了节点1),就还是将消息发送给节点1。
为了解决这个问题,我们实现高可用的负载均衡,如下图:
HAProxy 实现负载均衡:
HAProxy 提供高可用性、负载均衡及基于TCPHTTP 应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。(负责将消息分发到不同的节点)。
Keepalived 实现双机(主备)热备
试想如果前面配置的 HAProxy 主机突然宕机或者网卡失效,那么虽然 RbbitMQ 集群没有任何故障但是对于外界的客户端来说所有的连接都会被断开结果将是灾难性的为了确保负载均衡服务的可靠性同样显得十分重要,这里就要引入 Keepalived 它能够通过自身健康检查、资源接管功能做高可用(双机热备),实现故障转移。
存在问题:(broker 北京),(broker 深圳)彼此之间相距甚远,网络延迟是一个不得不面对的问题。有个在深圳的业务(Client 深圳)需要向 exchangeA(在北京) 发送消息, 那 么(Client 深圳) (broker 北京)之间有很大的网络延迟,(Client 深圳) 将发送消息至 exchangeA 会经历一定的延迟。
解决方法:
1、我们可以将深圳的业务部署到北京的机房。(但此时访问深圳的服务又会出现延迟,总不能将所有的业务都部署在一个机房吧)。
2、使用 Federation 插件就可以很好地解决这个问题。
联邦交换机有一个上下游的概念:
举个例子:假设深圳的服务想要访问北京的 MQ ,延迟较高,此时,将北京作为上游,深圳作为下游(通过配置完成),上游将数据同步给下游,从而深圳的服务只需要访问深圳的 MQ 即可,延迟较低。反之同理。
联邦队列可以在多个 Broker 节点(或者集群)之间为单个队列提供均衡负载的功能。一个联邦队列可以连接一个或者多个上游队列(upstream queue),并从这些上游队列中获取消息以满足本地消费者消费消息的需求。
对于联邦队列,原理和联邦交换机类似,只是更加细分到队列层次。
Federation 具备的数据转发功能类似,Shovel 够可靠、持续地从一个 Broker 中的队列(作为源端,即 source)拉取数据并转发至另一个 Broker 中的交换器(作为目的端,即 destination)。作为源端的队列和作为目的端的交换器可以同时位于同一个 Broker,也可以位于不同的 Broker 上。和 Federation Exchange 相似。