在高并发业务场景下，典型的阿里双11秒杀等业务，消息队列中间件在流量削峰、解耦上有不可替代的作用。

之前介绍了《MQ消息队列的12点核心原理总结》，以及《如何从0到1设计一个MQ消息队列》，以及《RPC远程调用和消息队列MQ的区别》。

今天我们一起来探讨：

全量的消息队列究竟有哪些？ Kafka、RocketMQ、RabbitMQ的优劣势比较，以及消息队列的选型

最全MQ消息队列有哪些？

那么目前在业界有哪些比较知名的消息引擎呢？如下图所示

这里面几乎完全列举了当下比较知名的消息引擎，包括：

ZeroMQ

推特的Distributedlog

ActiveMQ：Apache旗下的老牌消息引擎

RabbitMQ、Kafka：AMQP的默认实现。

RocketMQ

Artemis：Apache的ActiveMQ下的子项目

Apollo：同样为Apache的ActiveMQ的子项目的号称下一代消息引擎

商业化的消息引擎IronMQ

以及实现了JMS(Java Message Service)标准的OpenMQ。

MQ消息队列的技术应用

1.解耦

解耦是消息队列要解决的最本质问题。

2.最终一致性

最终一致性指的是两个系统的状态保持一致，要么都成功，要么都失败。

最终一致性不是消息队列的必备特性，但确实可以依靠消息队列来做最终一致性的事情。

2.广播

消息队列的基本功能之一是进行广播。

有了消息队列，我们只需要关心消息是否送达了队列，至于谁希望订阅，是下游的事情，无疑极大地减少了开发和联调的工作量。

3.错峰与流控

典型的使用场景就是秒杀业务用于流量削峰场景。

由于篇幅的关系，本文重点介绍消息队列比较，详细应用场景请参考：《什么是流量削峰？如何解决秒杀业务的削峰场景》。

Kafka、RocketMQ、RabbitMQ比较

高并发架构系列：Kafka、RocketMQ、RabbitMQ的优劣势比较_第1张图片

1.ActiveMQ

优点

单机吞吐量：万级

topic数量都吞吐量的影响：

时效性：ms级

可用性：高，基于主从架构实现高可用性

消息可靠性：有较低的概率丢失数据

功能支持：MQ领域的功能极其完备

缺点:

官方社区现在对ActiveMQ 5.x维护越来越少，较少在大规模吞吐的场景中使用。

2.Kafka

号称大数据的杀手锏，谈到大数据领域内的消息传输，则绕不开Kafka，这款为大数据而生的消息中间件，以其百万级TPS的吞吐量名声大噪，迅速成为大数据领域的宠儿，在数据采集、传输、存储的过程中发挥着举足轻重的作用。

Apache Kafka它最初由LinkedIn公司基于独特的设计实现为一个分布式的提交日志系统( a distributed commit log)，之后成为Apache项目的一部分。

目前已经被LinkedIn，Uber, Twitter, Netflix等大公司所采纳。

优点

性能卓越，单机写入TPS约在百万条/秒，最大的优点，就是吞吐量高。

时效性：ms级

可用性：非常高，kafka是分布式的，一个数据多个副本，少数机器宕机，不会丢失数据，不会导致不可用

消费者采用Pull方式获取消息, 消息有序, 通过控制能够保证所有消息被消费且仅被消费一次;

有优秀的第三方Kafka Web管理界面Kafka-Manager；

在日志领域比较成熟，被多家公司和多个开源项目使用；

功能支持：功能较为简单，主要支持简单的MQ功能，在大数据领域的实时计算以及日志采集被大规模使用

缺点：

Kafka单机超过64个队列/分区，Load会发生明显的飙高现象，队列越多，load越高，发送消息响应时间变长

使用短轮询方式，实时性取决于轮询间隔时间；

消费失败不支持重试；

支持消息顺序，但是一台代理宕机后，就会产生消息乱序；

社区更新较慢；

3.RabbitMQ

RabbitMQ 2007年发布，是一个在AMQP(高级消息队列协议)基础上完成的，可复用的企业消息系统，是当前最主流的消息中间件之一。

RabbitMQ优点：

由于erlang语言的特性，mq 性能较好，高并发；

吞吐量到万级，MQ功能比较完备

健壮、稳定、易用、跨平台、支持多种语言、文档齐全；

开源提供的管理界面非常棒，用起来很好用

社区活跃度高；

RabbitMQ缺点：

erlang开发，很难去看懂源码，基本职能依赖于开源社区的快速维护和修复bug，不利于做二次开发和维护。

RabbitMQ确实吞吐量会低一些，这是因为他做的实现机制比较重。

需要学习比较复杂的接口和协议，学习和维护成本较高。

4.RocketMQ

RocketMQ出自阿里公司的开源产品，用 Java 语言实现，在设计时参考了 Kafka，并做出了自己的一些改进。

RocketMQ在阿里集团被广泛应用在订单，交易，充值，流计算，消息推送，日志流式处理，binglog分发等场景。

RocketMQ优点：

单机吞吐量：十万级

可用性：非常高，分布式架构

消息可靠性：经过参数优化配置，消息可以做到0丢失

功能支持：MQ功能较为完善，还是分布式的，扩展性好

支持10亿级别的消息堆积，不会因为堆积导致性能下降

源码是java，我们可以自己阅读源码，定制自己公司的MQ，可以掌控

RocketMQ缺点：

支持的客户端语言不多，目前是java及c++，其中c++不成熟；

社区活跃度一般

没有在 mq 核心中去实现JMS等接口，有些系统要迁移需要修改大量代码

消息队列选择建议

1.Kafka

Kafka主要特点是基于Pull的模式来处理消息消费，追求高吞吐量，一开始的目的就是用于日志收集和传输，适合产生大量数据的互联网服务的数据收集业务。

大型公司建议可以选用，如果有日志采集功能，肯定是首选kafka了。

2.RocketMQ

天生为金融互联网领域而生，对于可靠性要求很高的场景，尤其是电商里面的订单扣款，以及业务削峰，在大量交易涌入时，后端可能无法及时处理的情况。

RoketMQ在稳定性上可能更值得信赖，这些业务场景在阿里双11已经经历了多次考验，如果你的业务有上述并发场景，建议可以选择RocketMQ。

3.RabbitMQ

RabbitMQ :结合erlang语言本身的并发优势，性能较好，社区活跃度也比较高，但是不利于做二次开发和维护。不过，RabbitMQ的社区十分活跃，可以解决开发过程中遇到的bug。

如果你的数据量没有那么大，小公司优先选择功能比较完备的RabbitMQ。

作者：MikeChen架构笔记
链接：https://www.jianshu.com/p/fec054f3e496
来源：
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

补充

1.1 特性
RocketMQ：

NameServer:整个MQ集群提供服务协调与治理，具体就是记录维护Topic、Broker的信息，及监控Broker的运行状态，Name Server是一个几乎无状态节点，可集群部署，节点之间无任何信息同步，相当于注册中心.
Broker:消息服务器，作为server提供消息核心服务，每个Broker与Name Server集群中的所有节点建立长连接，定时注册Topic信息到所有Name Server；
Producer:消息生产者，业务的发起方，负责生产消息传输给broker.
Consumer:消息消费者，业务的处理方，负责从broker获取消息并进行业务逻辑处理
RabbitMQ:

Exchange:交换机的作用就是根据路由规则，将消息转发到对应的队列上。.
Broker:消息服务器，作为server提供消息核心服务
Channel:信道是建立在真实的TCP连接内的虚拟连接.
Routing key:生产者将消息发送到交换机时，会在消息头上携带一个 key，这个 key就是routing key，来指定这个消息的路由规则。
Binding key:在绑定Exchange与Queue时，一般会指定一个binding key，生产者将消息发送给Exchange时，消息头上会携带一个routing key，当binding key与routing key相匹配时，消息将会被路由到对应的Queue中。
1.2 重复消费
正常情况下，消费者在消费消息的时候，消费完毕后，会发送一个确认消息给消息队列，消息队列就知道该消息被消费了，就会将该消息从消息队列中删除；但是因为网络传输等等故障，确认信息没有传送到消息队列，导致消息队列不知道自己已经消费过该消息了，再次将消息分发给其他的消费者。

保证消息的唯一性，就算是多次传输，不要让消息的多次消费带来影响；保证消息等幂性；

1.3 丢失数据
RocketMQ：

生产者丢数据：（1）采取send()同步发消息，发送结果是同步感知的。发送失败后可以重试，设置重试次数。默认3次。（2）发送失败的消息会存储在Commitlog中。
消息队列丢数据：（1）消息支持持久化到Commitlog里面，即使宕机后重启，未消费的消息也是可以加载出来的；（2）Broker自身支持同步刷盘、异步刷盘的策略，可以保证接收到的消息一定存储在本地的内存中；（3）Broker集群支持 1主N从的策略，支持同步复制和异步复制的方式，同步复制可以保证即使Master 磁盘崩溃，消息仍然不会丢失
消费者丢失数据：（1）完全成功后发送ACK；（2）维护一个持久化的offset
RabbitMQ:

生产者丢数据：RabbitMQ提供transaction（事务，支持回滚）和confirm模式（ACK给生产者）来确保生产者不丢消息；
消息队列丢数据：开启rabbitmq的持久化，就是消息写入之后会持久化到磁盘，持久化可以跟生产者那边的confirm机制配合起来，只有消息被持久化到磁盘之后，才会通知生产者ack。
消费者丢失数据：消费者丢数据一般是因为采用了自动确认消息模式，改为手动确认消息，处理消息成功后，手动回复确认消息。
1.4 消费顺序
主要思路有两种：1、单线程消费来保证消息的顺序性；2、对消息进行编号，消费者处理时根据编号判断顺序。

每个queue的数据本身就是有序的，只要消费者这边有序消费，那么可以保证数据被顺序消费。如果是多线程消费，就要consumer内部用内存队列做排队。

1.5 高可用
RocketMQ：

多Master：配置简单，性能最高，但可能会有少量消息丢失（配置相关），单台机器重启或宕机期间，该机器下未被消费的消息在机器恢复前不可订阅，影响消息实时性
多Master多Slave异步模式：每个Master配一个Slave，有多对Master-Slave，消息写入全部是发送到Master Broker的，获取消息也可以Master获取，少了Slave Broker，会导致所有读写压力都集中在Master Broker，集群采用异步复制方式，主备有短暂消息延迟，毫秒级；性能同多Master几乎一样，实时性高，主备间切换对应用透明，不需人工干预，但Master宕机或磁盘损坏时会有少量消息丢失；
多Master多Slave同步模式：每个Master配一个Slave，有多对Master-Slave，消息写入全部是发送到Master Broker的，获取消息也可以Master获取，少了Slave Broker，会导致所有读写压力都集中在Master Broker，集群采用同步双写方式，主备都写成功，向应用返回成功；优点是服务可用性与数据可用性非常高；缺点是性能比异步集群略低，当前版本主宕备不能自动切换为主。
RabbitMQ:

普通集群模式：多台机器上启动多个rabbitmq实例，每个机器启动一个。但是你创建的queue，只会放在一个rabbtimq实例上，但是每个实例都同步queue的元数据。完了你消费的时候，实际上如果连接到了另外一个实例，那么那个实例会从queue所在实例上拉取数据过来。如果那个放queue的实例宕机了，会导致接下来其他实例就无法从那个实例拉取，如果你开启了消息持久化，让rabbitmq落地存储消息的话，消息不一定会丢，得等这个实例恢复了，然后才可以继续从这个queue拉取数据。
镜像集群模式：创建的queue，无论元数据还是queue里的消息都会存在于多个实例上，然后每次写消息到queue的时候，都会自动把消息到多个实例的queue里进行消息同步。缺点:（1）性能开销大，因为需要进行整个集群内部所有实例的数据同步；（2）无法线性扩容: 因为每一个服务器中都包含整个集群服务节点中的所有数据, 这样如果一旦单个服务器节点的容量无法容纳了。

高并发架构系列：Kafka、RocketMQ、RabbitMQ的优劣势比较

最全MQ消息队列有哪些？

MQ消息队列的技术应用

Kafka、RocketMQ、RabbitMQ比较

消息队列选择建议

补充

你可能感兴趣的:(高并发架构系列：Kafka、RocketMQ、RabbitMQ的优劣势比较)