JAVA开发(RocketMq工作原理以及和其他MQ比较)

一、mq的使用场景:

使用消息的场景一般是为了错峰流量控制,解耦系统消息处理机制,以一种延迟的方式达到数据的一致性,保护好系统性能。

JAVA开发(RocketMq工作原理以及和其他MQ比较)_第1张图片

二、RocketMq的概念介绍:

1 、消息模型(Message Model)
RocketMQ主要由 Producer、Broker、Consumer 三部分组成,其中Producer 负责生产消息,Consumer 负责消费消息,Broker 负责存储消息。Broker 在实际部署过程中对应一台服务器,每个 Broker 可以存储多个Topic的消息,每个Topic的消息也可以分片存储于不同的 Broker。Message Queue 用于存储消息的物理地址,每个Topic中的消息地址存储于多个 Message Queue 中。ConsumerGroup 由多个Consumer 实例构成。

2 、消息生产者(Producer)
负责生产消息,一般由业务系统负责生产消息。一个消息生产者会把业务应用系统里产生的消息发送到broker服务器。RocketMQ提供多种发送方式,同步发送、异步发送、顺序发送、单向发送。同步和异步方式均需要Broker返回确认信息,单向发送不需要。

3、 消息消费者(Consumer)
负责消费消息,一般是后台系统负责异步消费。一个消息消费者会从Broker服务器拉取消息、并将其提供给应用程序。从用户应用的角度而言提供了两种消费形式:拉取式消费、推动式消费。

4 、主题(Topic)
表示一类消息的集合,每个主题包含若干条消息,每条消息只能属于一个主题,是RocketMQ进行消息订阅的基本单位。

5、 代理服务器(Broker Server)
消息中转角色,负责存储消息、转发消息。代理服务器在RocketMQ系统中负责接收从生产者发送来的消息并存储、同时为消费者的拉取请求作准备。代理服务器也存储消息相关的元数据,包括消费者组、消费进度偏移和主题和队列消息等。

6 、名字服务(Name Server)
名称服务充当路由消息的提供者。生产者或消费者能够通过名字服务查找各主题相应的Broker IP列表。多个Namesrv实例组成集群,但相互独立,没有信息交换。

7 、拉取式消费(Pull Consumer)
Consumer消费的一种类型,应用通常主动调用Consumer的拉消息方法从Broker服务器拉消息、主动权由应用控制。一旦获取了批量消息,应用就会启动消费过程。

8 、推动式消费(Push Consumer)
Consumer消费的一种类型,该模式下Broker收到数据后会主动推送给消费端,该消费模式一般实时性较高。

9 、生产者组(Producer Group)
同一类Producer的集合,这类Producer发送同一类消息且发送逻辑一致。如果发送的是事务消息且原始生产者在发送之后崩溃,则Broker服务器会联系同一生产者组的其他生产者实例以提交或回溯消费。

10、 消费者组(Consumer Group)
同一类Consumer的集合,这类Consumer通常消费同一类消息且消费逻辑一致。消费者组使得在消息消费方面,实现负载均衡和容错的目标变得非常容易。要注意的是,消费者组的消费者实例必须订阅完全相同的Topic。RocketMQ 支持两种消息模式:集群消费(Clustering)和广播消费(Broadcasting)。

1、如果两个消费者实例属于同一个消费组,监听同一个topic,那么他们其他一个消费了消息后,另一个就不能消费了,如果想两个消费者都消费同一个消息,那么需要设置不同的消费组
2、Producer Group 和Consumer Group可以不一样的

11 、集群消费(Clustering)
集群消费模式下,相同Consumer Group的每个Consumer实例平均分摊消息。

12、 广播消费(Broadcasting)
广播消费模式下,相同Consumer Group的每个Consumer实例都接收全量的消息。

13 、普通顺序消息(Normal Ordered Message)
普通顺序消费模式下,消费者通过同一个消费队列收到的消息是有顺序的,不同消息队列收到的消息则可能是无顺序的。

14、 严格顺序消息(Strictly Ordered Message)
严格顺序消息模式下,消费者收到的所有消息均是有顺序的。

15 、消息(Message)
消息系统所传输信息的物理载体,生产和消费数据的最小单位,每条消息必须属于一个主题。RocketMQ中每个消息拥有唯一的Message ID,且可以携带具有业务标识的Key。系统提供了通过Message ID和Key查询消息的功能。

16 、标签(Tag)
为消息设置的标志,用于同一主题下区分不同类型的消息。来自同一业务单元的消息,可以根据不同业务目的在同一主题下设置不同标签。标签能够有效地保持代码的清晰度和连贯性,并优化RocketMQ提供的查询系统。消费者可以根据Tag实现对不同子主题的不同消费逻辑,实现更好的扩展性。
 

三、RocketMQ架构:

JAVA开发(RocketMq工作原理以及和其他MQ比较)_第2张图片

四、kafka介绍:

  Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、Storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等等,用scala语言编写,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。

  实际上算作是分布式的流处理平台,具备消息中间间的功能,在大数据领域作为流计算的平台,也会做消息分发。

Kafka常见的使用场景

  【1】日志收集:一个公司可以用Kafka收集各种服务的log,通过kafka以统一接口服务的方式开放给各种consumer,例如hadoop、Hbase、Solr等。

  【2】消息系统:解耦和生产者和消费者、缓存消息等。

  【3】用户活动跟踪:Kafka经常被用来记录web用户或者app用户的各种活动,如浏览网页、搜索、点击等活动,这些活动信息被各个服务器发布到kafka的topic中,然后订阅者通过订阅这些topic来做实时的监控分析,或者装载到hadoop、数据仓库中做离线分析和挖掘。

  【4】运营指标:Kafka也经常用来记录运营监控数据。包括收集各种分布式应用的数据,生产各种操作的集中反馈,比如报警和报告。

Kafka基本概念

  【1】kafka是一个分布式的,分区的消息(官方称之为commit log)服务。它提供一个消息系统应该具备的功能,但是确有着独特的设计。可以这样来说,Kafka借鉴了JMS规范的思想,但是确并没有完全遵循JMS规范。

  【2】基础的消息(Message)相关术语:

JAVA开发(RocketMq工作原理以及和其他MQ比较)_第3张图片

 

五、几种MQ的比较:

JAVA开发(RocketMq工作原理以及和其他MQ比较)_第4张图片

其中,RabbitMQ 2007年发布,是一个在AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。

RabbitMQ优点

  1. 由于erlang语言的特性,mq 性能较好,高并发;
  2. 吞吐量到万级,MQ功能比较完备
  3. 健壮、稳定、易用、跨平台、支持多种语言、文档齐全;
  4. 开源提供的管理界面非常棒,用起来很好用
  5. 社区活跃度高;

RabbitMQ缺点:

  1. erlang开发,很难去看懂源码,基本职能依赖于开源社区的快速维护和修复bug,不利于做二次开发和维护。
  2. RabbitMQ确实吞吐量会低一些,这是因为他做的实现机制比较重。
  3. 需要学习比较复杂的接口和协议,学习和维护成本较高。

第二、RocketMQ出自 阿里公司的开源产品,用 Java 语言实现,在设计时参考了 Kafka,并做出了自己的一些改进。

RocketMQ在阿里集团被广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,binglog分发等场景。

RocketMQ优点:

  1. 单机吞吐量:十万级
  2. 可用性:非常高,分布式架构
  3. 消息可靠性:经过参数优化配置,消息可以做到0丢失
  4. 功能支持:MQ功能较为完善,还是分布式的,扩展性好
  5. 支持10亿级别的消息堆积,不会因为堆积导致性能下降
  6. 源码是java,我们可以自己阅读源码,定制自己公司的MQ,可以掌控

RocketMQ缺点:

  1. 支持的客户端语言不多,目前是java及c++,其中c++不成熟;
  2. 社区活跃度一般
  3. 没有在 mq 核心中去实现JMS等接口,有些系统要迁移需要修改大量代码

RocketMQ与kafka的比较:

1)适用场景

  Kafka适合日志处理

  RocketMQ适合业务处理

  结论:平手,根据具体业务定夺

2)性能

  kafka单机写入TPS号称在百万条/秒;

  RocketMQ大约在10万条/秒;

  结论:追求性能的话,kafka单机性能更高

3)可靠性

  RocketMQ支持异步/同步刷盘;异步/同步 Replication;

  Kafka使用异步刷盘方式,异步Replication;

  结论:RocketMQ所支持的同步方式提升了数据的可靠性。

4)实时性

  均支持pull长轮询,RocketMQ消息实时性更好

  结论:RocketMQ胜出。

5)支持的队列数

  Kafka单机超过64个队列/分区,消息发送性能降低严重;

  RocketMQ单机支持最高5万个队列,性能稳定;

  结论:长远来看,RocketMQ胜出,这也是适合业务处理的原因之一

6)消息顺序性

  Kafka某些配置下,支持消息顺序,但是一台Broker宕机后,就会产生消息乱序;

  RocketMQ支持严格的消息顺序,在顺序消费场景下,一台Broker宕机后,发送消息会失败,但是不会乱序。

  结论:RocketMQ胜出

7)消费失败重试机制

  Kafka消费失败不支持重试

  RocketMQ消费失败支持定时重试,每次重试间隔时间顺延

8)定时/延时消息

  Kafka不支持定时消息;

  RocketMQ支持定时消息

9)分布式事务消息

  Kafka不支持分布式事务消息

  RocketMQ支持分布式事务消息

10)消息查询机制

  Kafka不支持消息查询

  RocketMQ支持根据Message Id查询消息,也支持根据消息内容查询消息

11)消息回溯

  Kafka理论上可以按照Offset来回溯消息

  RocketMQ支持按照时间来回溯消息,精度毫秒,例如从一天之前的某分某秒开始重新消费消息。

六、消息队列的选择:

1.Kafka

Kafka主要特点是基于Pull的模式来处理消息消费,追求高吞吐量,一开始的目的就是用于日志收集和传输,适合产生大量数据的互联网服务的数据收集业务。

大型公司建议可以选用,如果有日志采集功能,肯定是首选kafka了。

2.RocketMQ

天生为金融互联网领域而生,对于可靠性要求很高的场景,尤其是电商里面的订单扣款,以及业务削峰,在大量交易涌入时,后端可能无法及时处理的情况。

RoketMQ在稳定性上可能更值得信赖,这些业务场景在阿里双11已经经历了多次考验,如果你的业务有上述并发场景,建议可以选择RocketMQ。

3.RabbitMQ

RabbitMQ :结合erlang语言本身的并发优势,性能较好,社区活跃度也比较高,但是不利于做二次开发和维护。不过,RabbitMQ的社区十分活跃,可以解决开发过程中遇到的bug。

如果你的数据量没有那么大,小公司优先选择功能比较完备的RabbitMQ。

以上,是Kafka、RocketMQ、RabbitMQ的优劣势比较。

你可能感兴趣的:(java,java,java-rocketmq,rocketmq)