MQ(message queue),从字面意思上看,本质是个队列,FIFO 先入先出,只不过队列中存放的内容是message 而已,还是一种跨进程的通信机制,用于上下游传递消息。在互联网架构中,MQ 是一种非常常见的上下游“逻辑解耦+物理解耦”的消息通信服务。使用了 MQ 之后,消息发送上游只需要依赖 MQ,不用依赖其他服务。
为什么要使用MQ,是这样的先了解一下同步通讯和异步通讯的区别,同步通讯时效性比较高,对数据可以做出立即的响应,但是随之而来的它存在的问题,不同业务之间的耦合度高,当执行业务需要连贯的业务逻辑时,性能和吞吐能力下降,涉及多个业务相互调用的时候业务链中的任何一个挂掉就会导致一连串的业务失败也就是级联失败。
异步通讯的话的使整个项目的耦合度降低,吞吐量提升,同时实现故障隔离避免出先级联失败的情况,缺点时时效性没有那么强。(不行加一层!!!),那么么学习的消息队列就是基于异步方式的通讯。
应用中有支付业务、订单业务、短信业务、存储业务等等。用户支付后,如果耦合调用订单业务、短信业务、存储业务,任何一个子系统出了故障,都会造成下单操作异常。当转变成基于消息队列的方式后,系统间调用的问题会减少很多,比如下单之后的订单业务系统因为发生故障,需要几分钟来修复。在这几分钟的时间里,订单系统要处理的内存被缓存在消息队列中,用户的下单支付操作可以正常完成。当订单系统恢复后,继续处理订单信息即可,用户感受不到订单系统的故障,提升系统的可用性。
举个例子,如果订单系统最多能处理一万次订单,这个处理能力应付正常时段的下单时绰绰有余,正常时段我们下单一秒后就能返回结果。但是在高峰期,如果有两万次下单操作系统是处理不了的,只能限制订单超过一万后不允许用户下单。使用消息队列做缓冲,我们可以取消这个限制,把一秒内下的订单分散成一段时间来处理,这时有些用户可能在下单十几秒后才能收到下单成功的操作,但是比不能下单的体验要好。
有些服务间调用是异步的,例如 A 调用 B,B 需要花费很长时间执行,但是 A 需要知道 B 什么时候可以执行完,以前一般有两种方式,A 过一段时间去调用 B 的查询 api 查询。或者 A 提供一个 callback api,B 执行完之后调用 api 通知 A 服务。这两种方式都不是很优雅,使用消息总线,可以很方便解决这个问题,A 调用 B 服务后,只需要监听 B 处理完成的消息,当 B 处理完成后,会发送一条消息给 MQ,MQ 会将此消息转发给 A 服务。这样 A 服务既不用循环调用 B 的查询 api,也不用提供 callback api。同样 B 服务也不用做这些操作。A 服务还能及时的得到异步处理成功的消息。
优点:单机吞吐量万级,时效性 ms 级,可用性高,基于主从架构实现高可用性,消息可靠性较低的概率丢失数据
缺点:官方社区现在对 ActiveMQ 5.x 维护越来越少,高吞吐量场景较少使用。
大数据的杀手锏,谈到大数据领域内的消息传输,则绕不开 Kafka,这款为大数据而生的消息中间件,以其百万级 TPS 的吞吐量名声大噪,迅速成为大数据领域的宠儿,在数据采集、传输、存储的过程中发挥着举足轻重的作用。目前已经被 LinkedIn,Uber, Twitter, Netflix 等大公司所采纳。
优点: 性能卓越,单机写入 TPS 约在百万条/秒,最大的优点,就是吞吐量高。时效性 ms 级可用性非常高,kafka 是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用,消费者采用 Pull 方式获取消息,,消息有序, 通过控制能够保证所有消息被消费且仅被消费一次;有优秀的第三方Kafka Web 管理界面 Kafka-Manager;在日志领域比较成熟,被多家公司和多个开源项目使用;功能支持:功能较为简单,主要支持简单的 MQ 功能,在大数据领域的实时计算以及日志采集被大规模使用。
缺点:Kafka 单机超过 64 个队列/分区,Load 会发生明显的飙高现象,队列越多,load 越高,发送消息响应时间变长,使用短轮询方式,实时性取决于轮询间隔时间,消费失败不支持重试;支持消息顺序,但是一台代理宕机后,就会产生消息乱序,社区更新较慢;
RocketMQ 出自阿里巴巴的开源产品,用 Java 语言实现,在设计时参考了 Kafka,并做出了自己的一些改进。被阿里巴巴广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,binglog 分发等场景。
优点:单机吞吐量十万级,可用性非常高,分布式架构,消息可以做到 0 丢失,MQ 功能较为完善,还是分布式的,扩展性好,支持 10 亿级别的消息堆积,不会因为堆积导致性能下降,源码是 java 我们可以自己阅读源码,定制自己公司的 MQ
缺点:支持的客户端语言不多,目前是 java 及 c++,其中 c++不成熟;社区活跃度一般,没有在 MQ核心中去实现 JMS 等接口,有些系统要迁移需要修改大量代码。
2007 年发布,是一个在 AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。
优点:由于 erlang 语言的高并发特性,性能较好;吞吐量到万级,MQ 功能比较完备,健壮、稳定、易用、跨平台、支持多种语言 如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等,支持 AJAX 文档齐全;开源提供的管理界面非常棒,用起来很好用,社区活跃度高;更新频率相当高。
总结:
安全选RocketMQ,高吞吐选kafka,对这两个方面没有那么高的话就选RabbitMQ。
生产者:产生数据发送消息的程序是生产者
交换机:交换机是 RabbitMQ 非常重要的一个部件,一方面它接收来自生产者的消息,另一方面它将消息推送到队列中。交换机必须确切知道如何处理它接收到的消息,是将这些消息推送到特定队列还是推送到多个队列,亦或者是把消息丢弃,这个得有交换机类型决定。
队列:队列是 RabbitMQ 内部使用的一种数据结构,尽管消息流经 RabbitMQ 和应用程序,但它们只能存储在队列中。队列仅受主机的内存和磁盘限制的约束,本质上是一个大的消息缓冲区。许多生产者可以将消息发送到一个队列,许多消费者可以尝试从一个队列接收数据。这就是我们使用队列的方式。
消费者:消费与接收具有相似的含义。消费者大多时候是一个等待接收消息的程序。请注意生产者,消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又是可以是消费者。
hello world(简单模式):一个生产者,一个消费者,消费生产最简单的模式。
Work Queues(工作模式):一个生产者多个消费者,消费者之间存在竞争关系,每个消费者获取到的消息唯一。
Publish/Subscribe(订阅模式):一个生产者发送的消息会被多个消费者获取。
Routing(路由模式):发送消息到交换机并且要指定路由key ,消费者将队列绑定到交换机时需要指定路由key。
Topics(匹配模式):将路由键和某模式进行匹配,此时队列需要绑定在一个模式上,“#”匹配一个词或多个词,“*”只匹配一个词。
Publisher Confirms(发布者确认):消息发布者发布消息后确认消息的消费者收到消息。
Broker:接收和分发消息的应用,RabbitMQ Server就是Message Broker
Virtual host:出于多租户和安全因素设计的,把AMQP 的基本组件划分到一个虚拟的分组中,类似于网络中的namespace概念。当多个不同的用户使用同一个RabbitMQserver提供的服务时,可以划分出多个虚拟主机,每个用户在自己的虚拟主机创建exchange/queue 等。
Connection:publisher/consumer和broker之间的TCP连接
Channel:如果每一次访问RabbitMQ 都建立一个Connection,在消息量大的时候建立TCP Connection的开销将是巨大的,效率也较低。Channel是在connection内部建立的逻辑连接,如果应用程序支持多线程,通常每个thread创建单独channel进行通讯,AMQP method包含了channel id 帮助客户端和message broker 识别channel,所以channel之间是完全隔离的。Channel作为轻量级的Connection极大减少了操作系统建立TCP connection的开销。
Exchange:message 到达broker 的第一站,根据分发规则,匹配查询表中的routing key,分发消息到queue 中去。常用的类型有:direct (point-to-point),topic (publish-subscribe) and fanout (multicast)。
Queue:消息最终被送到这里等待consumer取走。
Binding:exchange和queue之间的虚拟连接,binding中可以包含routing key,Binding信息被保存到exchange中的查询表中,用于message的分发依据。
由于RabbitMQ是使用Erlang进行开发的,所以在安装的时候要首先安装Erlang的环境,对于版本的依赖比较强这里参考官方的版本之间的对应关系,进行下载安装。此外可以使下面的网址进行快速的检索自己需要下载文件:https://packagecloud.io/rabbitmq/erlang/packages。这里有一个要注意的地方查看自己床的linux版本,el6、el7、el8还是el9,使用下面命令可以查看。
uname -a
然后将下载好的文件上传到虚拟机中,接下来就是具体的安装和配置了
#安装erlang
rpm -ivh erlang-23.3.4.11-1.el7.x86_64.rpm
#安装依赖包
yum install socat -y
#安装rabbitmq
rpm -ivh rabbitmq-server-3.10.0-1.el7.noarch.rpm
#配置开机启动
chkconfig rabbitmq-server on
#启动
[root@localhost /]# /sbin/service rabbitmq-server start
#查看状态
/sbin/service rabbitmq-server status
#关闭
/sbin/service rabbitmq-server stop
#开启 web 管理插件
rabbitmq-plugins enable rabbitmq_management
#重新开启服务
/sbin/service rabbitmq-server start
到这里已经安装完毕,现在就可以直接访问ui界面http://192.168.200.88:15672/#/ ,记得关闭防火墙!默认的密码和账号是guest,但是初次登录是不成功的是因为没有权限,那么接下来就是要创建用户和设置密码分配权限。
#创建账号
rabbitmqctl add_user admin 123
#创建账号密码
rabbitmqctl set_user_tags admin administrator
#设置用户权限使用命令set_permissions [-p ]
rabbitmqctl set_permissions -p "/" admin ".*" ".*" ".*"
用户 user_admin 具有/vhost1 这个 virtual host 中所有资源的配置、写、读权限
#当前用户和角色
rabbitmqctl list_users
再次访问
关闭应用的命令为
rabbitmqctl stop_app
清除的命令为
rabbitmqctl reset
重新启动命令为
rabbitmqctl start_app