课程内容:
MQ: MessageQueue,消息队列。队列,是一种FIFO先进先出的数据结构。消息由生产者发送到MQ进行排队,然后按原来的顺序交由消息的消费者进行处理。QQ和微信就是典型的MQ。
MQ的作用主要有以下三个方面:
作用:
1、服务之间进行解耦,才可以减少服务之间的影响。提高系统整体的稳定性以及可扩展性。
2、另外,解耦后可以实现数据分发。生产者发送一个消息后,可以由一个或者多个消费者进行消费,并且消费者的增加或者减少对生产者没有影响。
上面MQ的所用也就是使用MQ的优点。但是引入MQ也是有他的缺点的:
系统可用性降低
系统引入的外部依赖增多,系统的稳定性就会变差。一旦MQ宕机,对业务会产生影响。这就需要考虑如何保证MQ的高可用。
系统复杂度提高
引入MQ后系统的复杂度会大大提高。以前服务之间可以进行同步的服务调用,引入MQ后,会变为异步调用,数据的链路就会变得更复杂并且还会带来其他一些问题。比如:如何保证消费不会丢失?不会被重复调用?怎么保证消息的顺序性等问题。
消息一致性问题
A系统处理完业务,通过MQ发送消息给B、C系统进行后续的业务处理。如果B系统处理成功,C系统处理失败怎么办?这就需要考虑如何保证消息数据处理的一致性。
常用的MQ产品包括Kafka、RabbitMQ和RocketMQ。我们对这三个产品做下简单的比较,重点需要理解他们的适用场景。
优点 | 缺点 | 使用场景 | |
---|---|---|---|
kafka | 吞吐量非常大,性能非常好,集群高可用。 | 会丢数据功能比较单 | 日志分析,大数据采集 |
Rabbit | 消息可靠性高,功能全面。 | 吞吐量比较低,消息积累会影响性能,erlang语言不好定制。 | 小规模场景 |
Rocket MQ | 高吞吐,高性能,高可用,功能全面。 | 开源版功能不如云上版,官方文档比较简单,客户端只支持java。 | 几乎全场景 |
另外,关于这三大产品更详细的比较,可以参见《kafka vs rabbitmq vs rocketmq.pdf》
关于RabbitMQ的功能特性,可以在官网( https://www.rabbitmq.com/)上看到,包含Asynchronous Message(异步消息)、DeveloperExperience(开发体验)、Distributed Deployment(分布式部署)、Enterprise & Cloud Ready(企业云部署)、Tools & Plugins(工具和插件)、Management & Monitoring(管理和监控)六大部分。所以其中的功能是相当丰富的,而我们肯定只能关注重点的部分内容,所以还是要经常到官网上去看看的。
准备了三台虚拟机192.168.232.128~130,预备搭建三台机器的集群。
三台机器均预装CentOS7操作系统。分别配置机器名worker1,worker2,worker3。然后需要关闭防火墙(或者找到RabbitMQ的业务端口全部打开。5672(amqp端口);15672(http Api口);25672(集群通信端口))。
RabbitMQ版本,通常与他的大的功能是有关系的。3.8.x版本主要是围绕Quorum Queue功能,而3.9.x版本主要是围绕Streams功能。目前还有3.10.x版本,还在rc阶段。我们这次选择3.9.15版本。
RabbitMQ是基于Erlang语言开发,所以安装前需要安装Erlang语言环境。需要注意下的是RabbitMQ与ErLang是有版本对应关系的3.9.15版本的RabbitMQ只支持23.2以上到24.3版本的Erlang。
Docker hub上也已经有官方上传的镜像
这个语言包,在windows下的安装比较简单,是一个可执行程序,直接图形化安装就行了。
Linux上的安装稍微复杂,需要有非常多的依赖包。简单起见,可以下载rabbitmq提供的zero dependency版本。下载地址https://github.com/rabbitmq/erlang-rpm/releases/tag/v23.2.7下载完成后,可以尝试使用下面的指令安装
rpm -ivh erlang-23.2.7-1.el7.x86_64.rpm
这样Erlang语言包就安装完成了。安装完后可以使用erl -version指令检测下erlang是否安装成功。
erl -version
RabbitMQ的安装方式有很多,我们采用RPM安装包的方式。安装包可以到github仓库中下载发布包。下载地址: https://github.com/rabbitmq/rabbitmq-server/releases/tag/v3.9.15
然后使用rpm -Uvh 指令安装RabbitMQ的rpm断包时,会报错,需要安装一个socat。
而这个socat我也在网上下载到了rpm安装包。
socat-1.7.3.2-1.1.el7.x86_64.rpm,但是安装时,却提示需要tcp_wrappers依赖。
rpm -ivh socat-1.7.3.2-1.1.el7.x86_64.rpm
这时,当然可以按他的提示去安装依赖包。但是我就没有这么做了。直接用yum安装这个socat依赖。在使用yum时,可以做一个小配置,将yum源配置成阿里的yum源,这样速度会比较快。
mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup
curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
yum makecache
然后安装socat
yum install socat
socat安装完成后,就可以安装RabbitMQ了。
rpm -Uvh rabbitmq-server-3.9.15-1.el7.noarch.rpm
安装完成后,可以查看下他的安装情况
whereis rabbitmqctl
启动RabbitMQ服务
service rabbitmq-server start
查看服务启动状态
service rabbitmq-server status
其他常用的启停操作:
rabbitmq-server -deched --后台启动服务
rabbitmqctl start_app --启动服务
rabbitmqctl stop_app --关闭服务
这样RabbitMQ服务就启动完成了。之后可以配置下打开他的Web管理页面:
rabbitmq-plugins enable rabbitmq_management
可以看到,这时需要重启RabbitMQ服务才能生效。重启后,就可以访问Web控制台了。访问端口http://localhost:15672。
这时,可以使用默认的guest/guest用户登录。但是注意下,默认情况下,只允许在localhost本地登录,远程访问是无法登录的。这时,可以创建一个管理员账户来登录。
rabbitmqctl add_user admin admin
rabbitmqctl set_permissions -p / admin "." "." "."
rabbitmqctl set_user_tags admin administrator
这样就可以用admin/admin用户登录Web控制台了。
在RabbitMQ中,一个节点的服务其实也是作为一个集群来处理的,在web控制台的admin-> cluster中可以看到集群的名字,并且可以在页面上修改。而多节点的集群有两种方式
需要数据的时候还要临时去别的节点拉取数据
这种模式会在镜像节点中间主动进行消息同步,而不是在客户端拉取消息时临时同步。
1∶需要同步集群节点中的cookie。
默认会在/ar/lib/rabbitmq/目录下生成一个.erlang.cookiq。里面有一个字符串。我们要做的就是保证集群中三个节点的这个cookie字符串一致。
我们实验中将worker1和worker3加入到worker2的RabbitMQ集群中,所以将worker2的.erlang.cookie文件分发到worker1和worker3。
2: 将worker1的服务加入到worker2的集群中。
首先需要保证worker1上的rabbitmq服务是正常启动的。然后执行以下指令:
rabbitmqctl stop_app
rabbitmqctl join_cluster --ram rabbit@worker2
rabbitmqctl start_app
–ram表示以Ram节点加入集群。RabbitMQ的集群节点分为disk和ram。disk节点会将元数据保存到硬盘当中,而ram节点只是在内存中保存元数据。
由于ram节点减少了很多与硬盘的交互,所以,ram节点的元数据使用性能会比较高。但是,同时,这也意味着元数据的安全性是不如disk节点的。在我们这个集群中,worker1和worker3都以ram节点的身份加入到worker2集群里,因此,是存在单点故障的。如果worker2节点服务崩溃,那么元数据就有可能丢失。在企业进行部署时,性能与安全性需要自己进行平衡。
这里说的元数据仅仅只包含交换机、队列等的定义而不包含具体的消息。因此,ram节点的性能提升,仅仅体现在对元数据进行管理时,比如修改队列queue,交换机exchange,虚拟机vhosts等时,与消息的生产和消费速度无关。
如果一个集群中,全部都是ram节点,那么元数据就有可能丢失。这会造成集群停止之后就启动不起来了。RabbitMQ会尽量阻止创建一个全是ram节点的集群,但是并不能彻底阻止。所以,综合考虑,官方其实并不建议使用ram节点,更推荐保证集群中节点的资源投入,使用disk节点。
然后同样把worer3上的rabbitmq加入到worker2的集群中。
加入完成后,可以在worker2的Web管理界面上看到集群的节点情况:
也可以用后台指令查看集群状态rabbitmqctl cluster_status
这样就完成了普通集群的搭建。再此基础上,可以继续搭建镜像集群。
通常在生产环境中,为了减少RabbitMQ集群之间的数据传输,在配置镜像策略时,会针对固定的虚拟主机virtual host来配置。
RabbitMQ中的vritual host可以类比为MySQL中的库针对每个虚拟主机,可以配置不同的权限、策略等。并且不同虚拟主机之间的数据是相互隔离的。
我们首先创建一个/mirror的虚拟主机,然后再添加给对应的镜像策略:
rabbitmqctl add_vhost /mirror
set_policy ha-all --vhost "/mirror" "^" '{"ha-mode":"all"}'
同样,这些配置的策略也可以在Web控制台操作。另外也提供了HTTP API来进行这些操作。
这些参数需要大致了解下。其中,pattern是队列的匹配规则,表示全部匹配。 ha \这样的配置表示以ha开头。通常就用虚拟主机来区分就够了,这个队列匹配规则就配置成全匹配。
然后几个关键的参数:
HA mode:可选值all , exactly,nodes。生产上通常为了保证高可用,就配all
通常镜像模式的集群已经足够满足大部分的生产场景了虽然他对系统资源消耗比较高,但是在生产环境中,系统的资源都是会做预留的,所以正常的使用是没有问题的。但是在做业务集成时,还是需要注意队列数量不宜过多,并且尽量不要让RabbitMQ产生大量的消息堆积。
这样搭建起来的RabbitMQ已经具备了集群特性,往任何一个节点上发送消息,消息都会及时同步到各个节点中。而在实际企业部署时,往往会以RabbitMQ的镜像队列作为基础,再增加一些运维手段,进一步提高集群的安全性和实用性。
例如,增加keepalived保证每fRabbitMQ的稳定性,当某一个节点上的RabbitMQ服务崩溃时,可以及时重新启动起来。另外,也可以增加HA-proxy来做前端的负载均衡,通过HA-proxy增加一个前端转发的虚拟节点,应用可以像使用一个单点服务一样使用一个RabbitMQ集群。这些运维方案我们就不做过多介绍了,有兴趣可以自己了解下。