MQTT Broker 选型

broker的主要职责是接受发布者发布的所有消息,并将其过滤后分发给不同的消息订阅者。
如今有很多的broker,下面就是一张关于各种broker对比的图片:

MQTT Broker 选型_第1张图片
image

目前我用过的有mosquitto和emqttd(2.0版本后改叫EMQ),因为目前的需求是希望做每秒10万以上的数据接入,所以需要考虑建立集群。但是在使用mosquitto的过程中发现他不支持集群,所以就放弃了,转投emqttd。
在使用mosquitto过程中发现了一些问题:
在使用mosquitto时,如果想使用集群的话,可能会需要进行二次开发。目前只支持桥接。并且他在遍历时的效率非常低,使得他无法支持大量的客户端或者操作过于频繁的操作(比如十万或百万级别的客户端同时发送数据)
emqttd有以下优点:

  • 可靠传输。MQTT可以保证消息可靠安全的传输,并可以与企业应用简易集成。
  • 消息推送。支持消息实时通知、丰富的推送内容、灵活的Pub-Sub以及消息存储和过滤。
  • 低带宽、低耗能、低成本。占用移动应用程序带宽小,并且带宽利用率高,耗电量较少。
  • 是中国人写的一个开源的项目,所以使用起来学习成本比较低,容易上手。

EMQ 2.0 (Erlang/Enterprise/Elastic MQTT Broker) 是基于 Erlang/OTP 语言平台开发,支持大规模连接和分布式集群,发布订阅模式的开源 MQTT 消息服务器。(抄自 EMQ官方文档)


一、MQTT Broker的需求

1、基本需求

1)支持 mqtt3.1 / mqtt3.1.1协议(可选 mqtt5.0)

3.1和3.1.1是最常见的协议版本,几乎目前生产的IoT设备都支持,所以Broker也必须支持。至于5.0版本,目前各大Broker都在努力支持,不过还需要一些时间才会普及。

2)支持QoS0、QoS1(可选QoS2)

各大厂商都至少支持了QoS1,保证消息到达。一般的场景下不会用到QoS2,所以可以选择性地考虑支持QoS2

3)支持遗嘱消息

这是必须支持的功能,通常设备断开都不是主动断开的,而是没有电了才断开,属于异常断开,需要设置遗嘱消息来通知后端服务或者其他设备进行后续处理。

4)支持持久化

一些数据如QoS1消息、持久Session,需要支持持久化,这是MQTT协议规定的。

5)支持多种连接方式

MQTT over TCP:最基础的连接方式

MQTT over Websocket:在Websocket之上做MQTT封装,对APP这种客户端来说很友好

MQTT over TCP/SSL:基础连接方式做通信加密,通常SSL采用TLS

MQTT over Websocket/SSL:Websocket做通信加密,通常SSL采用TLS

6)(可选 保留消息)

保留消息的利用场景几乎可以忽略,而带来的查询成本会很高(每次订阅主题都要查一遍有没有保留消息,再加上通配符匹配,时延很高),所以不一定需要支持,具体应用具体分析。

7)支持集群

Broker要支持保持海量MQTT连接,需要做集群。集群的难点在于Session的持久化和集群通信。我们既要持久化Session的各项数据,例如正在发送但未收到ACK的QoS1消息,又要保证提取速度,这就是矛盾的事情。而根据订阅信息在内存中构建的订阅树,需要整个集群同步,如何做集群同步也是一个难点。任何一个简单的功能,像发现相同ClientID则踢掉旧会话,一旦做到集群里,就是不容易处理的事情。

8)支持自定义验证方式

验证客户端的合法性有三点:CONNECT阶段验证是否允许连接、PUBLISH阶段验证是否允许发布、SUBSCRIBE阶段验证是否允许订阅。

CONNECT阶段需要验证ClientID、Username、Password、IP四项,不过大部分开源Broker都只支持Username和Password的验证。

PUBLISH、SUBSCRIBE的验证的目的是防止非法客户端订阅别人的主题,向别人的主题发布消息。但每台设备每次订阅、发布都要验证一次频率巨高,所以需要设计Cache和高效查询机制。

2、高级功能:支持共享订阅

共享订阅的具体含义是,多个客户端订阅同一个主题,消息只会被分发给其中的一个客户端。

共享订阅主要针对的是需要客户端负载均衡的场景,比如后端服务多个Worker,需要共享订阅来只让一个Worker得到数据。但仔细地想一想,后端服务一定有大量消息扇入,在Broker端用共享订阅可能会导致内存爆炸,还不如直接发到Kafka,利用Kafka的负载均衡来做。不过现在的Broker都在逐渐支持共享订阅,所以也是一个趋势吧。

二、MQTT Broker官方资料

官方相关链接:

mqtt官方整理的开源Broker简要列表

mqtt官方整理的开源Broker详细介绍

mqtt官方整理的开源Broker特性和性能对比

三、体验过的MQTT Broker及其对比

我以为物联网已经很成熟了,事实上最近才有大量产品上线,网上可以参考的内容不多。体验了很多开源Broker,开源的Broker根本不能直接上生产环境,只有商业版的HiveMQ和商业版的EMQ才满足了所有的需求。先列个表,这些已经算是比较优秀的Broker了,分析主要特性:

  • ✔ - 支持

  • ✘ - 不支持

  • ? - 不了解

  • § - 支持但做得不好(有限制)

MQTT Broker 选型_第2张图片
图片.png

1、mosquitto

【简介】

image

mosquitto是ecplise出的开源Broker,由C/C++语言编写,目前最新版v1.5.8,是一个开源MQTT Broker。

【官方文档宣称的特性】

协议:支持mqtt 3.1 / mqtt 3.1.1

【实际的使用限制分析】

“趁着年轻”大佬早在2013年就开始研究了,当时的版本是1.2.2,那时候还有一些基础的性能问题,比如用的poll而没有用epoll,内存方面没有优化,多线程主要靠加锁等等,预计可支持10W左右链接。于是大佬自己修改了一个版本kulv2012/mosquitto,优化了那些性能,这已经是五年前了……

同样的,“逍遥子”2015年在CSDN上分析了mosquitto1.2的源码,指出epoll需要优化、订阅树需要优化。将订阅树改为了HASH表,直接查找,限制了通配符订阅功能但速度提升明显。

mosquitto可以通过桥接的方式进行集群,桥接就是靠一个mosquitto实例去做转发,其他的broker可以转发给它而已,如果客户端切换节点,session就会消失,并且一旦中转Broker挂掉,整个集群就挂了,这是一种伪集群。“hui6075”在mosquitto上做了真集群hui6075/mosquitto-cluster,也就是自定义一些消息,session可以通过这些消息进行转移。

最新版本早就没有了那些性能问题,也早就从poll改为epoll了(忘了在哪儿看到的),目前正在努力支持mqtt5,出了一个MQTT5测试版,暂时还不支持共享订阅。

无论如何,总结一句话,mosquitto是为了嵌入式设备而生,正如官方的介绍,mosquitto足够轻量,可以运行在任何低功率单片机上,包括嵌入式传感器、手机设备、嵌入式微处理器,mosquitto用C语言编写、集群做的如此简单就是证明,它不适合用来做云服务的MQTT Broker。

【推荐延伸阅读】

mosquitto github开源代码

mosquitto 官方网站

趁着年轻:《Mosquitto pub/sub服务实现代码浅析-主体框架》

小诺Z《Mosquitto集群搭建》

逍遥子《mosquitto源码分析(一)》简介

逍遥子《mosquitto源码分析(二)》数据结构

逍遥子《mosquitto源码分析(三)》订阅树

逍遥子《mosquitto源码分析(四)》订阅树

逍遥子《mosquitto源码分析(五)》Poll和消息收发

逍遥子《mosquitto源码分析(六)》日志

逍遥子《Mosquito的优化——epoll优化(七)》

逍遥子《Mosquito的优化——订阅树优化(八)》

逍遥子《Mosquito的优化——其他优化(九)》

2、EMQ (emqttd)

【简介】

MQTT Broker 选型_第3张图片
image

EMQ是国人出产的一个开源Broker,已经用于很多企业生产了,几乎是目前的全能Broker了,文档和资料也非常齐全,但它是用Erlang语言编写的,这是一个不常见的语言。有两个版本2.0和3.0,最大的区别是3.0的集群化更好,支持集群共享订阅功能,2.0只支持本地共享订阅功能。同时3.0支持mqtt5.0,其他的都是一些性能优化。

【官方文档宣称的特性】

MQTT 3.1 / 3.1.1 / 5.0(EMQ3.0)

完整QoS支持

单节点100万连接

分布式集群或桥接(还支持mosquitto桥接、rsmb桥接)、脑裂自动愈合

LDAP, MySQL, PostgreSQL, Redis, MongoDB等验证插件

完整连接方式支持

API、Web监控界面

本地共享订阅(EMQ2.0)、集群共享订阅(EMQ3.0)

$SYS统计信息主题

自定义插件开发

【实际的使用限制分析】

几乎是完美的,只有一点限制,那就是开源版本不支持消息持久化:

EMQ 1.0 版本不支持服务器内部消息持久化,这是一个架构设计选择。首先,EMQ 解决的核心问题是连接与路由;其次,我们认为内置持久化是个错误设计。
传统内置消息持久化的 MQ 服务器,比如广泛使用的 JMS 服务器 ActiveMQ,几乎每个大版本都在重新设计持久化部分。内置消息持久化在设计上有两个问题:
1)如何平衡内存与磁盘使用?消息路由基于内存,消息存储是基于磁盘。
2)多服务器分布集群架构下,如何放置 Queue 如何复制 Queue 的消息?
Kafka 在上述问题上,做出了正确的设计:一个完全基于磁盘分布式 Commit Log 的消息服务器。
EMQ 2.0 版本将发布 EMQ X 平台产品,支持消息持久化到 Redis、Kafka、Cassandra、PostgreSQL 等数据库。
设计上分离消息路由与消息存储职责后,数据复制容灾备份甚至应用集成,可以在数据层面灵活实现。

这是MQTT的标准协议规定的啊,看完源码后发现它的普通Publish消息是持久化到分布式数据库Mnesia了(但是如果节点崩得多也会丢失),而离线消息队列是基于内存的,也就是Broker一崩消息就丢失了,很多人都在寻求解决方法,都没有好的方法。还有个问题是后端服务怎么接上去,EMQ的设计根本没提到后端服务的问题。大部分的解决方法都是编写一个插件,把MQTT消息丢到Kafka,后端服务处理Kafka的数据,但是后端服务除了收还要发呀,如果直接作为客户端连上去,Broker会内存爆炸因为后端服务要发送的消息太多了。如果你有好的想法,请一定要教教我。

【推荐延伸阅读】

EMQ github 源码

EMQ wiki

EMQ 官网

知乎:分布式开源物联网MQTT消息服务器EMQ怎么做数据的存储?

Dr_C《EMQ集成Kafka插件编写过程 emq_plugin_kafka》

响亮响亮《EMQ扩展插件-emq_plugin_kafka》

无脑仔的小明《物联网架构成长之路(3)-EMQ消息服务器了解》

无脑仔的小明《物联网架构成长之路(4)-EMQ插件创建》

无脑仔的小明《物联网架构成长之路(5)-EMQ插件配置》

无脑仔的小明《物联网架构成长之路(6)-EMQ权限控制》

无脑仔的小明《物联网架构成长之路(7)-EMQ权限验证小结》

无脑仔的小明《物联网架构成长之路(8)-EMQ-Hook了解、连接Kafka发送消息》

无脑仔的小明《物联网架构成长之路(12)-物联网架构小结1》

3、HiveMQ

【简介】

image

HiveMQ是企业级的Broker,用Java编写,代码真的赏心悦目。由于是收费的,没有公开的源码可以看,我只从一个反编译的大佬那里看到几张截图而已,只是一些截图就能够看到编写者的Java水平真的很高……

【官方文档宣称的特性】

MQTT 3.1 / 3.1.1 / 5.0

完整QoS支持

分布式集群支持

持久化支持

流量控制支持

完整连接方式支持

IPv6支持

集群共享订阅

$SYS统计信息主题

JMX性能监控

日志打印

Docker部署

……

【实际的使用限制分析】

功能上齐全得让人想哭,唯一的限制就是收费,没有任何源码可以参考。它的集群是基于Jgroups的,持久化的数据都是本地+Jgroups同步,自己编写了一套一致性Hash和VectorClock解决冲突……订阅树也是完整的订阅树,优秀的缓存和并发访问控制,集群进行数据同步。多线程和并发等用的google的guava进行防御性编程,实在是太厉害了。如果你有源码,请多发给我一份,我只是用来学习,谢谢!

【推荐延伸阅读】

HiveMQ官网

西安PP《MQTT---HiveMQ源码详解(一)概览》

西安PP《MQTT---HiveMQ源码详解(二)结构与启动》

西安PP《MQTT---HiveMQ源码详解(三)配置加载》

西安PP《MQTT---HiveMQ源码详解(四)插件加载》

西安PP《MQTT---HiveMQ源码详解(五)Netty-启动与Listeners加载》

西安PP《MQTT---HiveMQ源码详解(六)Netty-Handlers总览》

西安PP《MQTT---HiveMQ源码详解(七)Netty-SSL/NoSSL》

西安PP《MQTT---HiveMQ源码详解(八)Netty-WebSocket》

西安PP《MQTT---HiveMQ源码详解(九)Netty-Codec》

西安PP《MQTT---HiveMQ源码详解(十)Netty-Statistics》

西安PP《MQTT---HiveMQ源码详解(十一)Netty-Throttling》

西安PP《MQTT---HiveMQ源码详解(十二)Netty-MQTT消息、事件处理(流程)》

西安PP《MQTT---HiveMQ源码详解(十三)Netty-MQTT消息、事件处理(源码举例解读)》

西安PP《MQTT---HiveMQ源码详解(十四)Persistence-LocalPersistence》

西安PP《MQTT---HiveMQ源码详解(十五)Persistence-Cluster/Single》

西安PP《MQTT---HiveMQ源码详解(十六)TopicTree》

西安PP《MQTT---HiveMQ源码详解(十七)Cluster-Consistent Hashing Ring & Node Lifecycle》

西安PP《MQTT---HiveMQ源码详解(十八)Cluster-kryo与Serializer》

西安PP《MQTT---HiveMQ源码详解(十九)Cluster-Request/Response》

西安PP《MQTT---HiveMQ源码详解(二十)Cluster-Replicate/VectorClock》

西安PP《MQTT---HiveMQ源码详解(二十一)完结篇》

西安PP《MQTT---HiveMQ源码详解(外传)为什么使用Xodus》

4、MqttWk

【简介】

一个阿里大佬编写的基于 nutzboot + netty + redis + kafka 实现的MQTT服务开源broker,代码非常简洁干净,一看就懂。nutzboot是国人编写的类似于springboot的开源架构,它有一系列的产品,功能和代码外观都和spring全家桶很像,但比spring全家桶轻量。

【官方文档宣称的特性】

MQTT 3.1.1

完整的QoS服务

完整的连接方式

Kafka消息转发

集群功能

分发重试

【实际的使用限制分析】

1)MessageQueue没有排序:是直接插入Redis的key-value,并不是一个队列

2)消息分发重试很差:对于未确认的QoS1消息,只会在重新连接的时候下发,如果一直在线就会一直淤积

3)集群功能很差:用Redis的订阅发布当作消息总线来构建集群,而且我刚熟悉的时候还有问题(1.0.7版本),提交了issue后更新到1.0.8,不过集群这块还是不太好。

4)Kafka消息转发:只是单纯地转发而已,没有从后端服务接收消息的代码。而且用原始的代码去编写的转发(为了使用没有Kafka功能的nutzboot,没有用spring的Kafka相关注解)。

5)主题:主题有一些限制,不能以/结尾,不支持通配符订阅+

我当时还测试出了一些其他的问题,但是忘记了,而且这个项目竟然是上生产的项目……经历过2万设备连接,我在commitlog里面看到作者还写“不知道Redis会不会有性能问题”这种提交信息……不过代码真的非常非常清晰简洁,有助于理解MQTT协议交互过程。

【推荐延伸阅读】

MqttWk github 开源代码

开源中国:MqttWk介绍

MqttWk 码云 开源代码

5、Jmqtt

【简介】

image

jmqtt是一个大佬对开源Broker现状不满意,自己做出来的一个开源Broker。代码思路很清晰,尤其对CONNECT做了优化,而且Session的过期处理得也很好,编写了大量多线程代码,看得出是Java多线程高手。

【官方文档宣称的特性】

完整的QoS等级

支持MQTT、Websocket连接方式

支持RocksDB进行数据本地存储

【实际的使用限制分析】

不支持集群,不支持共享订阅,不支持SSL,MessageQueue不是队列……但是和大佬交流得最深,教了我很多东西,很感谢。

【推荐延伸阅读】

jmqtt github源码

jmqtt 中文自述

Ciciz:《MQTT Broker选型》

Ciciz:《IoT MQ设计篇:调研与协议选型》

Ciciz:《IoT MQ设计篇:开源or自研,系统复杂度分析》

Ciciz:《IoT MQ设计篇:基于开源项目二次开发的坑》

Ciciz:《IoT MQ设计篇:最终架构与jmqtt介绍》

6、Moquette 0.10

【简介】

image

0.10和0.12是两个核心版本,功能变化巨大,这里分开叙述。Moquette是我参考得最多的一个Broker了,它是唯一的功能齐全、Java语言编写的开源Broker,网上很多人都是以Moquette为基础进行开发的。Moquette怎么样呢,以研究HiveMQ的“西安PP”大佬的原话说——就是一个玩具项目……看和HiveMQ截图的源码成熟度对比其实我也能感觉出来。但免费的玩具只有这一个啊,没得挑。

【官方文档宣称的特性】

完整QoS服务

完整连接认证方式

多种持久化存储支持

集群支持

性能监控支持

【实际的使用限制分析】

“专注的力量”用它的代码进行压测,发现有内存泄漏问题,于是自己修复了这些东西,还支持了Redis持久化,发布了一个开源版本irubant/moquette。moquette的集群只是用了hazelcast作消息总线,不支持共享订阅,而且所有的消息都是广播的,也没有在不同Broker节点上相同clinetID相互踢下线的功能。没有消息重发机制,只会在重连的时候重发。订阅树编写得非常复杂,还不断地以CAS(比较并替换)操作在并发环境下更换根节点,会带来很多性能问题。

【推荐延伸阅读】

moquttte源码

moquette官网

专注的力量《开源MQTT中间件:moquette》

袁志健《从moquette源码看IOT接入协议MQTT的实现》

7、Moquette 0.12

【简介】

image

Moquette0.12将整个项目简化了,Jar包管理方式从Maven改为Gradle,不再支持集群,说是为了让人1分钟就能快速上手,放弃了Hazelcast说这种方式做集群不好,准备先支持MQTT5.0,再考虑做集群的事情。不过这个版本改进了订阅树,还支持了重发未ACK的消息,MessageQueue也采用了Queue,去掉了大部分持久化方式,只保留H2。

【官方文档宣称的特性】

支持完整QoS

支持完整连接认证方式

【实际的使用限制分析】

完全地退化……不过代码更清晰一点了,各个功能模块划分得更清楚。但是单机是最大的缺陷,很难改成集群,几乎要全改。

8、其他

最近又出了一些新的Broker,例如基于moquette的cassandana,宣称已经用于生产,还有一些新特性,想去看看源码是怎么写的。

至于Apache ActiveMQ、Apache ActiveMQ Artemis这种基于消息队列制作的MQTT Broker还没有使用过,只是看了一些文章说有性能问题。

你可能感兴趣的:(MQTT Broker 选型)