云燕飞

iot架构 mqtt netty_百度IoT：MQTT Broker架构设计

前言

百度IoT的Broker设计我特别想参考的但是技术能力和时间不够去实现……网上只有一篇百度工程师的总结《共享行业的分布式MQTT设计》，这里将围绕这篇文章去讲解。

一、Broker集群架构

单机版MQTT Broker有连接数量和并发处理能力的限制，因此分布式必不可少。百度IoT采用的Akka Cluster来做集群管理，每个节点对等，不存在像Mosquitto这种用一台机器“桥接”做分布式产生的单点故障隐患。每个节点监听MemberUp、MemberDown、MemberUnreachable、ClusterMemberState等事件来感知其他节点的上下线，用Akka Actor实现节点间的消息通信。

二、Broker服务框架

百度Broker抽象了很多服务包括：

(1)Authentication Service、Authorization Service

MQTT的CONNECT阶段提供username和password，Broker可以用这些数据对客户端身份进行校验，我们称为验证(Authentication，AE)；MQTT的PUBLISH、SUBSCRIBE阶段，需要对客户端订阅主题、发布主题进行权限控制，比如只能订阅含有自己DeviceID的主题，避免客户端订阅他人的主题窃听信息，我们称为鉴权(Authorization，AO)。

百度Broker提供用户名、密码的认证，以及每个客户端对哪些主题可读、可写。实现上，数据全保存在Mysql，通过内存或Redis做Cache加速，Cache回收策略为LRU。

百度这样的做法只适合于固定权限的控制，比如设备拥有的权限几乎相同，而且都是订阅格式相似的主题，只有其中的clientID不同而已，就可以做。如果有权限动态变化、设备粒度划分更细致的情况，采用Mysql+Redis就行不通了。

(2)Session Manager

MQTT定义了两种会话：持久会话(Persistent Session)、非持久会话(Transient Session)。持久会话在客户端断开重连后，之前的订阅数据、离线期间接收的消息依然存在；非持久会话断开连接就清空所有数据。对分布式Broker而言，如何实现持久会话就是一个难点。百度Broker的策略是，持久会话每个Broker都会同步一份，即使Broker宕机，其他Broker上也有相应的信息，以解决高可用问题；非持久会话放在内存里，只在连接的Broker上存在，连接断开或Broker崩溃后清空。

文中没有提到如何解决跨区问题(跨区时延高容易掉线，最好不做集群而是做数据同步，多个区域的Broker Session应该如何同步)，以及Session每个节点都同步一份导致内存随设备数量线性增长的问题。

(3)Event Service

负责将每个Broker上发生的连接事件、断开连接事件、订阅事件、取消订阅事件通过Event Service发送给每个Broker，以达到同步的目的，类似于消息总线。实现上采用的Kafka，没有采用Akka通信的原因是这些事件需要持久化，比如Broker崩溃、网络波动后之前发送的未被消费的事件还存在。

文中没有提到订阅事件、取消订阅事件如何处理顺序消费的问题，因为订阅和取消订阅先后顺序会影响Session的同步，比如同一个主题，客户端取消订阅事件先于订阅事件被消费，会导致一直订阅着某个主题；相反订阅事件先于取消订阅事件，会导致订阅丢失。通过kafka的方式，如果用了重试策略保证可靠性，就可能导致这些问题。虽然客户端订阅后马上取消订阅这种情况几乎不存在，都是上线后订阅、下线前取消订阅。

(4)Session State Metadata Service

负责持久化Session元数据，它从Event Service接收数据，然后决定哪些数据需要持久化到Hbase存储，比如持久会话的订阅、取消订阅数据。

(5)Queue Service

管理和分配Queue。根据Session类型不同，分为持久队列(Persistent Queue)、非持久队列(Transient Queue)，用于消息下发和离线消息存储。Persistent Queue基于Hbase实现，Transient Queue是内存实现。

(6)Quota Service

管理并发连接数、上行带宽、下行带宽限制。

(7)Metric Service

监控并发连接数、并发消息数、当前流量、服务运行指标(CPU、内存、网络吞吐)

三、连接层

百度的连接层编解码架构如下：

百度Broker连接层采用Netty NIO框架，目前大多数MQTT Broker也都是这样做的，没有任何问题。提供四种基本方式：MQTT TCP、MQTT TCP+TLS、MQTT Websocket、MQTT Websocket+TLS。现在SSL大多指代TLS，SSL是早期版本(现在很多组件已经弃用)，后来都升级到TLS了，TLSv1/1.1/1.2/1.3是目前最常用的版本，很多组件原生支持TLS全版本，所以开发很简单不必担心，可以参考开源Broker Moquette。而且我们经常会使用负载均衡器LB来终结SSL，终结的意思是LB对外提供SSL的接口，转发进来的数据都是TCP了，EMQ也推荐使用这种方式，经历过云平台搭建的大佬们也都推荐使用这种方式，因为SSL编解码会消耗CPU，由LB来做完SSL处理，前端连接机器负载会小很多，连接就会更稳定不容易崩溃。所以最后只要做TCP、Websocket两种方式就好了。MQTT Websocket指的是，将MQTT协议作为subprotocol，利用Websocket来透传MQTT协议数据。

四、持久化Session的处理方式

持久化Session，需要同步Session信息到每台机器，每台机器都有全局Session(相当于无状态)。当Broker宕机时，Session中的订阅数据依然存在，所以可以由其他Broker将Publish消息作为离线消息存入客户端在HBase对应的队列中去；当客户端从其他Broker重连时，Session的数据还在、HBase保留了掉线期间的全部消息并会在CONNECT阶段下发给客户端，客户端不会丢失任何信息。

4.1 连接阶段和虚拟队列

连接阶段没有相应的描述，这一段只是推测，流程图如下：

(1)客户端以持久Session向连接节点Broker1发起MQTT-CONNECT请求，请求连接

(2)Broker1接收请求，产生连接事件，发往Event Service

(3)Event Service(Broker1上的)将订阅事件发布到Kafka

(4)Event Service(多个Broker上的)从Kafka消费订阅事件消息

(5)Event Service(多个Broker上的)将消息分发给各自的Broker

(6)每个Broker都会创建对应的Session，包含了连接信息

(7)其他节点往连接节点Broker1发一个内部通信消息，表明连接结果

(8)连接节点Broker1综合连接结果，下发CONNACK给客户端，连接阶段结束

4.2 订阅消息流程

订阅主题的事件消息会发往Event Service，每个Broker都会订阅Event Service的数据，对于持久化Session，在接收到订阅事件后，会创建对应Session的订阅信息。也就是说，每个客户端产生的订阅、取消订阅操作，会被广播给所有Broker节点，Broker接收到后对内部的订阅树、Session等数据结构进行增删，保持订阅信息的一致性。

订阅的流程图如下：

(1)客户端以持久Session向连接节点Broker1发起MQTT-SUBSCRIBE请求，请求订阅主题

(2)Broker1接收请求，产生订阅事件，发往Event Service

(3)Event Service将订阅事件发布到Kafka

(4)Event Service(多个Broker上的)从Kafka消费订阅事件消息

(5)Event Service(多个Broker上的)将消息分发给Broker

(6)每个Broker都会创建对应的Session，记录这个客户端的订阅信息

(7)其他节点往连接节点Broker1发一个内部通信消息，表明订阅结果

(8)连接节点Broker1综合订阅结果，下发SUBACK给客户端，订阅结束

这里提到了一个虚拟队列(Virtual Queue)的概念。我们都知道MQTT要求持久化Session要缓存离线消息和未确认的QoS1消息，常用的做法就是把这些消息放到一个队列里面。对于单点而言，只需要放到内存就可以了，因为客户端只会连接一个节点；对于分布式而言，由于客户端可能会切换节点，放到一台机器的内存里在另一台机器上就无法访问了，百度采用了通用的分布式系统处理数据一致性的方案：计算和存储分离——将存储层单独做成一个集群，计算层做一个“虚拟队列”，只记录队列的状态，当需要获取数据时就利用这些“队列元数据”去存储层获取，保证无论在哪个节点上线，都可以获取到数据。

做队列存储的难点在于，目前并没有组件直接提供所需队列功能。第一个肯定会想到使用消息队列(Message Queue， MQ)，但是分析下需求，我们需要海量的(和客户端同数量级)、较小的(每个队列可能最多100条消息)队列，目前类似Kafka这样的MQ，都是少量的(Kafka上百个Topic就会速度慢下来)、海量的(囤积大量待消费消息)队列，所以根本不符合需求。第二个想到的就是Redis，像Redisson这样的工具提供了队列的功能，实现上是将Lua脚本发送给Redis执行来实现队列的功能，但Redis用的是内存比较贵，并且Redis更适合做缓存而不是持久化存储。第三个就是自己研发了，有大佬自己基于RocketMQ研发了海量小消息队列，而百度是基于HBase数据库做的海量小消息队列，阿里也有一个基于HBase制作的HQueue，不过是收费的不开源。有关百度HBase队列实现细节将在后面叙述。

4.3 接收消息流程

接收消息的流程图如下：

(1)客户端2发布一条消息给Broker2(不考虑QoS，因为QoS0也是可以这样操作的)

(2)Broker2拥有全局Session，发现客户端1订阅了这个主题，因此将消息写入客户端1的虚拟队列

(3)Broker2向Broker1发送一个通知(Notification)消息，告诉它有新消息可以消费了

(4)Broker2从虚拟队列读出数据，然后发布给客户端1，发布-接收流程结束

我们分析一下宕机高可用的原理。当Broker2因为进程挂掉、掉电、网络波动等等宕机了造成客户端1掉线，Broker2会继续往HBase写客户端1待消费消息，HBase是集群因此高可用；等到客户端1从Broker3重新连接，然后在CONNECT阶段触发离线消息推送，一样可以接收到全集信息，本应该收到的数据并不会减少，如下图所示。

同时我们可以推测百度QoS1的收发实现，一定是写入HBase成功以后，再回复PUBACK；一定是下发消息成功(收到PUBACK)以后，再删除HBase的数据。

五、非持久化Session的处理方式

5.1 连接阶段

连接阶段没有相应描述，推测会在连接节点Broker上创建连接信息，但并不会同步给其他节点：

5.2 订阅消息流程

订阅消息没有相应描述，推测：同样会利用Kafka进行订阅事件分发消费(更新订阅树)，因为其他节点需要知道这个Broker上有客户端订阅了某个主题

但只在连接节点Broker上创建Session记录订阅信息和虚拟队列(更新Session)，并且虚拟队列直接用内存来做，因为非持久化Session离线后不需要保存

5.3 发送消息流程

订阅消息描述不清晰，推测流程图如下：

(1)客户端2发送一条消息给Broker2

(2)Broker2发现Broker1上有订阅者，因此将消息直接发给Broker1

(3)Broker1发现客户端1订阅了这个主题，将数据写入对应内存队列

(4)Broker1向Broker2回送一个Event，表明自己成功收到了数据并处理完毕

(5)Broker1从内存队列读取数据，然后将数据下发给客户端1

六、Event Service的数据压缩

Event Service会将持久化Session相关的数据(连接/断开连接事件、订阅/取消订阅事件)放入Kafka，当一个新的Broker加入集群，首先就要将持久化的Session信息全部加载。如果都是从Kafka主题头部开始消费数据的话，可能会花费很久的时间，因此需要对数据进行压缩。压缩做的事情就是保存这些事件消费后产生的最终效果，举个例子，比如订阅我们用订阅树来存储，如果从头消费，需要一根一根分支去插入、删除，模拟客户端做的操作；如果直接保存最后的订阅树在内存中的结果，这些操作就都可以不做了。消费流程解释得不详细，这里按我的理解和推测来描述，流程图如下：

(1)Broker新上线，从HBase取出压缩的数据，构建初始数据结构

(2)从检查点开始消费Kafka的数据

(3)消费到最新一条后，上线完成，新的Broker和其他Broker没有任何区别

原文中只描述了SUBSCRIBE/UNSUBSCRIBE事件的压缩，我认为CONNECT/DISCCONECT事件的数据也需要进行压缩，压缩原理一致。

七、基于HBase的分布式消息队列

HBase本身不提供Queue的功能，但我们可以利用HBase的特性来实现Virtual Queue的概念。

整体描述：如图所示，有4个客户端，每个客户端对应一个虚拟队列Virtual Queue。我们为每个客户端分配一个唯一的(unique)QueueID，这样每个队列可以用QueueID+单调递增ID来组合成一个唯一的RowKey。为了保证写入的均匀性，避免热点问题，我们设计合理的唯一ID前缀(Prefix)来将这些RowKey均匀地分布到不同的Region。为了实现Queue的功能，我们在HBase上定义一个协处理器(CoProcessor)，用作创建Queue、管理Queue的入队出队等操作、删除Queue、修改Queue的配额等等，HBase的Coprocessor类似于Redis的Lua脚本。

7.1 Region Split算法

作用

我们希望所有的Queue能够均匀地分布到各个Region里面去，需要设计一个特殊的前缀作为分割条件(PatitionKey → Region)

名词解释TenantID：百度IoT采用的多租户架构(将在后面叙述)，所以有一个TenantID，对于一个企业而言这个ID是常量。

clientID：MQTT协议的clientID，百度用的是单调递增的64bit Long

QueueID：前文提到的一个客户端对应一个队列，用于唯一标记客户端队列的ID

算法流程

(1)定义客户端的QueueID为reverse{clientID}_TenantID，其中reverse的含义是字符串反转。

(2)PartitionKey设定为log2(REGION_NUM)，其中REGION_NUM是预期的region数量

算法解析

百度的clientID是系统生成的、单调递增的64位长整型，加入预期region数量为128个的话，可以用前log2(128)=7比特的变化来映射到对应region。但由于数字的前面高位部分变化幅度低(要增长1W个数字万位才会进1)，而后面低位数字变化剧烈(每增长1个都会变)，我们需要的只是0~127的剧烈变化，所以将clientID进行翻转，取前8bit来做映射。

7.2 保证写入消息的有序性

我们为每个客户端的每条消息都分配一个唯一ID，记为QueueID_ID，其中QueueID为队列ID(

reverse{clientID}_TenantID )，后面的ID为单调递增64位长整型ID。例如一个客户端的消息ID可能是：3134_BAIDU_234，代表BAIDU这个租户下的第3134个客户端的第234条消息。

消息都是批量(batch)写入的，当批量写入Coprocessor后，先获取该Queue的锁，然后分配ID，再将数据写入HBase，最后释放锁。这里的锁粒度是Queue级别(客户端级别)，可以保证多个Broker并发写入一个客户端的Queue时不会发生冲突。

7.3 读取Queue数据

我们会为每个Queue保存该Queue在HBase的最小ID、最大ID，如果该Queue的最小最大ID在内存缓存中过期或丢失(比如很久没有读写队列消息了)，就通过HBase的scan操作来重新获取一次最小最大ID，再缓存在Cache里。每一次读取特定长度的数据，保证每次数据的量级不会太大。读取的时候并不需要锁，因为读取只可能是客户端自己在读取，任何时刻读请求只可能来自一台机器的一个客户端。

7.4 删除Queue的数据

对于已经读取的数据，需要删除掉。由于我们的数据都是有序的，所以删除的时候只需要告诉Coprocessor删除多长的数据，然后根据最小ID、offset可以计算出要删除的RowKey，然后执行batch delete即可。删除同样不需要锁，任何时刻删除请求只可能来自一台机器的一个客户端。

7.5 HBase的使用考虑

由于HBase不存在官方的异步读写库(async library)，目前只有openTSDB提供一个版本，而百度IoT利用coprocessor增加了一个新的endpoint，openTSDB的asnyc library却并不支持coprocessor，所以百度IoT自己扩展了async的库，最终用的自己研发的asnyc library的coprocessor库处理数据。

同时，MQTT的消息属于快速消费(short lived)的消息，基本上写入后会被立刻读出，所以百度做了2.0版本，做内存压缩(in memory compaction)，不需要将数据写入HFile，只需要写WAL日志，这样可以极大的降低HDFS文件系统的IO，解决了HDFS文件系统瓶颈问题，不过这个版本还没有正式发布。

相关参考资料：

7.6 提供多种Queue的选择

基于HBase的这种Queue更适合小型客户端，比如APP、嵌入式IoT设备等等，对于大规模扇入场景，例如有一个后端服务需要统计数据，要求100W设备都往同一个主题发送消息，基于HBase的Queue只能有一个TCP来处理数据，后端服务肯定处理不过来会有大量消息堆积。所以百度还推荐使用Kafka来应对这种情况，将数据发往Kafka主题，然后利用Kafka的负载均衡客户端来并发消费消息。除了HBase、Kafka、内存，百度IoT还提供Redis做Queue。

八、多租户架构

百度是一个大平台，肯定不止为一家公司服务，所以用多租户架构来提供IoT Broker功能。

一个IoT Hub上会有很多租户的MQTT Broker，每个Broker对应一个tenant，每个Broker都有自己的Authentication Service, Session manager, Queue Service，以及很多其他的公共服务，比如Unique Id Generator，Backend Sorage Service等等。当客户端通过MQTT/TCP建立连接，云端通过username来区分对应哪个tenant，因此要求username必须为{tenent Name}/{client Name}，取出username、password之后，先算出对应client的tenant name，然后拿到该tanent对应的Broker实例，调用该Broker的Auth Service验证客户端身份。

九、Baidu IoT Hub vs EMQ官方测试结果

1、测试信息

(1)测试机配置：配置参数值

Vender IDGenuine Intel

CPU Family6

Model45

Model NameIntel(R) Xeon(R) CPU E5-2620 0 @ 2.00GHz

核心数12

内存大小132137288KB(约126GB)

(2)测试场景：一半PUBLISH和一半SUBSCRIBE，每一个pub对应一个sub，也就是说通过唯一主题关联起来，这种场景是对MQTT协议最严格的考验，其他场景相对来说CPU消耗会少一些

(3)消息Payload大小：1024B(1KB)

(4)Queue类型：内存Queue(因为EMQ只有内存Queue)

文中并没有提到EMQ的版本。

2、测试结果

MPS：message per seconds，每秒消息量。由于Pub和Sub是一一对应的，所以这里指的消息量是PUBLISH的QPS，总体QPS是这个值的2倍。产品连接数预期MPS实际MPS平均CPU IDEL平均时延(ms)丢失率

百度50万20K19.2K34%3830%

EMQ50万20K19.2K26%18210%

百度50万10K9.2K58%2890%

EMQ50万10K9.2K44%2810%

百度20万50K42.5K14%3810.0000314%

EMQ20万N/A测试未返回

百度20万40K39.7K19%4090%

EMQ20万40K38.4K10%174560.0349%

百度20万20K19.7K37%1520%

EMQ10万20K19.7K33%4490%

百度10万50K48.9K13%3150.000272%

EMQ10万50K31.7K11%80140%

百度10万40K39.7K19%2090%

EMQ10万40K31.7K11%80140%

百度10万30K29.9K26%1520%

EMQ10万30K29.9K19%27270%

百度10万30K19.8K37%1130%可用MPS对比(无丢包、时延小于0.5s)

连接数百度可用MPSEMQ可用MPS

10万40K(19%IDLE)20K(24%IDLE)

20万40K(19%IDLE)20K(33%IDLE)

50万20K10K

3、官方测试结论

同等连接数下，百度Broker的可用最大吞吐量在EMQ的1~2倍之间。

十、总结

目前很多公司产品经理提的需求动不动就要支持上千万的IoT设备，肯定是要采用类似百度Broker的设计架构。但百度IoT只有这一篇文章，其中的很多细节依然不清楚，并且有自研成分在里面，小公司的普通开发者根本无法参考，所以只是提供了一个思路。MQTT Broker的难点就在于，它有持久Session，前端的连接节点无法做到无状态，会产生两个核心问题：离线消息如何存储和分发、集群如何通信，百度给出的答案是，自研基于HBase的Queue存储离线消息，使用对等节点Akka Cluster做集群通信(然而没有考虑可用区分区的问题，也没有细讲订阅数据同步)。希望以后越来越多的大公司可以开源讲一讲MQTT Broker的思路。

物联网（IoT）系统中，数据采集器拿来即用小赖同学啊人工智能智能硬件物联网
在物联网（IoT）系统中，数据采集器（也称为网关或数据集中器）扮演着至关重要的角色，主要负责从各种传感器和设备中收集数据，并将其转换为统一的格式后传输到云端或本地服务器进行处理和分析。以下是关于数据采集器的设计要点、功能需求以及实现方案：一、数据采集器的核心功能数据中转：从传感器、设备或其他数据源收集数据。将数据转发到云端、本地服务器或其他目标系统。数据格式统一化：将不同协议、不同格式的数据转换为
在Mac M1/M2芯片上完美安装DeepCTR库：避坑指南与实战验证 ku_code_ku 机器学习 macos 推荐算法推荐系统
让推荐算法在AppleSilicon上全速运行概述作为推荐系统领域的最经常用的明星库，DeepCTR集成了CTR预估、多任务学习等前沿模型实现。但在AppleSilicon架构的Mac设备上，安装过程常因ARM架构适配、依赖库版本冲突等问题受阻。本文通过20+次环境搭建实测，总结出最稳定的安装方案。关键版本说明（2024年验证）组件推荐版本注意事项Python3.10.x向下兼容至3.7，但3.1
软件架构设计艺术（从一个案例出发，成为优秀的软件架构师）编码时空的诗意行者软件架构设计开发语言系统架构软件设计设计模式
架构（建模）本质上是一种抽象，其目的是通过归类来减轻认知负担，避免重复思考和工作，提升计算能力。“通用”是建模的第一步，而“复用”则是确保建模有效性的关键。通过将共享属性或行为提取成独立模型，可以提高系统的灵活性和扩展性，同时也减少了错误的可能性。案例假设一家汽车经销商销售新车，并提供售后服务。客户可以在经销商处购买新车，如果车辆出现问题，可以返回经销商进行维修。我们准备为这家公司业务提供线上管理
OpenSSH详解：构建安全远程管理的核心技术 ScilogyHunter 常见软件库安全 OpenSSH
OpenSSH详解：构建安全远程管理的核心技术引言在数字化时代，远程管理服务器和数据传输的安全性至关重要。OpenSSH（OpenSecureShell）作为SSH协议的开源实现，通过加密通信、身份验证和数据完整性保护，彻底解决了传统工具（如Telnet、FTP）的明文传输风险。本文将从核心原理、配置实践到高级功能，全面解析OpenSSH的技术细节与应用场景。一、OpenSSH的核心架构与工作原理
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
构建 Python 插件架构：打造灵活可扩展的模块化应用全栈探索者chen python python 架构开发语言学习机器学习程序人生插件
构建Python插件架构：打造灵活可扩展的模块化应用前言在现代软件开发中，单一的代码库往往难以满足不断变化的业务需求和多样化的扩展场景。如何设计一个应用，使其既能保持核心功能的稳定，又能轻松集成第三方功能、模块或定制化扩展？答案就是——插件架构。通过插件架构，你可以让应用具备极高的灵活性，支持动态加载、无缝扩展以及解耦维护。本文将深入探讨如何在Python中设计和构建一个插件架构。从核心概念、模块
基于WebAssembly的浏览器密码套件闲人编程 wasm 服务器易于集成跨平台性密码套件浏览器 WebAssembly
目录一、前言二、WebAssembly与浏览器密码套件2.1WebAssembly技术概述2.2浏览器密码套件的需求三、系统设计思路与架构3.1核心模块3.2系统整体架构图四、核心数学公式与算法证明4.1AES-GCM加解密公式4.2SHA-256哈希函数五、异步任务调度与GPU加速设计5.1异步任务调度5.2GPU加速六、GUI设计与功能模块七、完整代码实现九、代码自查与总结十、总结与展望一、前
基于 C++ 类的程序设计模式与应用研究饼干帅成渣 c++开发语言
摘要C++语言凭借其强大的功能在软件开发领域占据重要地位，类作为C++面向对象编程的核心，承载着数据封装、代码复用等关键使命。本文深入剖析C++类的基础概念、核心特性及其在实际编程中的应用。通过详细阐述类的定义、成员构成、访问控制以及封装、继承、多态等特性，结合具体代码示例展示其在构建软件架构中的作用。同时，探讨C++类在应用中面临的常见问题及解决方案，为开发者高效运用C++类进行程序设计提供有力
庖丁解java(一篇文章学java) 庖丁解java java 开发语言 spring boot 后端
(大家不用收藏这篇文章,因为这篇文章会经常更新,也就是删除后重发)一篇文章学java,这是我滴一个执念...当然,真一篇文章就写完java基础,java架构,java业务实现,java业务扩展,根本不可能.所以,这篇文章,就是一个索引,索什么呢?请看下文...关于决定开始写博文的介绍(一切故事的起点源于这一次反省)中小技术公司的软扩展(微服务扩展是否有必要?)-CSDN博客SpringCloud(
我与DeepSeek读《大型网站技术架构》- 总结诺亚凹凸曼架构
文章目录读后感一、总结二、反思三、创新四、展望当代大型网站架构一、架构分层模型二、关键组件与技术选型三、架构演进策略四、架构突破口读后感一、总结架构演化优先于设计大型网站架构不是预先设计的产物，而是通过反复迭代和试错演化形成的。技术选型的核心动机是对业务需求的深刻理解，而非盲目模仿。典型案例包括淘宝架构因业务爆发力被迫转型为分布式系统。开放与协作的价值互联网的开放生态通过API经济（如淘宝Open
深入探讨Spring MVC：原理、架构与实践 luckilyil 开发框架 spring mvc 架构
SpringMVC原理与架构解析1.SpringMVC概述SpringMVC是Spring框架中的一个模块，专注于实现Web应用的MVC设计模式。它通过将应用逻辑分为模型（Model）、视图（View）和控制器（Controller），使得开发人员能够清晰地组织代码，提高开发效率和可维护性。2.SpringMVC的核心组件SpringMVC的核心组件包括：DispatcherServlet：作为前
如何设计一个高可用的 Seata 集群？码农技术栈 java spring boot spring cloud 微服务架构 spring
——从零搭建永不宕机的分布式事务协调系统一、为什么需要高可用Seata集群？在分布式系统中，事务协调器TC是全局事务的“大脑”。一旦TC单点故障：灾难性后果：所有进行中的全局事务将卡死，业务完全不可用数据不一致风险：已提交的事务可能无法完成最终提交或回滚因此，构建高可用Seata集群是生产环境的必选项！二、Seata高可用架构设计核心要点1.TC集群化部署多节点部署：至少部署3个TC实例（奇数节点
SpringCloud框架下的注册中心比较：Eureka与Consul的实战解析耶耶Norsea 网络杂烩 spring cloud
摘要在探讨SpringCloud框架中的两种注册中心之前，有必要回顾单体架构与分布式架构的特点。单体架构将所有业务功能集成在一个项目中，优点是架构简单、部署成本低，但耦合度高。分布式架构则根据业务功能对系统进行拆分，每个模块作为独立服务开发，降低了服务间的耦合，便于升级和扩展，然而其复杂性增加，运维、监控和部署难度也随之提高。关键词SpringCloud,注册中心,单体架构,分布式架构,服务拆分一
程序员晋升架构师实战指南甘苦人生职业规划职场和发展
以下是为程序员量身定制的晋升架构师实战指南，结合行业案例与可落地路径，助你完成技术跃迁：一、晋升路径拆解（从Code到Architecture）程序员→高级工程师核心任务：独立完成模块开发（需求分析+方案设计+编码实现）技术重点：掌握1-2门核心语言（如Java/Go）、熟悉主流框架（SpringCloud/Dubbo）案例：主导用户中心模块开发，通过缓存优化将接口响应时间从800ms降至150m
Spring Cloud Config 快速介绍与实例 oscar999 Spring Boot实战开发大全 Spring Boot Cloud Config
SpringCloudConfig是什么？SpringCloudConfig是一个用于分布式系统的配置管理工具，提供集中化的外部配置支持。它适用于微服务架构，能够将各个服务的配置集中存储在服务端（如Git仓库），客户端按需动态获取配置，解决了配置分散、环境切换复杂等问题。SpringCloudConfig核心概念ConfigServer：配置中心服务端，统一管理配置，支持Git、本地文件等存储方式
万字深度解析：DeepSeek-V3为何成为大模型时代的“速度之王“？羊不白丶大模型算法
引言在AI军备竞赛白热化的2024年，DeepSeek-V3以惊人的推理速度震撼业界：相比前代模型推理速度提升3倍，训练成本降低70%。这背后是十余项革命性技术的叠加创新，本文将为您揭开这艘"AI超跑"的性能密码。DeepSeek-V3的技术路径证明：计算效率的本质是知识组织的效率。其MoE架构中2048个专家的动态协作，恰似人脑神经网络的模块化运作——每个专家不再是被动执行计算的"劳工"，而是具
202.HarmonyOS NEXT系列教程之图案锁错误处理机制详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之图案锁错误处理机制详解效果预览1.错误处理架构1.1错误类型定义//振动功能错误处理try{vibrator.startVibration({type:'preset',effectId:'haptic.clock.timer
亿级流量架构网关设计思路，常用网关对比，写得太好了。。 wadfdhsajd java 后端框架大数据
什么是网关网关,很多地方将网关比如成门,没什么问题,但是需要区分网关与网桥的区别,网桥工作在数据链路层，在不同或相同类型的LAN之间存储并转发数据帧，必要时进行链路层上的协议转换。可连接两个或多个网络，在其中传送信息包。网关是一个大概念，不具体特指一类产品，只要连接两个不同的网络都可以叫网关,网桥一般只转发信息,而网关可能进行包装。网关通俗理解根据网关的特性,举个例子:假如你要去找集团老板(这儿只
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现） @M_J_Y@ 目标检测 YOLO 计算机视觉目标检测 python
YOLOV8多模态(可见光+红外光，基于Ultralytics官方代码实现）各位读者麻烦给个star或者fork，求求了。YOLOV8双分支模型架构图YOLOV8多模态目标检测前言：环境配置要求1.数据集DroneVehicle数据集(可见光+热红外)2.数据集文件格式(labeles:YOLO格式)3.权重文件下载4.配置模型yaml文件和数据集yaml文件5.训练6.测试7.打印模型信息8.o
【软考系统架构设计师】计算机网络① TCP/IP协议族万猫学社软考系统架构设计师简明教程软考系统架构设计师架构师系统架构网络
>>回到总目录2)2^n(n>2)2n(
Deepseek和豆包在技术创新方面有哪些相同点与不同点？ alankuo 人工智能
Deepseek和豆包在技术创新方面的相同点与不同点如下：相同点架构基础：都以Transformer架构为基础进行开发。Transformer架构能有效处理长序列数据，捕捉文本语义信息，为模型性能提供基础。混合专家模型（MoE）应用：都采用了MoE架构。该架构将模型拆分为多个“专家”，训练和推理时让不同“专家”负责不同任务或数据子集，提高模型表达能力和效率，降低训练成本。模型优化以提升性能：都通过
Orange 单体架构 - 快速启动 mmd0308 Orange 开源项目架构开源
1后端服务1.1基础设施组件说明版本MySQLMySQL数据库服务5.7/8+JavaJava17redis-stackRedis向量数据库最新版本Node安装Node22.11.0+1.2orange-dependencies-parent项目Maven依赖版本管理1.2.1项目克隆GitHubgitclonehttps://github.com/hengzq/orange-dependenci
SAP-ABAP：SAP BW模块架构与实战应用详解爱喝水的鱼丶 ABAP开发之必须知道的 VIP详情查看专栏 SAP-ABAP开发基础详解开发语言 SAP ABAP ERP 开发运维
SAPBW模块架构与实战应用详解—##一、核心架构分层设计###1.数据仓库层（DataWarehousingLayer）|组件|功能说明|典型对象||-------------------|--------------------------------------------------------------------------|-----------------------------
SAP-ABAP：SAP生产业务（PP模块）全流程深度解析爱喝水的鱼丶 VIP详情查看专栏 SAP ABAP 开发运维运维系统架构
SAP生产业务（PP模块）全流程深度解析一、生产主数据架构体系1.主数据矩阵物料主数据工艺路线工作中心生产版本MRP运行2.核心主数据表数据对象表结构关键字段事务码物料主数据MARAMATNR,MTART,DISMMMM01工艺路线PLKO/PLPOPLNNR(路由号),VORNR(工序)CA01工作中心CRHD/CRTXARBPL(工作中心),KAPAR(能力)CR01BOMMAST/STPOS
深夜惊魂：当监控告警“撒谎”时，SRE 如何逆风翻盘？ YAMLMaster kubernetes 运维开发 devops 容器云原生
Yorkshire,England引言我们这一篇也是含金量十足，如果面试官让你说个你处理过的比较有意思的案例，可以跟他讲讲，让他也见见世面。好吧，我们直接开始，最后有相关的群，有兴趣可以加入。开始一、故障场景深度还原时间：2025年1月3日02:00（GMT+8）环境：•数据库集群：MySQL8.0.35，通过KubeBlocks部署（3节点，跨AZ）•监控架构：•Prometheus-Opera
云原生工程师必修课：如何揪出“假忙真闲”的应用元凶 YAMLMaster 面试题 kubernetes 运维开发 devops
Tagamanent,Spain引言这是一个再经典不过的面试题了，希望大家能学到精髓。开始介绍在分布式系统和高并发场景中，高负载（HighLoad）与低使用率（LowUtilization）的共存矛盾是运维和开发者的常见挑战。这种问题往往隐蔽性强，传统监控指标难以直接定位根因。本文从系统层、应用层、架构层多维度拆解，提供一套完整的排查与优化方法论。核心概念厘清•负载（Load）：系统当前待处理任务
图神经网络实战——分层自注意力网络盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战——分层自注意力网络0.前言1.分层自注意力网络1.1模型架构1.2节点级注意力1.3语义级注意力1.4预测模块2.构建分层自注意力网络相关链接0.前言在异构图数据集上，异构图注意力网络的测试准确率为78.39%，比之同构版本有了较大提高，但我们还能进一步提高准确率。在本节中，我们将学习一种专门用于处理异构图的图神经网络架构，分层自注意力网络(hierarchicalself-att
华为云计算产品系列 | 云上迁移工具RainBow实战详解降世神童云计算技术专栏华为华为云云计算
华为云计算产品系列|云上迁移工具RainBow实战详解1.迁移方案2.迁移流程3.迁移实验3.1.Windows系统迁移3.2.Linux系统迁移3.3.存储层迁移1.迁移方案 RainBow可以将物理机或者虚拟机上的业务迁移到华为的虚拟化平台和私有云平台（6.5.1以上支持），还可以实现低版本私有云迁移到高版本私有云。 Rainbow是华为自研迁移工具，支持X86架构下主流的Linux、Wi
Vue——Vue-cli脚手架+前端路由 pdsu_zhao Vue Vue学习之旅 vue v-router v-resource vue-cli ES6
Vue-cli是Vue的脚手架工具可以进行目录结构、本地调试、代码部署、热加载、单元测试1、MVVM框架View——ViewModel——Model（视图）（通讯）（数据）“DOM”“观察者vue实例”“Javascript”注意：交互为双向的特点：（1）针对具有复杂交互逻辑的前端应用；（2）提供基础的架构抽象；（3）通过Ajax数据持久化，保证前端用户体验。2、什么是Vue.js它是一个轻量级M
AsyncHttpClient使用说明书有梦想的攻城狮 netty学习专栏 Java asynchttpclient 异步处理 netty
[[toc]]AsyncHttpClient（AHC）是一个高性能、异步的HTTP客户端库，广泛用于Java和Scala应用中，特别适合处理高并发、非阻塞的HTTP请求。它基于Netty或Java原生的异步HTTP客户端实现，支持HTTP/1.1和HTTP/2协议，适用于微服务、API调用、爬虫等场景。1.核心特性特性说明异步非阻塞基于事件驱动模型，避免线程阻塞，支持高并发（如每秒数千请求）。HT
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

iot架构 mqtt netty_百度IoT：MQTT Broker架构设计

你可能感兴趣的:(iot架构,mqtt,netty)