喜欢猪猪

消息队列中间件 MetaQ/RocketMQ

简介—— 消息队列中间件 MetaQ/RocketMQ

中间件 MetaQ 是一种基于队列模型的消息中间件，MetaQ 据说最早是受 Kafka 的影响开发的，第一版的名字 "metamorphosis"，是奥地利作家卡夫卡的名作——《变形记》。RocketMQ 是 MetaQ 的开源版本。

消息队列中间件一般用于在分布式场景下解决集群单机瓶颈的问题。在传统的分布式计算环境中，常常会出现由于某个单机节点的性能瓶颈，即使其他节点仍有余力，仍然会导致整个系统的性能无法进一步提升的情况，这一现象通常是由于任务负载不均衡，网络延迟等常见且难以解决的问题。消息队列本质上是提供了一种非常合理的任务分配策略，通过将任务分给消费者实现异步和分布式处理，提高整个集群的性能。

消息队列（mq）的核心思想是将耗时的任务异步化，通过消息队列缓存任务，从而实现消息发送方和接收方的解耦，使得任务的处理能够异步、并行，从而提高系统或集群的吞吐量和可扩展性。在这个过程中，整个系统强依赖于消息队列，起到类似桥梁的作用。消息队列有着经典的三大应用场景：解耦、异步和削峰填谷。

解耦场景：消息队列一般使用发布/订阅的模型，如果服务 B C D 依赖服务 A 的消息，此时新增服务 E 也需要依赖 A ，而 B 服务不再需要消息，需要频繁且复杂的业务改造，效率低，稳定性差，此时引入消息队列进行解耦，服务 A 只需要将产生的消息发布到 mq 中，就不用管了，其它服务会自己根据需要订阅 mq 中的消息，或者说去 mq 中消费，这就使得每个服务可以更多地关注自身业务，而不需要把精力用在维护服务之间的关系上，可扩展性提高。

异步场景：如用户的业务需要一系列的服务进行处理，按顺序处理的话，用户需要等待的时间过长。例如电商平台的用户下单、支付、积分、邮件、短信通知等流程，长时间等待用户无法接受，就可以通过 mq 进行服务的异步处理，例如积分、邮件和短信通知服务订阅了支付服务的消息，将支付完成作为消息发布到 mq ，这些服务就可以同时对这一订单进行处理，降低了请求等待时间（rt）。

削峰填谷场景：削峰表示的含义是，流量如果太大，就控制服务器处理的 QPS，不要让大流量打挂数据库等导致服务器宕机，让服务处理请求更加平缓，节省服务器资源，其本质上是控制用户的请求速率，或是延缓或是直接拒绝。填谷的含义是将阶段性的大流量请求缓存起来，在流量平缓的时候慢慢处理，防止过多的请求被拒绝后的重试导致更大的流量。mq 很适合这一场景，QPS 超出服务端接收请求的能力时，服务端仍然保持在安全范围内地从消息队列中获取消息进行处理，多余的消息会积压在消息队列中，或由于超时直接拒绝，到 QPS 低于这一阈值的时候，这些积压的消息就会被逐渐消费掉。相当于在系统前修建了一个流量蓄水池。

除此之外还可以利用消息队列进行消息通信，日志处理等业务，但消息队列也会引入系统可用性，系统复杂度，数据一致性等问题（强依赖消息队列的正确执行，需要确保消息不会丢失，确保消息的顺序性等）。这意味着如果系统中的消息队列承担着重要的角色，那么消息队列的可靠性和稳定性也至关重要，本文介绍的 MetaQ/RocketMQ 是侧重于维持消息一致性和高可靠性的消息队列中间件。

物理架构

MetaQ 的高可用性是基于其物理部署架构实现的，在生产者为消息定义了一个 topic 之后，消费者可以订阅这个 topic ，于是消息就有了从生产到消费的路由指向。

NameServer 负责暴露消息的 topic ，因此可以以将 NameServer 理解成一个注册中心，用来关联 topic 和对应的 broker ，即消息的存储位置。NameServer 的每个节点都维护着 topic 和 broker 的映射关系，每个节点彼此独立，无同步。在每个NameServer节点内部都维护着所有 Broker 的地址列表，所有 Topic 和 Topic 对应 Queue 的信息等。消息生产者在发送消息之前先与任意一台 NameServer 建立连接，获取 Broker 服务器的地址列表，然后根据负载均衡算法从列表中选择一台消息服务器发送消息。

Broker 主要负责消息的存储和转发，分为 master 和 slave，是一写多读的关系。broker 节点可以按照处理的数据相同划分成副本组，同一组 master 和 slave 的关系可以通过指定相同 brokerName，不同的 brokerId 来定义，brokerId 为 0 标识 master，非 0 是 slave。每个 broker 服务器会与 NameServer 集群建立长连接（注意是跟所有的 NameServer 服务器，因为 NameServer 彼此之间独立不同步），并且会注册 topic 信息到 NameServer 中。复制策略是 Broker 的 Master 与 Slave 间的数据同步方式，分为同步复制与异步复制。由于异步复制、异步刷盘可能会丢失少量消息，因此 Broker 默认采用的是同步双写的方式，消息写入 master 成功后，master 会等待 slave 同步数据成功后才向 Producer 返回成功 ACK ，即 Master 与 Slave 都要写入成功后才会返回成功 ACK 。这样可以保证消息发送时消息不丢失。副本组中，各个节点处理的速度不同，也就有了日志水位的概念（高水位对消费者不可见）。在 master 宕机时，同步副本集中的其余节点会自动选举出新的 master 代替工作（Raft 协议）。

Producer，消息生产者，与 NameServer 随机一个节点建立长连接，定时从 NameServer 获取 topic 路由信息，与 master broker 建立长连接，定时发送心跳，Producer 只与 master 建立连接产生通信，不与 slave 建立连接。生产者和消费者都有组（Group）的概念，同一组节点的生产/消费逻辑相同。

Consumer，消息消费者，与 NameServer 随机一个节点建立长连接，定时从 NameServer 获取 topic 的路由信息，并获取想要消费的 queue 。可以和提供服务的 master 或 slave 建立长连接，定时向 master 和 slave 发送心跳，既可以从 master 订阅消息，也可以从 slave 订阅消息。

消息的存储

MetaQ 将消息存储（持久化）到位于生产者和消费者之间的一个消息代理（Message Broker）上。

MetaQ 消息模型：

Message 单位消息；
Topic 消息的类型，生产者对应消费者的分区标识；
Tag 消息在相同 Topic 时的二级分类标识，可用于消息的筛选；
Queue 物理分区，一个 Topic 对应多个 Queue；
Group 生产者或消费者的逻辑分组，同一个 Group 的生产者/消费者通常生产/消费同一类消息，并且生产/消费的逻辑一致；
Offset：偏移值，表示消费到的位置或待消费的消息位置；

消息的存储方式对消息队列的性能有很大影响，如 ActiveMQ 会使用队列表来存储消息，依靠轮训、加锁等方式检查和处理消息，但对于 QPS 很高的系统来说，一下子积压庞大的数据量在表中会导致 B+ 树索引层级加深，影响查询效率。KV 数据库采用如 LSM 树作为索引结构，对读性能有较大的牺牲，这对于消息队列而言很难接受，因为消息队列常常需要面对消费失败需要重试的情况。

RocketMQ/Kafka/RabbitMQ 等消息队列会采用顺序写的日志结构，将消息刷盘至文件系统作持久化。顺序写日志文件可以避免频繁的随机访问而导致的性能问题，而且利于延迟写入等优化手段，能够快速保存日志。Kafka 会为每个 topic (事件的组织和存储单位，一个 topic 可以对应多个生产者和多个消费者) 划分出一个分区日志，便于根据 topic 顺序消费，消息被读取后不会立刻删除，可以持久存储，但 topic 数量增加的时候，broker 的分区文件数量增大，会使得本来速度很快的顺序写变成随机写（不同文件之间移动），性能大幅下降。

MetaQ 2.0 对这部分进行重新设计，其存储结构主要包括 CommitLog 和 Consume queue 两部分。

CommitLog 是物理存储，存储不定长的完整消息记录，逻辑上是完全连续的一个文件，物理上单个文件大小是 1 GB，文件名是当前文件首地址在 CommitLog 中的偏移量。只要 CommitLog 落盘，就可以认为已经接收到消息，即使 Cosume queue 丢失，也可以从 CommitLog 恢复。而所有 topic 的消息都会存储在同一个 CommitLog 中来保证顺序写。这样的结构会导致 CommitLog 读取完全变成随机读，所以需要 Consume queue 作为索引队列 (offset, size, tag)，每个 topic-queue 的消息在写完 CommitLog 之后，都会写到独立的 Consume queue ，队列里的每个元素都是定长的元数据，内容包含该消息在对应 CommitLog 的 offset 和 size ，还包括 tagcode 可支持消息按照指定 tag 进行过滤。顺序写是 MetaQ 实现高性能的基础。

基于这样的存储结构，MetaQ 对客户端暴露的主要是 Consume queue 逻辑视图，提供队列访问接口。消费者通过指定 Consume queue 的位点来读取消息，通过提交 Consume queue 的位点来维护消费进度。Concume queue 每个条目长度固定（8个字节CommitLog物理偏移量、4字节消息长度、8字节tag哈希码），单个 ConsumeQueue 文件默认最多包括 30 万个条目。这样做的好处是队列非常轻量级，Consume Queue 非常小，且在消费过程中都是顺序读取，其速度几乎能与内存读写相比，而在 page cache 和良好的空间局部性作用下，CommitLog 的访问也非常快速。

MetaQ 会启动一个定时服务 ReputMessageService 定时调用（间隔 1ms）来生成 Consume queue 和其它索引文件。

Consume queue 解决了顺序消费的问题，但如果需要根据属性进行筛选，就必须用到 index 索引。

index 索引支持根据 key 值进行筛选，查找时，可以根据消息的 key 计算 hash 槽的位置，hash 槽中存储着 Index 条目的位置，可以根据这个 index 条目获得一个链表（尾），每个 index 条目包含在 CommitLog 上的消息主体的物理偏移量。

消息链路

MetaQ 的消息可以根据 topic-queue 划分出确定的从生产者到消费者路由指向。

1.producer 指定 broker 和 queue 发送消息 msg ；

2.broker 接收消息，并完成缓存、刷盘和生成摘要（同时根据 tag 和 user properties 对 msg 进行打标）等操作；

3.consumer 每隔一段时间（ pullInterval ）从 broker 端的（根据服务端消息过滤模式 tag 或 sql 过滤后）获取一定量的消息到本地消息队列中（单线程）

4.consumer 按照配置并发分配上述队列消息并执行消费方法；

5.consumer 返回 broker 消费结果并重置消费位点；

生产者

Topic 是消息的主题，每个 topic 对应多个队列，多个队列会均匀的分布在多个 broker 上，Producer 发送的消息在 broker 上会均衡的分布在多个队列中，Producer 发送消息时在多个队列间轮询确保消息的均衡。

发送消息的具体操作如下：

1、查询本地缓存是否存储了 TopicPublishInfo ，否则从 NameServer 获取

2、根据负载均衡选择策略获取待发送队列并轮训访问

3、获取消息队列对应的 broker 实际 IP

4、设置消息 Unique ID ，zip 压缩消息

5、消息校验（长度等），发送消息

Producer 发送的每条消息都包含一个 Topic，表示一类消息的集合。同时还有一个 Tag，用于区分同一Topic 下不同类型的消息。一个 Topic 包括多个 Queue，每个 Queue 中存放该 Topic 对应消息的位置。一个 Topic 的 Queue 相当于该 Topic 中消息的分区，Queue 可以存储在不同的 Broker 上。发送消息时，Producer 通过负载均衡模块选择相应的 Broker 集群队列进行消息投递。

消息发送时如果出现失败，默认会重试 2 次，在重试时会尽量避开刚刚接收失败的 Broker，而是选择其它 Broker 上的队列进行发送，从而提高消息发送的成功率。

消费者

消费方式

广播消费：Producer 向一些队列轮流发送消息，队列集合称为 Topic，每一个 Consumer 实例消费这个 Topic 对应的所有队列。
集群消费：多个 Consumer 实例平均消费这个 Topic 对应的队列集合。

MetaQ 消费者端有多套负载均衡算法的实现，比较常见的是平均分配和平均循环分配，默认使用平均分配算法，给每个 Consumer 分配均等的队列。一个 Consumer 可以对应多个队列，而一个队列只能给一个 Consumer 进行消费，Consumer 和队列之间是一对多的关系。

集群模式下有一点需要注意：消费队列负载机制遵循一个通用的思想，一个消息队列同时只允许被一个消费者消费，一个消费者可以消费多个消费队列。因此当 Consumer 的数量大于队列的数量，会有部分 Consumer 分配不到队列，这些分配不到队列的 Consumer 机器不会有消息到达。

平均分配算法举例：

如果有 5 个队列，2 个 consumer，consumer1 会分配 3 个队列，consumer2 分配 2 个队列；
如果有 6 个队列，2 个 consumer，consumer1 会分配 3 个队列，consumer2 也会分配 3 个队列；
如果 10 个队列，11 个 consumer，consumer1~consumer10 各分配一个队列，consumer11 无队列分配；

如果消费集群规模较大：例如 topic 队列资源是 128 个，而消费机器数有 160 台，按照一个队列只会被一个消费集群中一台机器处理的原则，会有 32 台机器不会收到消息，此种情况需要联系 MetaQ 人员进行扩容评估。

消费重试：当出现消费失败的消息时，Broker 会为每个消费者组设置一个重试队列。当一条消息初次消费失败，消息队列会自动进行消费重试。达到最大重试次数后，若消费仍然失败，此时会将该消息发送到死信队列。对于死信消息，通常需要开发人员进行手动处理。

在消费时间过程中可能会遇到消息消费队列增加和减少、消息消费者增加或减少，此时需要对消息消费队列进行重新平衡，既重新分配（rebalance），这就是所谓的重平衡机制。在 RocketMQ 中，每隔 20s 会根据当前队列数量、消费者数量重新进行队列负载计算，如果计算出来的结果与当前不一样，则触发消息消费队列的重分配。

Consumer 启动时会启动定时器，还执行一些定时同步任务，包括：同步 nameServer 地址，从 nameServer 同步 topic 的路由信息，清理 offline 的 broker，并向所有 broker 发送心跳，分配给当前 consumer 的每个队列将最新消费的 offset 同步给 broker。

消息消费过程浅析

三个关键服务： RebalanceService、PullMessageService、MessageConsumeService

RebalanceService 负载均衡服务

定时执行一次负载均衡（20 s）分配消息队列给消费者。负载均衡针对每个 topic 独立进行，具体如下：

private void rebalanceByTopic(final String topic, final boolean isOrder) {        switch (messageModel) {            case BROADCASTING: {                Set mqSet = this.topicSubscribeInfoTable.get(topic);                if (mqSet != null) {                    boolean changed = this.updateProcessQueueTableInRebalance(topic, mqSet, isOrder);//广播模式下每个消费者要消费所有 queue 的消息                    if (changed) {                        this.messageQueueChanged(topic, mqSet, mqSet);                        log.info("messageQueueChanged {} {} {} {}",                            consumerGroup,                            topic,                            mqSet,                            mqSet);                    }                } else {                    log.warn("doRebalance, {}, but the topic[{}] not exist.", consumerGroup, topic);                }                break;            }            case CLUSTERING: {                Set mqSet = this.topicSubscribeInfoTable.get(topic);//找到该topic下的消息队列集合                List cidAll = this.mQClientFactory.findConsumerIdList(topic, consumerGroup);//找到给消费者组下的所有消费者id                if (null == mqSet) {                    if (!topic.startsWith(MixAll.RETRY_GROUP_TOPIC_PREFIX)) {                        log.warn("doRebalance, {}, but the topic[{}] not exist.", consumerGroup, topic);                    }                }                if (null == cidAll) {                    log.warn("doRebalance, {} {}, get consumer id list failed", consumerGroup, topic);                }                                if (mqSet != null && cidAll != null) {                    List mqAll = new ArrayList();                    mqAll.addAll(mqSet);
                    Collections.sort(mqAll);                    Collections.sort(cidAll);                                        AllocateMessageQueueStrategy strategy = this.allocateMessageQueueStrategy;                                        List allocateResult = null;                    try {                        allocateResult = strategy.allocate(                            this.consumerGroup,                            this.mQClientFactory.getClientId(),                            mqAll,                            cidAll);// 根据分配策略进行分配                    } catch (Throwable e) {                        log.error("AllocateMessageQueueStrategy.allocate Exception. allocateMessageQueueStrategyName={}", strategy.getName(),                            e);                        return;                    }                                        Set allocateResultSet = new HashSet();                    if (allocateResult != null) {                        allocateResultSet.addAll(allocateResult);                    }                    boolean changed = this.updateProcessQueueTableInRebalance(topic, allocateResultSet, isOrder);// 更新处理队列表                                        if (changed) {                        log.info(                            "rebalanced result changed. allocateMessageQueueStrategyName={}, group={}, topic={}, clientId={}, mqAllSize={}, cidAllSize={}, rebalanceResultSize={}, rebalanceResultSet={}",                            strategy.getName(), consumerGroup, topic, this.mQClientFactory.getClientId(), mqSet.size(), cidAll.size(),                            allocateResultSet.size(), allocateResultSet);                        this.messageQueueChanged(topic, mqSet, allocateResultSet);                    }                }                break;            }            default:                break;        }    }

这里主要做了几件事：

判断消费模式

广播模式

i.找到 topic 下的消息队列（queue）集合

ii.更新处理队列表

集群模式

i.找到 topic 下的消息队列集合

ii.找到消费者组下所有消费者 id

iii.根据分配策略进行分配

iv.更新处理队列表，开始真正拉取消息请求

消费者会将消费位点更新到 NameServer 上，Rebalance 发生时，读取消费者的消费位点信息，需要注意在消费者数量大于队列数量的情况下，如果消费者不及时更新消费位点信息，可能会导致消息被重复消费。因此，消费者需要及时更新消费位点信息，确保消费进度正确。

Consumer 创建的时候 Rebalance 会被执行。整个 rebalanceService 的作用就是不断的通过负载均衡，重新分配队列的过程。根据分配好的队列构建拉取消息的请求，然后放到 pullRequestQueue 中。

PullMessageService 拉取消息服务

首先拉取消息时最重要的是确定偏移量 offset，这存储在消费者端的 OffsetStore 对象中。

if (this.defaultMQPushConsumer.getOffsetStore() != null) {          this.offsetStore = this.defaultMQPushConsumer.getOffsetStore();        } else {          switch (this.defaultMQPushConsumer.getMessageModel()) {            case BROADCASTING:              this.offsetStore = new LocalFileOffsetStore(this.mQClientFactory, this.defaultMQPushConsumer.getConsumerGroup());              break;            case CLUSTERING:              this.offsetStore = new RemoteBrokerOffsetStore(this.mQClientFactory, this.defaultMQPushConsumer.getConsumerGroup());              break;            default:              break;          }}this.offsetStore.load();

可以看到广播模式和集群模式的对象类型不同，这是因为对 offset 的维护的方式不一样，在 load 的时候 LocalFileOffsetStore 会从本地文件加载这个 offset，而 RemoteBrokerOffsetStore 的 load 函数是空的。

两种对象类型分别有 readOffset 函数支持从内存中获取 offset 值，以及分别从本地文件存储和 broker 获取 offset。需要注意集群模式下消费者只需要关心 broker 上维护的消费进度，因为不论 queue 和消费者的映射关系如何切换，只有 offset 之后的未消费消息是消费者需要关心的。

消息的拉取过程是一个不断循环的生产者消费者模型，一个 PullRequest 就对应一个拉取任务，并和一对MessageQueue（保存 Consume queue 的信息）和 ProcessQueue 关联，消息拉取的过程中，PullMessageService 拉取线程不停的读取 PullRequestQueue 根据 PullRequest 拉取消息。拉取到消息时，消息提交到 ProcessQueue 中并新建 ConsumeRequest 提交到 ConsumeService 处理, 然后生成下一批的 PullRequest 丢到 PullRequestQueue。如果没有拉取到消息或出现异常，则会重新将请求放回拉取队列。ProcessQueue 中以 TreeMap 形式保存待处理的消息， key 为消息对应的 offset ，并自动进行排序。

消息拉取过程：

1.PullMessageService 不断循环遍历，从 PullRequestQueue 中提取 PullRequest，根据 nextOffset 去 broker 拉取消息，若该队列已经 dropped 则更新 offset 到 broker 并丢弃此拉消息请求。

2.PullMessageService 异步拉取消息，同时将 PullRequest 封装在 PullCallback 中，PullCallback 封装在 ResponseFuture中，并以自增的请求 id 为键，ResponseFuture 为值放入 ResponseTable 中。

3.Broker 收到请求，如果 offset 之后有新的消息会立即发送异步响应；否则等待直到 producer 有新的消息发送后返回或者超时。如果通信异常或者 Broker 超时未返回响应，nettyClient 会定时清理超时的请求，释放 PullRequest 回到 PullRequestQueue。

4.用最新的 offset 更新 ResponseFuture 里的 PullRequest 并推送给 PullRequestQueue 里以进行下一次拉取。批量拉取到的消息分批提交给 consumeExecutor 线程处理。

消费控速

MetaQ 为消费者端拉取消息提供了消费控速的能力：

主动控速，在整个消费过程中我们可以发现，如果想要做到流控，一个是控制生成 PullRequest 的时间间隔，一个是控制生成新一批的请求数量，因此 MetaQ 提供了两个参数给我们 pullInterval、pullBatchSize ，主动控速的逻辑是通过控制消息的拉取速度来达到降低速率的效果。
被动控速，这种流量控制的方式要复杂得多，需要用户在消费消息时控制流量（sentinel），由于消费线程池的待消费队列的消息达到一定阈值之后，MetaQ 会被动降低 PullRequest 的产生的速率，因此当采用流量控制手段通过埋点降低消费速度时，待消费队列会逐渐占满，触发降速机制；为什么不直接用 sentinel ？因为 sentinel 快速失败等策略触发限流后会产生大量重试，重试消息会进入重试队列，当重试的量逐渐增大，broker 上重试队列中消息量也越来越多，并且重试消息再次投递时还可能再次发生重试，又重新进入重试队列，同一条消息反复进出队列，这种无意义的重复动作会增加 broker 的压力。

消息种类

普通消息

可选择同步、异步或单向发送。同步：Producer 发出一条消息后，会在收到 MQ 返回的 ACK 之后再发送下一条消息。异步：Producer 发出消息后无需等待 MQ 返回 ACK ，直接发送下一条消息。单向： Producer 仅负责发送消息，不等待，MQ 也不返回 ACK。

顺序消息

消息的顺序性分为两种：

全局顺序：对于指定的一个 Topic ，所有消息按照严格的先入先出的顺序进行发布和消费（同一个 queue）。
分区顺序：对于一个指定的 Topic ，所有消息根据 sharding key 进行分区，同一个分区内的消息按照严格的 FIFO 顺序进行发布和消费，分区之间彼此独立。

MetaQ 只支持同一个 queue 的顺序消息，且同一个 queue 只能被一台机器的一个线程消费，如果想要支持全局消息，那需要将该 topic 的 queue 的数量设置为 1，牺牲了可用性。

消息事务

1.发送方向 MQ 服务端发送消息。

2.MQ Server 将消息持久化成功之后，向发送方 ACK 确认消息已经发送成功，此时消息为半消息。

3.发送方开始执行本地事务逻辑。

4.发送方根据本地事务执行结果向 MQ Server 提交二次确认（Commit 或是 Rollback），MQ Server 收到 Commit 状态则将半消息标记为可投递，订阅方最终将收到该消息；MQ Server 收到 Rollback 状态则删除半消息，订阅方将不会接受该消息。

5.在断网或者是应用重启的特殊情况下，上述步骤4提交的二次确认最终未到达 MQ Server，经过固定时间后 MQ Server 将对该消息发起消息回查。

6.发送方收到消息回查后，需要检查对应消息的本地事务执行的最终结果。

7.发送方根据检查得到的本地事务的最终状态再次提交二次确认，MQ Server 仍按照步骤 4 对半消息进行操作。

MetaQ 3.0 以后，新的版本提供更加丰富的功能，支持消息属性、无序消息、延迟消息、广播消息、长轮询消费、高可用特性，这些功能基本上覆盖了大部分应用对消息中间件的需求。除了功能丰富之外，MetaQ 基于顺序写，大概率顺序读的队列存储结构和 pull 模式的消费方式，使得 MetaQ 具备了最快的消息写入速度和百亿级的堆积能力，特别适合用来削峰填谷。在 MetaQ 3.0 版本的基础上，衍生了开源版本 RocketMQ。

高可用

如何做到不重复消费也不丢失消息？

重复消费问题

发送时消息重复【消息 Message ID 不同】：MQ Producer 发送消息时，消息已成功发送到服务端并完成持久化，此时网络闪断或者客户端宕机导致服务端应答给客户端失败。如果此时 MQ Producer 意识到消息发送失败并尝试再次发送消息，MQ 消费者后续会收到两条内容相同但是 Message ID 不同的消息。
投递时消息重复【消息 Message ID 相同】：MQ Consumer 消费消息场景下，消息已投递到消费者并完成业务处理，当客户端给服务端反馈应答的时候网络闪断。为了保证消息至少被消费一次，MQ 服务端将在网络恢复后再次尝试投递之前已被处理过的消息，MQ 消费者后续会收到两条内容相同并且 Message ID 也相同的消息。

MetaQ 不能保证消息不重复，因此对于重复消费情况，需要业务自定义唯一标识作为幂等处理的依据。

消息丢失问题

MetaQ 避免消息丢失的机制主要包括：重试、冗余消息存储。在生产者的消息投递失败时，默认会重试两次。消费者消费失败时，在广播模式下，消费失败仅会返回 ConsumeConcurrentlyStatus.RECONSUME_LATER ，而不会重试。在未指定顺序消息的集群模式下，消费失败的消息会进入重试队列自动重试，默认最大重试次数为 16 。在顺序消费的集群模式下，消费失败会使得当前队列暂停消费，并重试到成功为止。

主从同步

RocketMQ/MetaQ 为每个存储数据的 Broker 节点配置 ClusterName，BrokerName 标识来更好的进行资源管理。多个 BrokerName 相同的节点构成一个副本组。每个副本还拥有一个从 0 开始编号，不重复也不一定连续的 BrokerId 用来表示身份，编号为 0 的节点是这个副本组的 Leader / Primary / Master，故障时通过选举来重新对 Broker 编号标识新的身份。例如 BrokerId = {0, 1, 3}，则 0 为主，其他两个为备。

从模型的角度来看，RocketMQ /MetaQ 单节点上 Topic 数量较多，如果像 kafka 以 topic 粒度维护状态机，节点宕机会导致上万个状态机切换，这种惊群效应会带来很多潜在风险，因此新版本的 RocketMQ/MetaQ 选择以单个 Broker 作为切换的最小粒度来管理，相比于其他更细粒度的实现，副本身份切换时只需要重分配 Broker 编号，对元数据节点压力最小。由于通信的数据量少，可以加快主备切换的速度，单个副本下线的影响被限制在副本组内，减少管理和运维成本。这种实现也存在一些缺点，例如存储节点的负载无法以最佳状态在集群上进行负载均衡。

RocketMQ/MetaQ 采用物理复制的方法，存储层的 CommitLog 通过链表和内核的 MappedFile 机制抽象出一条 append only 的数据流。主副本将未提交的消息按序传输给其他副本（相当于 redo log），并根据一定规则计算确认位点（confirm offset）判断日志流是否被提交。最终一致性通过数据水位对齐的方式来实现（越近期的消息价值越高）：

1-1 情况下满足备 Max <= 主 Min，一般是备新上线或下线较久，备跳过存量日志，从主的 Min 开始复制。
1-2，2-2 两种情况下满足主 Min < 备 Max <= 主 Max，一般是由于备网络闪断导致日志水位落后，通过 HA 连接追随主即可。
1-3，2-3 两种情况下备 Max > 主 Max，可能由于主异步写磁盘宕机后又成为主，或者网络分区时双主写入造成 CommitLog 分叉。由于新主落后于备，在确认位点对齐后少量未确认的消息丢失，这种非正常模式的选举是应该尽量避免的。
3-3 理论上不会出现，备的数据长于主，原因可能是主节点数据丢失又叠加了非正常选举，因此这种情况需要人工介入处理。

副本组的消息复制也支持同步和异步的模式。

复制方式	优点	缺点
同步复制	成功写入的消息不会丢失，可靠性高	写入延迟更高
异步复制	slave 宕机不影响 master 性能更高	可能丢失消息

slave broker 会定时（60 s）从 master 同步信息

public void syncAll() { this.syncTopicConfig(); this.syncConsumerOffset(); this.syncDelayOffset(); this.syncSubscriptionGroupConfig(); this.syncMessageRequestMode(); if (brokerController.getMessageStoreConfig().isTimerWheelEnable()) { this.syncTimerMetrics(); } }

主从切换

RocketMQ 衍生出了很多不同的主从切换架构。

无切换架构

最早的时候，RocketMQ 基于 Master-Slave 模式提供了主备部署的架构，这种模式提供了一定的高可用能力，在 Master 节点负载较高情况下，读流量可以被重定向到备机。由于没有选主机制，在 Master 节点不可用时，这个副本组的消息发送将会完全中断，还会出现延迟消息、事务消息等无法消费或者延迟。此外，备机在正常工作场景下资源使用率较低，造成一定的资源浪费。为了解决这些问题，社区提出了在一个 Broker 进程内运行多个 BrokerContainer，这个设计类似于 Flink 的 slot，让一个 Broker 进程上可以以 Container 的形式运行多个节点，复用传输层的连接，业务线程池等资源，通过单节点主备交叉部署来同时承担多份流量，无外部依赖，自愈能力强。这种方式下隔离性弱于使用原生容器方式进行隔离，同时由于架构的复杂度增加导致了自愈流程较为复杂。

切换架构

另一条演进路线则是基于可切换的，RocketMQ 也尝试过依托于 Zookeeper 的分布式锁和通知机制进行 HA 状态的管理。引入外部依赖的同时给架构带来了复杂性，不容易做小型化部署，部署运维和诊断的成本较高。另一种方式就是基于 Raft 在集群内自动选主，Raft 中的副本身份被透出和复用到 Broker Role 层面去除外部依赖，然而强一致的 Raft 版本并未支持灵活的降级策略，无法在 C（Consistency）和 A （Availability）之间灵活调整。两种切换方案都是 CP 设计，牺牲高可用优先保证一致性。主副本下线时选主和路由定时更新策略导致整个故障转移时间依然较长，Raft 本身对三副本的要求也会面临较大的成本压力。

RocketMQ DLedger 融合模式

RocketMQ DLedger （基于 Raft 的分布式日志存储）融合模式是 RocketMQ 5.0 演进中结合上述两条路线后的一个系统的解决方案。

	模式	优点	缺点
无切换	Master-Slave 模式	实现简单，适用于中小型用户，人工管控力强	故障需要人工处理，故障时写入消息失败，导致消息消费暂停
	Broker Container 模式	无需选主，无外部依赖，故障转移非常快（< 3 秒）	增加单节点运维的复杂度，机器故障的风险增加，自愈流程复杂
切换架构	Raft 自动选主模式	自动主备切换	故障转移时间较长，强一致无法灵活降级，三副本成本压力较大
融合架构	基于 Dledger Controller 的可切换模式	可支持无切换和切换架构之间的转换，复制协议更简单，灵活降级	提高了部署和系统的复杂度

总结

相比较于 RocketMQ/MetaQ，Kafka 具有更高的吞吐量。Kafka 默认采用异步发送的机制，并且还拥有消息收集和批量发送的机制，这样的设置可以显著提高其吞吐量。由于 Kafka 的高吞吐量，因此通常被用于日志采集、大数据等领域。

RocketMQ/MetaQ 不采用异步的方式发送消息。因为当采用异步的方式发送消息时，Producer 发送的消息到达 Broker 就会返回成功。此时如果 Producer 宕机，而消息在 Broker 刷盘失败时，就会导致消息丢失，从而降低系统的可靠性。

RocketMQ/MetaQ 单机可以支持更多的 topic 数量。因为 Kafka 在 Broker 端是将一个分区存储在一个文件中的，当 topic 增加时，分区的数量也会增加，就会产生过多的文件。当消息刷盘时，就会出现性能下降的情况。而 RocketMQ/MetaQ 是将所有消息顺序写入文件的，因此不会出现这种情况。

当 Kafka 单机的 topic 数量从几十到几百个时，就会出现吞吐量大幅度下降、load 增高、响应时间变长等现象。而 RocketMQ/MetaQ 的 topic 数量达到几千，甚至上万时，也只是会出现小幅度的性能下降。

综上所述，Kafka 具有更高的吞吐量，适合应用于日志采集、大数据等领域。而 RocketMQ/MetaQ 单机支持更多的 topic，且具有更高的可靠性（一致性支持），因此适用于淘宝这样复杂的业务处理。

你可能感兴趣的:(中间件,rocketmq)

消息中间件巡检搬砖小常消息中间件运维笔记 RocketMQ kafka 中间件巡检运维
除资源使用情况外，消息中间件RocketMQ、kafka还可以巡检哪些？一、RocketMQ巡检1、检查broker写入耗时是否有压力2、检查brokerbusy的数量与频率3、主题发送TPS、发送错误率巡检4、从节点消费情况检查5、集群各broker消息流转情况巡检二、Kafka巡检1、检查是否有分区发生ISR频繁扩张收缩2、检查分区leader选举值是否处于正常水平3、检查controller
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
RocketMQ 核心特性实战详解愤怒的代码 RocketMQ实战 rocketmq
RocketMQ核心特性实战详解本文基于RocketMQ4.x+rocketmq-spring-boot-starter2.3.1，从零搭建，逐步讲解RocketMQ11大核心特性，每一段代码都能直接跑。0.项目环境准备依赖引入在pom.xml文件添加：org.apache.rocketmqrocketmq-spring-boot-starter2.3.1配置文件application.ymlse
rocketmq的重试队列和死信队列还不够 MQ
原文：https://www.jianshu.com/p/1281f7fee69c消费端，一直不回传消费的结果。rocketmq认为消息没收到，consumer下一次拉取，broker依然会发送该消息。所以，任何异常都要捕获返回ConsumeConcurrentlyStatus.RECONSUME_LATERrocketmq会放到重试队列。这个重试TOPIC的名字是%RETRY%+consumer
RocketMQ 之死信队列 firepation RocketMQ rocketmq
在分布式消息系统中，消息的可靠传递和处理至关重要。然而，由于各种原因（如消息处理失败、消费超时等），一些消息可能无法被正常消费。这些无法被消费的消息如果不加以处理，会影响系统的稳定性和数据一致性。为了解决这一问题，RocketMQ提供了死信队列（DeadLetterQueue，DLQ）机制。本文将深入探讨RocketMQ的死信队列，包括其实现原理、应用场景以及使用示例。什么是死信队列？死信队列是一
AIGC工具与软件开发流程的深度集成方案 Irene-HQ 软件开发测试 AIGC 测试工具 github AIGC 程序人生面试
一、代码开发环节集成路径‌环境配置标准化‌安装AIGC工具包并配置环境变量（如设置AIGC_TOOL_PATH），确保团队开发环境一致‌。在IDE插件市场安装Copilot等工具，实现编码时实时建议调用‌。‌人机协作新模式‌‌需求解析‌：上传PRD文档，AI自动提取业务规则生成类结构（如支付模块的PaymentService雏形）‌。‌代码补全‌：输入注释//JWT验证中间件，生成OAuth2.0
【ceph】坏盘更换，osd的具体操作向往风的男子 ceph ceph
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
SpringBoot快速集成RocketMQ大全，SpringBoot使用RocketMQ收发消息
文章目录一、写在前面二、发送消息三、接收消息1、push2、Pull模式四、事务消息五、消息轨迹六、ACL功能七、请求应答语义支持八、常见问题一、写在前面官方文档：https://github.com/apache/rocketmq-spring/wiki/%E7%94%A8%E6%88%B7%E6%89%8B%E5%86%8C引包：org.apache.rocketmqrocketmq-spri
Spring Boot 整合 RabbitMQ 蹦跑的蜗牛 Springboot spring boot rabbitmq
SpringBoot整合RabbitMQ一、概述：RabbitMQ是什么？你可以把RabbitMQ想象成一个「快递中转站」。比如你在网上买了一本书，卖家（生产者）把包裹（消息）交给快递站（RabbitMQ），快递站根据包裹上的地址（规则）把包裹分给不同的快递员（消费者），最后送到你家（业务系统）。RabbitMQ是一个专门用来「传递消息」的软件（专业叫「消息中间件」），它能让不同的程序、不同的电脑
rdkafka线程过多_我是如何处理大并发量订单处理的 KafKa部署总结 weixin_39574928 rdkafka线程过多
今天要介绍的是消息中间件KafKa，应该说是一个很牛的中间件吧，背靠Apache与很多有名的中间件搭配起来用效果更好哦，为什么不用RabbitMQ，因为公司需要它。网上已经有很多怎么用和用到哪的内容，但结果很多人都倒在了入门第一步环境都搭不起来，可谓是从了解到放弃，所以在此特记录如何在linux环境搭建，windows中配置一样，只是启动运行bat文件。想要用它就先必须了解它能做什么及能做到什么程
使用 Docker 搭建 Python（Flask/CUDA AI）开发环境——AI教你学Docker
使用Docker搭建Python（Flask/CUDAAI）开发环境及常用中间件配置详解本指南适用于用Docker快速搭建Python（FlaskWeb应用或包含CUDA的AI开发环境）开发环境，并集成常用中间件服务如MySQL、Redis、Kafka。适合个人开发、本地测试和小团队协作。一、项目目录结构建议project-root/├──app/#Python应用源码目录│├──Dockerfi
各种消息队列经典问题解决方案——消息丢失、顺序消费、消息积压、重复消费 EyeDropLyq rabbitmq rocketmq kafka
写在开头：对于消息队列这种中间件来说，只要进入消息队列就会有几个绕不开的问题，比如：消息丢失、顺序消费、消息积压、重复消费，下面就来讲解一下市面上比较常见的各个不同的消息队列产品针对这四个问题的解决方案。1、Kafka消息丢失解决方案对于Kafka这个消息队列来说，消息丢失的环节有下面的几个地方：1、消息生产者发送消息给Broker的时候数据丢失2、Broker异常导致Broker中的数据丢失3、
面试必问的线程池原理与实战：从源码到应用全解析混进IT圈 Java 线程池面试多线程并发编程 Tomcat Netty
摘要：本文结合JDK官方文档、《Java并发编程实战》等权威资料，深入剖析线程池的核心原理，并通过电商、消息中间件等真实场景演示选型策略。全文包含20+代码示例、5大避坑指南，帮你轻松应对面试中的高频考点。一、线程池核心原理：从JDK源码到Tomcat扩展1.1JDK原生线程池的工作机制（附源码）JDK线程池的核心是ThreadPoolExecutor，其工作流程可概括为：//核心执行逻辑（简化版
【ceph】ceph集群更换osd时，找不到坏盘位置，怎么查找坏盘对应的序列号---业内称“点灯”
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
Apache Pulsar 技术全景解析：架构设计、源码剖析与实战优化北漂老男人 Pulsar apache 学习方法运维 linux 开发语言
ApachePulsar技术全景解析：架构设计、源码剖析与实战优化1.1消息队列与流处理基础一、消息队列与流处理的本质消息队列（MQ,MessageQueue）是一种典型的“生产者-中间件-消费者”模式。消息生产者将消息发送到队列，消费者异步拉取处理，解耦系统、削峰填谷、容错降压。流处理（StreamProcessing）强调对数据流的实时处理。数据不断产生并被持续处理，适合日志分析、实时监控、风
客户端请求在 Spring Cloud Alibaba 框架中，包括 Nginx、Gateway、Nacos、Dubbo、Sentinel、RocketMQ 和 Seata 的调用链路描述飞升不如收破烂~ nginx gateway dubbo
以下是一个更详细和清晰的客户端请求在SpringCloudAlibaba框架中，包括Nginx、Gateway、Nacos、Dubbo、Sentinel、RocketMQ和Seata的调用链路描述：1.客户端请求用户在浏览器或移动应用中发起请求（例如，获取用户信息的API请求），请求通过HTTP发送到服务器。2.Nginx处理入口：请求首先到达Nginx。负载均衡：-Nginx根据配置的负载均衡策
WebLogic 作用，以及漏洞原理，流量特征与防御 Bigliuzi@ 进阶漏洞进阶漏洞 weblogic 安全
WebLogic的核心作用：企业级别的应用服务器，相当于一个高性能的java环境主要功能：应用部署，事务管理，集群与负载均衡，安全控制，资源池化，消息中间件典型的使用场景：银行核心系统，电信计费平台，电商大促平台主要漏洞：T3反序列化，IIop反序列化，xml反序列化，未授权访问流量特征：T3协议攻击特征，未授权访问特征，.反序列化攻击特征危害：远程代码执行完全控制服务器（删库、安装后门）数据泄露
2025年渗透测试面试题总结-字节跳动[实习]安全研究员（题目+回答）独行soc 2025年渗透测试面试指南安全科技区块链 linux 职场和发展渗透测试网络安全
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录字节跳动[实习]安全研究员1.你投的岗位是安全研究实习生，你了解我们这边主要是做什么的吗2.自我介绍3.现在有什么比较想做的方向吗？4.有没有审过开源框架、cms、中间件之类的？6.在A公司主要做什么的？7.入侵检测主要在做什么？遇到的问题？核心工作：典型问题：8.误报原
Go语言Gin框架实战：开发技巧
Gin框架概述Gin是一个用Go语言编写的轻量级Web框架，以其高性能和简洁的API设计著称。它基于httprouter实现路由，支持中间件机制，适合构建高效的RESTfulAPI和微服务。核心特性高性能：利用httprouter的基数树路由算法，路由匹配速度快。中间件支持：允许通过中间件处理请求日志、认证、异常捕获等逻辑。JSON支持：内置JSON绑定与渲染，简化API开发。错误管理：提供统一的
【视频观看系统】- 技术与架构选型
✅项目技术选型方案一、整体架构风格项目层级技术选型说明架构风格微服务架构（SpringCloud）独立部署、易扩展、易维护服务通信HTTP（RestTemplate或Feign）+RocketMQ同步调用+异步事件注册中心Nacos服务注册、发现、配置中心配置中心Nacos配置管理多服务统一配置API网关SpringCloudGateway路由转发、权限验证、限流服务监控SpringBootAdm
Redis队列
关于「把Redis当作队列来用是否合适」的问题。有些人表示赞成，他们认为Redis很轻量，用作队列很方便。也些人则反对，认为Redis会「丢」数据，最好还是用「专业」的队列中间件更稳妥。从最简单的开始：List队列首先，我们先从最简单的场景开始讲起。如果你的业务需求足够简单，想把Redis当作队列来使用，肯定最先想到的就是使用List这个数据类型。因为List底层的实现就是一个「链表」，在头部和尾
全栈运维的“诅咒”与“荣光”：为什么“万金油”工程师是项目成功的隐藏MVP？云原生水神职业发展系统运维运维
大家好，今天，我们来聊一个特殊且至关重要的群体：运维工程师。特别是那些在项目制中，以一己之力扛起一个或多个产品生死的“全能战士”。你是否就是其中一员？你的技能树上点亮了：操作系统、网络协议、mysql与Redis中间件、Docker与K8s容器化、Ansible与Terraform自动化、Go/Python工具开发、Prometheus监控体系、opentelemetry可视化，甚至要负责信息安全
vivo Pulsar 万亿级消息处理实践（3）-KoP指标异常修复
作者：vivo互联网大数据团队-ChenJianbo本文是《vivoPulsar万亿级消息处理实践》系列文章第3篇。Pulsar是Apache基金会的开源分布式流处理平台和消息中间件，它实现了Kafka的协议，可以让使用KafkaAPI的应用直接迁移至Pulsar，这使得Pulsar在Kafka生态系统中更加容易被接受和使用。KoP提供了从Kafka到Pulsar的无缝转换，用户可以使用Kafka
1-Kafka介绍及常见应用场景 sql2008help kafka 分布式
Kafka介绍ApacheKafka是一个开源的分布式流处理平台，最初由LinkedIn开发，后捐赠给Apache软件基金会。它被设计用于高吞吐量、低延迟、可水平扩展地处理实时数据流。官网地址是：https://kafka.apache.org/以下是Kafka的核心介绍：核心概念消息系统(MessagingSystem)Kafka充当生产者和消费者之间的消息中间件，解耦系统，确保可靠的数据传递。
UA池和代理IP池 itLaity Python基础知识讲解与总结中间件 http py 代理模式
scrapy中中间件：位于scrapy引擎和下载器之间的一层组件作用：（1）引擎将请求传递给下载器过程中，下载中间件可以对请求进行一系列处理。比如设置请求的User-Agent，设置代理等（2）在下载器完成将Response传递给引擎中，下载中间件可以对响应进行一系列处理。比如进行gzip解压等。middlewares（中间件py文件）spider:从这里开始--->作用:产生一个或者一批url/
H3初识——入门介绍之路由、路由元数据
简介H3提供了灵活且高性能的路由系统，支持多种HTTP方法、动态参数和中间件组合，适用于现代Web服务开发。基本用法import{H3,serve}from"h3";constapp=newH3();//定义GET路由app.get("/",(context)=>{return"HelloH3路由!";});//定义POST路由app.post("/submit",async(context)=>
H3初识——入门介绍之serveStatic、cookie
简介H3是一个轻量、快速、可组合的服务器框架，适用于现代JavaScript运行时。它基于网页标准原语，如Request、Response、URL和Headers。你可以将H3集成到任何兼容的运行时，或者将其他支持web的处理器挂载到H3，几乎不会带来额外延迟。主要特性极简、快速、无依赖支持中间件和自定义路由兼容Node.jsHTTP服务安装npmih3@beta快速开始下面是一个使用H3创建简单
深入解读MCP：构建低延迟、高吞吐量通信中间件 LCG元 MCP 中间件
目录MCP核心架构设计MCP中间件架构图协议设计与消息格式MCP协议头结构消息体编码示例核心模块实现1.高性能网络层（基于Netty）2.零拷贝内存队列3.高效路由引擎4.消息持久化模块性能优化技巧1.批量合并写操作2.CPU缓存行优化3.内存池技术可靠性保障机制消息处理流程图实现代码：消息重试机制性能基准测试压测环境配置性能测试结果生产部署方案集群拓扑图部署脚本示例总结与最佳实践性能优化矩阵部署
RocketMQ延迟消息是如何实现的? java1234_小锋 java rocketmq
大家好，我是锋哥。今天分享关于【RocketMQ延迟消息是如何实现的?】面试题。希望对大家有帮助；RocketMQ延迟消息是如何实现的?超硬核AI学习资料，现在永久免费了！RocketMQ的延迟消息是通过特定的时间延迟来控制消息的消费时间，其实现方式主要是利用消息的定时投递和消息的定时存储，通常是基于以下两种方式：1.定时消息+事务消息方式（定时投递）RocketMQ通过在消息中设置定时投递的时间
RocketMq letian@ java-rocketmq rocketmq java
1rocketMq发送消息有几种方式？1同步发送可以拿到结果，等拿到发送的结果才能进行下一步2异步发送可以拿到结果但不需要等拿到结果也能进行下一步，有回调方法可以直到是否发送成功3单向发送拿不到结果，与下一步间隔极小没有回调方法，不关心消息是否发送成功，也是异步的。2RocketMq有哪些组成部分，他们分别的作用？他们之间的关系？rocketMq主要有nameServer和brokernameSe
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一