RocketMQ原理解析-broker 3.load&recover

Broker启动的时候需要加载一系列的配置,启动一系列的任务,主要分布在BrokerController 的initialize()和start()方法中

1.      加载topic配置

2.      加载消费进度consumer offset

3.      加载消费者订阅关系consumer subscription

4.      加载本地消息messageStore.load()

a)        Load 定时进度

b)        Load commit log

commitLog其实调用存储消费队列mapedFileQueue.load()方法来加载的。

遍历出${user.home} \store\${commitlog}目录下所有commitLog文件,按文件名(文件名就是文件的初始偏移量)升序排一下, 每个文件构建一个MapedFile对象, 在MapedFileQueue中用集合list把这些MapedFile文件组成一个逻辑上连续的队列

c)        Load consume Queue

遍历${user.home} \store\consumequeue下的所有文件夹(每个topic就是一个文件夹)

遍历${user.home} \store\consumequeue\${topic}下的所有文件夹(每个queueId

就是一个文件夹)

遍历${user.home} \store\consumequeue\${topic}\${queueId}下所有文件,根据topic, queueId, 文件来构建ConsueQueue对象

DefaultMessageStore中存储结构Map>

 

每个Consumequeue利用MapedFileQueue把mapedFile组成一个逻辑上连续的队列

d)        加载事物模块

 

e)        加载存储检查点

加载${user.home} \store\checkpoint 这个文件存储了3个long类型的值来记录存储模型最终一致的时间点,这个3个long的值为

physicMsgTimestamp为commitLog最后刷盘的时间

logicMsgTimestamp为consumeQueue最终刷盘的时间

indexMsgTimestamp为索引最终刷盘时间

 

checkpoint作用是当异常恢复时需要根据checkpoint点来恢复消息

 

f)         加载索引服务indexService

 

g)        recover尝试数据恢复

判断是否是正常恢复,系统启动的启动存储服务(DefaultMessageStore)的时候会创建一个临时文件abort, 当系统正常关闭的时候会把这个文件删掉,这个类似在linux下打开vi编辑器生成那个临时文件,所有当这个abort文件存在,系统认为是异常恢复

 RocketMQ原理解析-broker 3.load&recover_第1张图片

1)  先按照正常流程恢复ConsumeQueue

为什么说先正常恢复,那么异常恢复在哪呢?当broker是异常启动时候,在异常恢复commitLog时会重新构建请到DispatchMessageService服务,来重新生成ConsumeQueue数据,索引以及事物消息的redolog

 

什么是恢复ConsumeQueue, 前面不是有步骤load了ConsumeQueue吗,为什么还要恢复?

前面load步骤创建了MapedFile对象建立了文件的内存映射,但是数据是否正确,现在文件写到哪了(wrotePosition), Flush到了什么位置(committedPosition)?恢复数据来帮我解决这些问题。

 

每个ConsumeQueue的mapedFiles集合中,从倒数第三个文件开始恢复(为什么只恢复倒数三个文件,也许只是个经验值吧),因为consumequeue的存储单元是20字节的定长数据,所以是依次分别取了

Offset long类型存储了commitLog的数据偏移量

Size int类型存储了在commitLog上消息大小

tagcode tag的哈希值

目前rocketmq判断存储的consumequeue数据是否有效的方式为判断offset>= 0 && size > 0

                            如果数据有效读取下20个字节判断是否有效

                            如果数据无效跳出循环,记录此时有效数据的偏移量processOffset

                            如果读到文件尾,读取下一个文件

                  

                            proccessOffset是有效数据的偏移量,获取这个值的作用什么?

(1)    proccessOffset后面的数据属于脏数据,后面的文件要删除掉

(2)    设置proccessOffset所在文件MapedFile的wrotePosition和commitedPosition值,值为 proccessOffset%mapedFileSize

 

2)  正常恢复commitLog文件

步骤跟流程恢复Consume Queue

判断消息有效, 根据消息的存储格式读取消息到DispatchRequest对象,获取消息大小值msgSize

           大于 0  正常数据

           等于-1      文件读取错误 恢复结束

           等于0  读到文件末尾

3)  异常数据恢复,OSCRASH或者JVM CRASH或者机器掉电

当${user.home}\store\abort文件存在,代表异常恢复

读取${user.home} \store\checkpoint获取最终一致的时间点

判断最终一致的点所在的文件是哪个

从最新的mapedFile开始,获取存储的一条消息在broker的生成时间,大于checkpoint时间点的放弃找前一个文件,小于等于checkpoint时间点的说明checkpoint在此mapedfile文件中

从checkpoint所在mapedFile开始恢复数据,它的整体过程跟正常恢复commitlog类似,最重要的区别在于

(1)读取消息后派送到分发消息服务DispatchMessageService中,来重建ConsumeQueue以及索引

(2)根据恢复的物理offset,清除ConsumeQueue多余的数据

 

 

4)  恢复TopicQueueTable=Map

(1)          恢复写入消息时,消费记录队列的offset

(2)          恢复每个队列的最小offset

 

 

 

5.      初始化通信层

6.      初始化线程池

7.      注册broker端处理器用来接收client请求后选择处理器处理

8.      启动每天凌晨00:00:00统计消费量任务

9.      启动定时刷消费进度任务

10.  启动扫描数据被删除了的topic,offset记录也对应删除任务

11.  如果namesrv地址不是指定的,而是从静态服务器取的,启动定时向静态服务器获取namesrv地址的任务

12.  如果broker是master,启动任务打印slave落后master没有同步的bytes

如果broker是slave,启动任务定时到mastser同步配置信息


你可能感兴趣的:(rocketmq,RocketMQ原理解析,rocketmq,消息中间件)