分布式存储系统设计 反熵 (Anti-Entropy)

转载:http://www.360doc.com/content/12/0614/14/7936054_218097481.shtml


Anti-Entropy 机制被用来保证在不同节点上的备份(replica)都持有最新版本。

由于涉及的处理很大,一般情况下,这种机制只用于永久性的错误恢复,而不用于普通的 read repair。如同 amazon dynamo一样。

另外,为了将节点间的数据传输降到最低,在实际数据传输前,各节点交换的是自己那份数据的message digest。实现中将采用 MerkleTree (其叶子节点存储的是数据文件,而非叶子节点存储的是其子节点的 Message Digest)


处理流程

1. recover过程从 Node A 创建一个repair session

2. recover过程从 Node A 开始 repair

3. Node A从请求信息中得到数据 replica所在的节点(例子中,除了 Node A外,还有 Node B和 Node C)

4. 迭代这个 replica 节点列表

    4.1.通过本地的消息服务发送 anti-entropy 请求到 Node B

       4.1.1 Node B接收并执行请求

    4.2.通过本地的消息服务发送 anti-entropy 请求到 Node C

        4.2.1 Node C接收并执行请求

    4.3.通过本地的消息服务发送 anti-entropy 请求到 本地 Node A(自己)

        4.3.1本地 Node A接收并执行请求

5. 初始化 MerkleTree

6. 对每行数据计算其 hash 值并加入到 merkleTree

7. 各节点将自己的MerkleTree作为 anti-entropy response 送给本地的消息服务

    7.1各节点的本地的消息服务将 anti-entropy response 返回给 Node A 的消息服务

8. ode A收集各个 anti-entropy response 中的MerkleTree与本地的 MerkleTree (4.3.1 收到为本地的的不同 (diff)

9. 如果需要通过 pipelineOut向 远程节点发送更加新的数据

10. 如要需要,通过 pipelineIn向远程节点请求理加新的数据

分布式存储系统设计 反熵 (Anti-Entropy)_第1张图片




riak的评论:http://stackoverflow.com/questions/5486304/explain-merkle-trees-for-use-in-eventual-consistency

你可能感兴趣的:(分布式存储系统设计 反熵 (Anti-Entropy))