Raft协议

一、概述

Raft协议是一种分布式一致性算法。它通过确保多个节点之间的日志复制达成一致,从而保证系统的可靠性和持久性。

Raft协议的设计目标是易于理解和实现,并且能够在网络发生分区或节点故障时继续正常工作。相比于其他一致性算法(如Paxos),Raft提供了更强的可读性和模块化性。

二、核心思想

Raft协议将分布式系统中的节点划分为领导者(Leader)、跟随者(Follower)和候选人(Candidate)三种角色。节点之间通过互相发送消息进行通信。
Raft协议的核心思想如下:

1.领导选举:当系统启动或者领导者失效时,节点可以竞选成为新的领导者。候选人会发送请求投票的消息给其他节点,如果获得大多数节点的支持,就成为新的领导者。

2.日志复制:领导者负责接收客户端的写请求,并将其转换为日志条目。领导者会将这些日志条目复制给其他节点,以确保所有节点的日志内容一致。

3.安全性:Raft协议具有安全性保证,只有在多数节点确认某个日志条目后,该条目才会被认为是已提交的,并且不会被丢弃。

4.容错性:如果节点发生故障或网络分区,Raft协议能够自动进行领导者选举并持续服务。一旦失去联系的节点重新加入系统,它会同步其他节点的日志以达到一致性。

三、理解Raft协议

Raft协议基于quorum机制,即大多数统一原则,任何的变更都需要超过半数的成员确认。
Raft协议_第1张图片
1、Leader Election
在集群初始化阶段,每个节点都会以Follower角色运行,在选举的过程中,每个Follower节点都会有个随机的选举超时时间,每个节点的超时时间可能会不一样,那意味着,一般情况下,有一个节点会率先成为Candidate。
Raft协议_第2张图片
Node B Election Timeout先结束后成为Candidate,然后开始发起投票:
Raft协议_第3张图片
其它节点在还没投票并接收到Candidate的心跳之后,会投票给Candidate:
Raft协议_第4张图片
并且其它节点在接收到心跳之后,会重置Election Timeout:
Raft协议_第5张图片
一旦获得了超过半数的投票,那么将成为Leader:
Raft协议_第6张图片
成为Leader之后,会不间断的向其它节点发心跳来维持自己的Leader身份:
Raft协议_第7张图片
如果其它某个节点由于网络原因或者什么原因导致在Ecection Timeout内无法接收到Leader的心跳,那么它就会成为Candidate,并发起投票,一旦获得超过半数的投票,将成为新的Leader。

如果有两个节点获得了相同的投票,那么此次Election将是无效的,会发起新一轮的投票:
Raft协议_第8张图片
两个Candidate分别获得其中一个Follower的投票,那么投票是相同的,无效的投票会影响集群的性能和稳定性,这也是为什么集群节点数是奇数的原因。

2、Log Replication
Leader的心跳也负责将写请求同步到其它所有的节点。

Raft协议_第9张图片
Leader通过心跳第一次将写请求发送到Follower,并且得到确认回复后,将响应返回给client,并将写请求commit
Raft协议_第10张图片
在下一个心跳将commit同步给Follower:
Raft协议_第11张图片
特殊场景:
Raft协议_第12张图片
由于网络原因,将集群网络分割成两部分,Node C也获得了超过半数的投票,成为一个新的Leader,那么整个集群就出现了两个Leader。
Raft协议_第13张图片
Raft协议_第14张图片
client在Node B的写请求得不到超过半数的确认,写请求将是uncommitted状态。在Node B上的写请求都是无效的。

当网络故障恢复后,整个集群将以Node C为Leader,因为C的Term更高,A和B的uncommitted变更都将roll back,并从C完成同步。

你可能感兴趣的:(云原生,分布式)