区块链共识机制之拜占庭算法(BFT)及其发展

                              区块链共识机制之拜占庭算法(BFT)及其发展

本文为哈尔滨工程大学计算机学院2020春季区块链技术课程的附加作业,是由三位同学(2017201123王凯出,2017201406韩枫,2017201427王家旭)查阅相关资料和相关论文进行的总结描述,才疏学浅,如本文存在纰漏,还请指出,不胜感激。

一、什么是拜占庭将军问题

首先假设有10支军队,这10支军队在地域上分散驻扎,每支军队都由各自的将军指挥,将军们只能通过信使相互沟通。在观察敌情之后,他们必须制定一个共同的行动计划,如进攻或者撤退,只有当半数以上的将军共同发起进攻时才能取得胜利,其中一些将军可能是叛徒,负责消息传递的信使也可能是叛徒。

区块链共识机制之拜占庭算法(BFT)及其发展_第1张图片

 

叛徒可能擅自变更进攻意向或者进攻时间,甚至是传递假的进攻消息,在这种状态下,10名将军们能否找到一种分布式的协作方式,来让你们能够远程、准确无误的协商,从而赢取战斗呢?通过这个比喻,表达了计算机网络中所存在的一致性问题。这个问题被称为拜占庭将军问题。

拜占庭将军问题是由莱斯利·兰波特等人在其论文《The Byzantine Generals Problem》中提出的分布式对等网络通信容错问题。,他证明了将军总数>3f,背叛者<=f时,忠诚的将军可以达到一致的命令,即背叛者小于忠诚者一半人数。算法复杂度为O( n ^ (f+1) )。面向拜占庭将军问题的容错算法,解决的是网络通信可靠,但节点可能故障情况下的一致性达成。但由于此这一算法在实际的分布式系统中几乎无法应用。

二、实用拜占庭容错算法(PBFT算法)

该算法是Miguel Castro和Barbara Liskov在1999年提出来的,解决了原始拜占庭容错算法效率不高的问题,算法的时间复杂度是O(n2),可以在实际系统应用中解决拜占庭容错问题。

PBFT 可以保证如果我有3f+1的节点的话,即使其中有 f个错误或者没有响应,我依然可以得出共识的正确结果。我们共用3f+1个节点进行投票,假设一共有n个节点,当其中f个节点未响应或出错时,只能从剩下的n-f个节点进行判断。其中最坏的结果是f个节点都没有出错,而n-f个之中有f个出错,那么就剩n-2f及f+1个正确节点,多数者胜出,还是会判断正确。

PBFT算法的基本流程主要有以下四步 :

1)客户端发送请求给主节点

2)主节点广播请求给其它节点,节点执行PBFT算法的三阶段共识流程。

3)节点处理完三阶段流程后,返回消息给客户端。

4)客户端收到来自 f+1 个节点的相同消息后,代表共识已经正确完成。

区块链共识机制之拜占庭算法(BFT)及其发展_第2张图片

 

算法的核心三个阶段分别是pre-prepare阶段( 预准备阶段),prepare阶段( 准备阶段),commit 阶段(提交阶段)。图中的C代表客户端,0,1, 2, 3代表节点的编号,打叉的3代表可能是故障节点或者是问题节点,这里表现的行为就是对其它节点的请求无响应。0是主节点。

Pre-prepare阶段:节点收到pre-prepare消息后,会有两种选择,一种是接受,一 种是不接受。什么时候才不接受主节点发来的pre-prepare消息呢? -种典型的情况就是如果-一个节点接受到了一条pre-pre消息,消息里的v和n在之前收到里的消息是曾经出现过的,但是d和m却和之前的消息不一-致,或者请求编号不在高低水位之间,这时候就会拒绝请求。拒绝的逻辑就是主节点不会发送两条具有相同的v和n,但d和m却不同的消息。

Prepare阶段:节点同意请求后会向其它节点发送prepare消息。这里要注意一点,同一时刻不是只有一一个节点在进行这个过程,可能有n个节点也在进行这个过程。因此节点是有可能收到其它节点发送的prepare消息的。在一-定时间范围内,一个节点如果收到2f个不同节点的prepare消息,就代表prepare阶段已经完成。

Commit阶段:于是进入commit阶段。向其它节点广播commit消息,同理,这个过程可能是有n个节点也在进行的。因此可能会收到其它节点发过来的commit消息,当收到2f+1条commit消息后(包括该节点本身),代表大多数节点已经进入commit阶段,这一阶段已经达成共识,于是节点就会执行请求,写入数据。

三、高低水位解释

先介绍几个名词:

checkpoint,是当前节点处理的最新请求序号。比如一个节点正在共识的一个请求编号是1,那么对于这个节点,它的 checkpoint 就是1。

stable checkpoint,是已经共识完成的最大请求序号。也就是 f + 1个节点请求编号是10 ,那么stable checkpoint就是10。stable checkpoint为的是减少内存占用。当稳定是stable checkpoint是10 ,那么代表 10 号之前的记录已经共识过的了,可以删掉了。

stable checkpoint 可以设置一个范围,即水位,他的最小值叫下水位,最大值就高水位,他们的差 L 可以自定义。

图中A节点的当前请求编号是1039, 即checkpoint为1039,B节点的checkpoint为1133。当前系统stable checkpoint为1034。那么1034这个编号就是低水位,而高水位H=低水位h+L,其中L是可以设定的数值。因此图中系统的高水位为1034+100=1134。

举个例子:如果B当前的checkpoint已经为1134, 而A的checkpoint还是1039,假如有新请求给B处理时,B会选择等待,等到A节点也处理到和B差不多的请求编号时,比如A也处理到1112了,这时会有一个机制更新所有节点的stabel checkpoint,比如可以把stabel checkpoint设置成1100, 于是B又可以处理新的请求了,如果L保持100不变,这时的高水位就会变成1100+100=1200了。

区块链共识机制之拜占庭算法(BFT)及其发展_第3张图片

 

四、拜占庭算法的发展(EPBFT算法的设想)

结合区块链系统实际应用情况以及PBFT算法的缺陷,提出以下几点主要可改进的方案:

1) 改变客户端单点提交请求到主节点方案,而是向全网广播附上签名的交易数据。这样的方式更适合 P2P 环境。

2) 增加主节点选举过程,在主节点宕机或者被从节点“推翻之后”,进行主节点选举,选举标准按照最长链原则,选取拥有处理过最大视图号与最大编号请求的节点为新的主节点。

3) 增加数据同步及验证过程,在主节点选举完成后进行数据同步,同步时从节点对同步数据进行验证,若验证通过,才正式承认新的主节点,开始下一轮共识过程。

4) 通过给节点设置一系列状态,在不同的状态节点拥有不同的行为,共识节点通过在不同状态之间的转换从而在集群中拥有完整生命周期,从节点与主节点通过心跳保持联系, 从而使集群中的节点可以动态地加入和退出,使得在节点变动时不必重启系统,增加系统可用性。节点的状态转换过程如下图:

区块链共识机制之拜占庭算法(BFT)及其发展_第4张图片

 

你可能感兴趣的:(区块链共识机制之拜占庭算法(BFT)及其发展)