架构随笔

Raft 实现日志复制同步

本篇文章以 John Ousterhout（斯坦福大学教授）和 Diego Ongaro（斯坦福大学获得博士学位，Raft算法发明人）在 Youtube 上的讲解视频及 PPT 为蓝本，深入分析 Raft 的内部机制，并以日志复制同步（Replicated Logs）为背景，详细介绍使用 Raft 协议实现日志复制的共识性问题。

目标：日志复制同步

Raft 的目标是将日志完整地复制到集群内的所有服务器，这些复制的日志会被状态机所使用。假设我们希望程序或应用能可靠地执行，能够实现的一种方式是保证集群中所有服务器内的状态机都能按照相同的方式执行命令，这就是状态机复制同步的目的，这里的状态机通常指的是一个输入输出程序或应用。日志可以保证状态机执行相同的命令。下面介绍它的运作机制。

如果系统的客户端将要执行的命令传递给集群中的一台服务器，假设命令是 X ，那么它会被该台服务器记录，然后命令会被发送到其他服务器，并被其他服务器上的日志所记录。一旦命令被安全的复制到日志中，那么它们就能被发送到状态机供执行。当其中的一台状态机完成了命令的执行，结果会被返回给客户端。可以注意到只要各个服务器上的日志是相同的，各个服务器上的状态机就能以相同的顺序执行相同的命令，这样它们执行的结果也都是一样的。所以共识性模块的任务就是管理这些日志，并保证它们正确的在集群内复制并且决定何时将命令传送给状态机才是安全的。

我们将这一过程称为共识性方法的原因是我们不需要所有的服务器在任何时候都处于运行状态，实际上，系统只要在大多数服务器存活的状态下能继续正常运行和相互通信就可以。所以例如可能有 3 台服务器，那么我们就可以接受其中 1 台服务器宕机，只要有两台服务器是存活的即可；当服务器有 5 台时，我们就可以接受其中的 2 台服务器宕机，只要其中三台是正常运行的。

现在我们来简短地介绍希望系统能够处理的失败的情况。我们允许服务器崩溃，不过我们希望它们是 “失败-停止（fail-stop）” 的方式。也就是说，它们只是停止工作，或者在停止后又恢复，不过要求只要它们是处于运行状态的，它们的行为就必须正确。这个协议要求服务器不能有拜占庭行为做一些错误的操作。我们还允许网络的通信可以被打断，消息可以出现延迟或丢失的状态，甚至出现消息到达处于无序的状态。网络也有可能出现隔离的情况，然后又恢复正常。

达成共识性的方式

想要实现共识性算法主要有两种方式：第一种方式称为对称式或无主式，在这种方式下，所有的服务器都有相同的角色，它们有同等的权力，它们任何时候的行为几乎都是一样的，客户端可以与任何一台服务器进行通信。第二种方式称为非对称式或基于领导者（leader），服务器在任何时候都不是对等的，只有其中的一台服务器是领导者（leader），领导者负责集群的所有操作，其他的服务器只是简单地服从领导者发出的指令，在这种系统下，客户端永远与领导者通信，只有领导者才与其他的服务器发送通信。

Raft 就是使用上面第二种方式。它将共识性算法的问题分解成两类不同的问题，一种是在领导者正常运行下，进行的普通操作；另一种是在领导者崩溃时，需要对领导者进行重新选举，这种方式有其优势，它让普通的操作变得非常简单，不需要关心是否有多个领导者相互发生冲突，或同时发出指令，只要有一个领导者控制全局，就可以完全按照它的指令来运行。Raft 算法的复杂之处在于领导者发生变化时，因为当领导者崩溃时，会使系统处于不一致的状态，后续被选举的领导者需要对这些不一致状态进行清理。总体上说，基于领导者的方式要比无领导者的方式简单，因为无须担心不同服务器间会出现冲突，只须关心领导者发生变化的情况。

Raft 概览

Raft 算法共分成 6 个部分，首先我们要介绍的就是领导者的选举。

如何从所有的服务器中选择领导者？如何在当作为领导者的服务器崩溃时能检测到故障并挑选另一个领导者来替代它？
会介绍当领导者接收到客户端请求时，系统是如何处理正常操作的。这是 Raft 算法中最简单的部分。
会讨论领导者发生改变的情况，这部分是 Raft 中最复杂的，也是保证整个系统行为最重要的部分。首先，会讨论什么叫做安全，如何保证安全？其次，领导者是如何识别日志的一致性的，从而可以将系统恢复到处于一致状态下。
会讨论领导者发生改变时的另一个问题。如何让曾经崩溃死机的老领导者，重新回归到集群后集群的状态仍然能保持一致。
会谈论客户端是如何与集群交互的。关键点在于客户端是如何处理服务器崩溃，如何保证客户端发送的命令是线性的，即操作执行也仅执行一次。
最后会讨论如何处理配置变更的情况，即如何对集群增加或移除服务器。

服务器的状态

在对这六步进行详细地介绍前，先来介绍一些总体信息。

任何时候，服务器都处于以下三种状态中的一种：

领导者（Leader）：如前面已介绍的，领导者处理所有客户端的交互以及日志的复制同步，在任何时候只能有一个领导者。
跟随者（Follower）：绝大多数的服务器在大多数时间下都处于跟随者的状态，这些服务器完全处于被动状态，它们不会发起任何 RPC 调用，它们所做的只是对其他服务器发起的 RPC 调用做出响应。
候选者（Candidate）：它是处于领导者（Leader）与跟随者（Follower）之间的一种状态，它在只在选举新领导者的过程中临时出现，在系统处于普通状态下，只会有一个领导者，其他的服务器都是跟随者。

在上图最下面展现了一个状态图，它展示了三种状态，以及三种状态在不同条件下发生转变的情况。现在不会对此进行详细解释，但是在随后对算法作详细介绍时，就能发现它们之间的联系。

领导者任期

时序被分割为领导者任期，每段领导者任期都有一个序号，这些序号随着任期数的增加会自动增长，不会被重复使用。每段任期都分为两个部分，首先，任期是由选举开始的，这个过程会挑选任期内的领导者，如果选举成功，被选择的领导者会服务至本任期结束。在同一任期内，只有一台服务器可以被选择为领导者。**不过也会存在某些任期没有任何领导者，如果出现分票（Split Vote）就会出现这种情况，不存在获得大多数投票的领导者，当发生这种状况时，系统会即刻进入到下一个新的任期并尝试重新选举。**在 Raft 系统的所有服务器都保持着一个被称为当前任期的值，这个信息必须存于服务器的可靠媒介中（如硬盘）。这样就能在服务器崩溃之后得以重启并恢复。任期这个概念十分重要，它使 Raft 可以判断过期的信息。例如，如果一台服务器认为当前的任期号是 2 与另一台认为当前任期号为 3 的服务器进行通信，那么我们就能知道来自于服务器 2 的信息是过期的，我们只会使用来自于最新任期的信息。所以我们将会看到在某些情况下，会使用到任期来检查并消除过期的信息。

Raft 协议总览

上图是 Raft 协议的完整概括，目前还不会对它们进行详细的介绍，但是会简单介绍一些它的特性。

首先分别描述 Raft 协议里的三种角色：跟随者（Followers）、候选者（Candidates）和领导者（Leaders）。

其次描述需要在服务器磁盘上进行持久化存储的信息。

第三描述服务器是如何进行通信的，Raft 的所有通信都是基于远程过程调用的（RPCs），这里只有两种类型的调用：一种被称为远程过程调用投票（RequestVote RPC），它在选举的过程中被用来挑选领导者；另外一种远程过程调用是领导者用来执行正常操作，复制日志记录的。这是 Raft 系统使用的唯一两种远程过程调用的方式。这两种调用都可以很好的处理日志复制同步以及消息丢失等问题。

心跳检测及超时处理

现在让我来一一讲解 Raft 协议的六个组件。Raft 协议的第一个组件是选举。Raft 必须保证在任何时候只能有一台服务器作为集群的领导者。服务是以跟随者角色启动的，处于这种状态时，它不会与其他的服务器进行通信，跟随者完全是被动的，它只是简单地对来自于其他服务器的远程调用做出响应。不过，为了让跟随者一直处于跟随者的状态，必须使它们相信集群有一个活跃的领导者存在。 **唯一能实现的方式就是，如果它接收到来自于其他服务器的通信，无论是领导者或是候选者，**所以如果领导者想要保持它的领导地位，它就必须定期与集群的其他服务器进行通信，如果它没有与其他服务器进行主动通信的需要，那么它也必须发送心跳检测的消息，在 Raft 协议中，这些心跳检查消息也只是一些不含任何数据信息的 AppendEntries 远程调用。如果在一段时间内，跟随者没有接收到任何的远程调用，那么它会假定集群内没有可达或可用的领导者，所以它就会开始进行选举，看它是否有必要成为新的领导者。这段时间周期被称为选举超时（electionTimeout），通常集群将这个时间定为 100ms 到 500ms 。所以当集群启动时，所有的服务器都是作为跟随者的，没有领导者，所以它们都会等待这段超时，然后它们都会开始进行选举。

选举

当服务器开始进行选举的时候，它所做的第一件事情就是增加当前的任期号，创建一个比之前使用过的任何值都要大的新任期号。随后，服务器将它们自己从跟随者状态转换到候选者状态，在这种状态下，它的目标就是要让自己当选为领导者，为了这么做，它需要接收来自于大多数服务器的投票。候选者要做的第一件事情就是给自己投票，然后它会给其他所有服务器发送投票请求的远程调用（RequestVote），通常这些请求是并行发出的。如果它没有获得响应，它就会持续发送重试的请求，直到获得响应为止。

最终会出现三种情况中的其中一种：

第一，在大多数情况下，也是我们希望出现的情况就是候选者得到了多数票，然后它会将自己的状态转换为领导者并立即向集群其他服务器发送心跳检测，这可以建立它的领导者地位，有效的标记领导者所管理的范围。

第二，可能出现有其他的候选者也同时在运行，或许它们也有可能获得多数票成为领导者，在这个点上，如果候选者收到来自于有效领导者的 RPC 调用，那么它会立即放弃成为领导者的可能，随即回到跟随者的状态。

第三，有可能没有任何服务器得以获胜，如果存在有多个服务器都同时成为候选者，它们会导致分票，没有服务器会获得多数选票。为了检测到出现这种状况的可能性，随着时间的推移，当没有出现以上第一、第二种情况时，它既没有成为领导者，也没能获得来自于其他领导者的响应，那么它就会假定出现分票的情况。在这种情况下，只要简单地增加任期号，重新选举即可。

选举的安全及可用

选举有两个重要的属性：安全（Safety）和可用（Liveness）

安全（Safety） 指的是必须最多只有一个候选者可以在某一任期内赢得领导者地位。Raft 可以保证这件事。每台服务器只给一个候选者投票，一旦它投出选票，它就会拒绝来自其他候选者的任何请求。服务器并不关心它的票到底投给了哪台服务器。为了实现这种机制，服务器需要保证将自己的投票信息存储到磁盘，这样就能在服务器崩溃之后也能恢复到之前的状态。否则就会出现服务器已经作出投票，并在崩溃重启后，在同一任期内将票又投给了另外一个不同服务器的情况。因为每台服务器只能进行一次投票，而且每个候选者都必须获得多数票，也就可以发现，不可能出现两个候选者同时获胜的情况。

比方说有三台服务器在某一任期内进行选举，另外两台服务器显然无法获得多数票。不过后面会介绍不同任期间会出现不同候选者获胜的情况，但在某一确定的任期内，只有一个候选者可以被选举为领导者。

可用（Liveness） 需要保证一定有获胜者，这样系统不会永远处于没有领导者的状态。问题在于理论上，会反复出现分票的情况，多个候选者在同一任期内同时开始进行选举，这样就会导致分票，在超时之后，又进行新一轮的选举又再次出现分票，所以从理论上说这样的状态可以无限循环下去。Raft 需要分散出现超时的间隔，每台服务器都会随机的计算下次超时的间隔时间，这个时间间隔在 [T, 2T] 之间。 T 代表着选举超时的时间，即服务器可能出现超时的最短时间。通过将超时时间分散，可以降低两台服务器同时开始选举的机率，先启动的那台有足够的时间向其他所有服务器发起请求，并在其他服务器参与竞争之前就完成选举这个过程。当这个超时间隔时间远大于广播投票请求的时间时，这个策略会变得更为有效。这里的广播时间指的是，一台服务器与其他所有服务器通信所需的时间。

日志的结构

现在进入 Raft 协议的第二部分，即领导者用普通操作来处理日志复制同步时使用的机制。

首先，让我们说说日志本身。每台服务器无论是领导者还是跟随者，都各自保存一个日志副本。日志本身被分成了多条记录（Entries），记录是由下标索引的位置来进行唯一标识的，在记录内部有两个主要信息：首先，每条记录都包括供状态机执行的一条命令，命令的格式可以是客户端与状态所达成一致的某种格式。其次，每条记录都包括一个任期号，这个任期号是该条记录创建时，领导者所处的任期，随着日志记录的增多，这个任期号也会单调上升。每台服务器都必须保证日志能在崩溃后还可以恢复，所以日志本身通常是存于磁盘或其他一些稳定的存储介质中。无论服务器作何更新，它都需要在收到来自于其他服务器的响应之前，将内容写入到磁盘。如果某条记录已存储于大多数服务器，例如上图中的记录 7 （Entry-7），那么我们就称该条记录已提交（committed）。这是 Raft 协议里非常重要的一个属性。如果一条记录是已提交的，那么它就能安全被传送给状态机进行执行，Raft 可以保证该条记录的耐久性。在上图中记录 7 是已提交的，所有先于记录 7 的记录也是已提交的状态，但是记录 8 还处于未提交状态，因为它只存储于两台服务器上。

现在需要注意的是，在稍后讨论如何管理跨服务器日志间的一致性的时候，我会对提交（commitment）这个概念的定义作些许修改。

普通操作

普通操作比较简单，客户端将命令发送给领导者，领导者首先将命令写入它自己的日志中，然后向所有其他的跟随者发送 AppendEntries 的远程调用。通常这些调用的消息会被同时发送所有服务器，以并行的方式执行，并等待这些消息的响应。一旦领导者收到足够多的响应，它可以认为该条命令已经在多数服务器上处于已提交状态时，那么该条命令就可以被执行。领导者这时会将命令发送给状态机，当执行结束后，它会将结果返回给客户端。不仅如此，一旦服务器知道某个记录已经处于提交状态，它就会通过后续的 AppendEntries 远程调用告知其他的服务器。所以最终，每个跟随者都会知道该记录已提交，并且将该命令发送至自己本地的状态机执行。如果跟随者崩溃了或处于慢响应状态，领导者会反复重试这个调用，直到跟随者恢复后，领导者就能重试成功。但是领导者并不需要等待每个跟随者的响应，它只需要等到足够数量的响应，保证记录已被大多数服务器存储即可。所以这样就能在一般情况下获得很好的性能提升。也就是说，在通常情况下，只需要获得大多数服务器的应答，领导者就可以立即执行命令，并将结果返回至客户端。例如，如果某个服务器很慢，这并不能影响客户端获得响应的速度，因为领导者并不需要一直等待该台服务器。

日志的一致性

Raft 期望能将集群日志维持高水准的一致性。理想状态下，这些日志在任何时候都是相同的，甚至是服务器崩溃时也如此。Raft 会尽可能的保证在不同服务器上的日志是一样的。上图的内容会列出一些重要的属性，它们在任何时候都是有效的。

第一，日志记录的索引以及任期号的组合可以唯一标识一条日志记录。也就是说如果有两条记录的索引是一样的，任期号也是一样的，那么就可以保证它们所存储的命令也是相同的。除此之外，还能保证在这条记录之前的所有记录都能相互匹配。所以任期号和索引的组合可以唯一标识整个日志的起始至该点的位置。如果某条记录是已提交的，那么其所有前序的记录都应该处于已提交状态。这也与之前介绍的规则一致，如果发现服务器存储记录（如上图的记录 5），因为有了以上规则，它们存储的前序记录也必须相同。所以这些前序记录也存在于集群的大多数服务器上。

AppendEntries 一致性检查

这个属性强制在 AppendEntries 远程调用时进行检查，当领导者向跟随者发起 AppendEntries 调用时，除了新创建的新日志记录，它还包括两个值。他包括当前新记录前序记录的下标位置索引以及任期号，跟随者只会接受与它日志匹配的远程调用，如果跟随者的日志没有相应的记录，那么它会拒绝这个远程调用。

让我们来看一个例子，假设领导者从客户端接收到一个新命令 jmp ，它将这个命令以 AppendEntries 远程调用的方式发送给跟随者，包括它前序记录的下标位置索引以及任期号，这里下标位置索引是 Index-4 ，任期号是 Term-2 。这样跟随者会将此信息与它自己当前日志的记录匹配，然后接受创建新的记录。如上图下半部分，跟随者的当前最新记录与领导者的前序记录的信息不匹配，这样跟随者会拒绝接受远程调用的请求。

这个一致性检查的过程非常重要。可以将这个过程看作一个归纳的步骤，从而保证前面一致性里所讲的内容。它要求前序每条记录都能满足此条件，所以这意味着如果一个跟随者接受了来自领导者的新记录，它的日志记录也与领导者的日志记录是完全匹配的。

以上就对普通操作的介绍告一段落。接下来介绍领导者变更的情况。

领导者变更

当领导者发生变更时，新领导者面对的状态不一定是干净的，因为前一领导者可能在它完成复制同步之前就已经崩溃了，当 Raft 处理这个问题时，它在新的领导者被选出之前，不会有任何特别的操作，不会存在一个独立清理过程，清理过程是在普通操作过程中发生的。原因是当新领导者被选出后，某些服务器可能还处于宕机的状态，不可能立刻对它们的日志进行清理，必须能有操作恢复它们，而且在这些机器重新加入集群之前可能会要等待很长一段时间，所以就必须对系统进行设计，要求普通操作最终能让所有的日志达成一致状态。为了达成这个目标，Raft 始终会认为领导者的日志总是正确的，所以对于所有领导者，它们必须时刻的让跟随者的日志与自己保持一致，但同时还是有可能出现在领导者未完成任务就崩溃的情况，所以就会出现一个又一个的新领导者。所以，在极端扭曲的状态下，日志记录会无限堆积并出现混乱的状态，就如上图所示的那样。

为了简单起见，上图中只显示了下标索引位置以及任期号，没有显示具体的命令信息。

当服务器 S4、S5 在任期 2、3、4 时是领导者，但是由于某些原因，它们无法完成对其他服务器（S1、S2、S3）上日志的复制同步，然后它们崩溃了，系统在一段时间内处于分隔状态，服务器 S1、S2、S3 在任期 5、6、7 内成为领导者，但同时也无法与服务器 S4、S5 进行通信，要求它们进行相应的清理操作。这就会出现上图中所示的状态，日志完全是混乱的。这里的关键在于 S1、S2、S3 的索引 1-3 以及 S4、S5 的索引 1-2 区域。这些都是已提交状态的记录，所以我们必须保留它们，但其他的日志记录都是未提交的，所以到底是保留还是丢弃它们并不重要。我们还没有将它们传入状态机，也没有客户端得到了这些命令的执行结果。所以它们都是可以丢弃的。

例如，假设服务器 S4 是任期 7 的领导者，而且它可以与其他所有服务器通信，那么它最终会让集群里其他服务器上的日志与它自己的保持一致，并删除那些与之冲突的记录。在介绍领导者是如何让其他服务器上日志与之保持一致前，首先需要介绍两个概念：正确性（Correctness）和安全性（Safety）。我们是如何知道系统的行为是正确的？如何知道它们没有丢失一些重要信息？因为这里可以看到，为了让集群回到一致的状态，有些日志记录会被丢弃。我们是如何安全地做到这点的？

安全性的要求

几乎所有的日志复制同步系统都会对安全性有所要求，一旦某个状态机接收了一条日志记录并执行，我们必须保证不存在其他的状态机执行不同的命令。需要保证所有的状态机，以相同的顺序执行相同日志记录的命令。为了达成总体的安全性要求，Raft 实现了一个安全属性，一旦领导者决定某个特定记录已提交，那么 Raft 就需要保证该条记录会出现在它所有未来领导者的日志记录中，并且也处于已提交状态。如果我们可以让 Raft 遵从这个属性，那么它就自然可以保证以上的安全性要求。首先，领导者永远不会覆盖日志记录，它只会追加，正如我们所知，作为领导者时，这些日志记录永远不会被改变，其次，为了到达已提交的状态，记录必须在领导者日志中，这样就不会有其他值会被提交，第三，日志记录必须在发送给状态机执行之前被提交，所以将以上三点放在一起，我们就能使该属性可以满足安全性的要求。

目前为止，我们对 Raft 的描述还不能保证这个属性。下面我会来看看 Raft 是如何解决这个问题的。不过在此之前我们需要再看看，如果某条记录是已提交的，那么它在未来的领导者日志记录中也必须是已提交的。为了满足这个要求，我们会从两个方面对 Raft 算法作出修改。首先，我们会修改选举过程，将日志记录不正确的那些机器排除在选举之外，其次，会对已提交的定义做略微的调整。有时在知道安全之前，我们会延迟一条记录的提交。

下面会先介绍选举相关的问题

挑选最好的领导者

如何保证选择的领导者有所有已提交的日志记录？首先，这有点微妙，事实上我们无法辨别哪些记录是已提交的，假设有如上图的三台服务器，我们需要选择一个新的领导者，但其中的一台服务器不可用，那么只要在这个过程中，查看可用的服务器，我们此时是无法分辨记录 5 是否已提交，它依赖于不可用服务器上存储的内容。在这个例子中，记录 5 是已提交的，但在其他情况下，可能不是。可以肯定的是我们无法知道哪些记录已被提交了。所以我们能做的就是找到一个候选者，这个候选者很有可能包括所有已提交的记录，我先从直观上尝试解释如何做到的，然后在用精确的方式加以证明，我们是能够挑选到候选者存有所有已提交的记录的。

我们通过比较日志的方式来实现。当一个候选者发起投票请求，它会包括自身的日志记录信息，位置索引 index 以及最后一条日志记录的任期号 term 。当响应投票的服务器接收到请求，它会将候选者的日志信息与自己的日志信息进行比较，如果投票者的日志更完整，那么它会拒绝投票 (lastTermV > lastTermC) ||(lastTermV == lastTermC) && (lastIndexV > lastIndexC)。结果是赢得选举的服务器可以保证比大多数投票者有更完整的日志记录。

让我们看看实际到底是如何工作的。

在当前任期提交记录

最有趣的情况恰好是在领导者决定刚决定日志记录是已提交的时候，会有两种场景：

第一种：提交的记录是在当前任期

这里任期 2 以及领导者（S1）刚成功调用 AppendEntries 至 S3 ，此时它发现记录已在大多数服务器上存储，随即标记该记录是已提交的，并将其传送给状态机。此时这条记录是安全的，下一任期的领导者必须认定该记录的已提交状态。正如之前介绍的规则，S5 是无法成为下一任期的领导者，S4 也无法成为领导者，所以只有 S1、S2、S3 可能被选举成领导者，实际上，如果 S1 在它们中间，S1 一定可以保证赢得选举，但 S2、S3 也可以通过获得其他服务器（S4、S5）的投票，获胜成为领导者。但在任意一种情况下，下一任期的领导者都必须包含该日志记录。

第二种：提交的记录是在前序任期

在这种状态下，领导者在任期 2 只复制了两台服务上的日志记录，随后任期 3 的领导者（S5）于某些原因没有关注到这些记录，在它本地创建了一些记录，然后崩溃了。然后在任期 4 上，领导者（S1）作为试图将其他服务器上的日志内容与它自己的达成一致。所以它让服务器 S3 复制了它自己 Term-2 记录，在这个点上，该记录已被领导者知道存于大多数服务器上，但该记录并没有安全的被提交。因为此时 S1 可能出现崩溃，S5 成为领导者，因为它的前序任期值 3 较大，所以它可以获得来自于 S2、S3、S4 的投票，如果它当选，那么它会试图将自己的日志推到其他的服务器，这也就意味着从 S1 - S4 下标位置索引 3 开始的所有记录都会被删除。所以此时我们还无法认定记录 3 是否已经提交。

新提交规则

在这种情况下，新的选举规则并不足以保证安全性（Safety），我们还需要修改提交的规则。到目前为止只要领导者发现记录已存于大多数服务器，那么它就认为该记录已被提交。但是为了保证安全性，我们需要增加另一条规则。除了上述规则，领导者必须能看见至少有一条来自于它本任期内的记录也存于大多数服务器。回到之前的例子，如果领导者完成了记录 3-2 的复制，它此时还无法提交该记录并将其发送给状态机，取而代之的是，它必须等待直到它当前任期内的第一条记录（4-4）提交并存于大多数的服务器。至此，两条记录才能都发送给状态机。这么做的原因在于，在这种状态下，服务器 S5 是不可能被选举为下届领导者的，因为有更多的服务器处于更近的任期（任期 4），服务器 S5 只能从服务器 S4 处得到选票。此时，记录 3 和 4 都是安全的。所以将新选举规则与新提交规则相结合，我们就能保证 Raft 的安全属性总是有效的。即一旦领导者决定记录已提交，它就会对未来的所有领导者可见。这里我们展示的例子只说明，已提交的记录对下一任期的领导者可见，但也可以很容易就证明，每个未来的领导者也会有相同的日志记录。

日志的不一致

现在我们可以保证安全性，也明白了日志是正确的。那么我们如何让所有跟随者的日志都与领导者保持一致呢？首先，让我们来看看日志不一致可以出现怎样的情况。

跟随者可能会丢失记录（如 (a)-10、(b)-5、(e)-8）

需要做的是剔除所有不同的日志记录，并将所有丢失的记录根据领导者的日志填充完整。

修复跟随者的日志

要想恢复到一致状态，领导者会为每个跟随者维护一个状态变量，这个变量称为 nextIndex，这个变量存储日志的下一条记录的下标位置索引，服务器会把这个位置发送给跟随者（如上图所示，nextIndex = 11）。**当一台服务器成为领导者后，它会将 nextIndex 值设置成当前日志记录的下一位置。**所以在上面的例子中，任期 7 的领导者的最后一条记录的索引位置是 10 ，那么它会将 nextIndex 设置成 11 。**领导者会根据 AppendEntries 调用发现一致性问题，因为当跟随者接收到 AppendEntries 调用时，都会进行检查。**这个检查就可以发现所有的问题。所以当下一次领导者想要与跟随者进行通信时，它都会包括下标位置索引（10）以及任期号（6）作为请求的参数。**当选为领导者后，下一次请求也有可能是以心跳检测的方式发送的，心跳检测与 AppendEntries 调用的方式一样，只是没有新值创建，但还是包括一致性检查的。**所以当消息到达跟随者（a）后，它会将接收到的下标位置索引与任期与自己的日志信息进行比较，并没有匹配的记录，所以它会拒绝 AppendEntries 请求，当领导者收到拒绝的响应之后，它的响应很简单，它要做的只是将 nextIndex 减 1 ，所以这个值就变成了 10 。如此逐一减少，直到最终 nextIndex 为 5 的时候，领导者再次发送请求的信息会包括下标位置索引（4）以及任期号（4），这时它与跟随者（a）当前的日志记录信息是相匹配的，所以这时跟随者会接受 AppendEntries 请求，并追加记录 5-4 。直到领导者将跟随者的日志记录填充完整。相似的过程也会在跟随者（b）上出现。当 nextIndex 减少到 4 时，领导者会包括下标位置索引（3）以及任期号（1）作为请求的参数，并修正跟随者（b）上的日志记录。

这个过程还需要注意一点，当跟随者接收来自于领导者的替换请求时，它会将后续的日志记录截断并删除后续的所有日志记录，在上述的例子中，如果领导者发送请求（4-4），nextIndex = 4 ，这时跟随者的记录为 4-2 ，是不一致的，这时它不仅会将 4-2 覆盖，同时还会删除剩余的所有记录，因为在不一致的记录后也都是不一致的记录。

现在对领导者发生变更的情况作个小结。总体上需要解决两个问题：一个是需要保证系统的安全性，第二个是一旦新的领导者开始行使权利，它要做的事情就是使所有跟随者上的日志记录与自身保持一致，AppendEntries 的一致性检查会为我们提供所有的信息。

平衡旧领导者（Neutralizing Old Leader）

Raft 协议的第四步也是与领导者更替相关的。旧领导者有可能并不是真的死了。例如出现了网络的隔离，将领导者与集群内其他服务器分隔，那么剩下的服务器会等待选举超时，并选举一个新领导者，那么问题来了，如果旧领导者又重新恢复连接怎么办？这个旧领导者并不知道已经重新进行了选举，也不知道新领导者的存在。所以这时它还会试图以领导者的身份继续运行，它还会与跟随者进行通信，并试图让其他跟随者与自己的日志记录保持一致，我们必须阻止这个事情的发生。

**可以使用任期来防止这种情况的出现。因为每个 RPC 请求都包括发送者的任期号，当 RPC 接收时，接受者会将其与自己的任期号相比较，如果不匹配，则会更新那些过期的记录。**所以如果发送者的任期比接收者的要老，那么就表示发送者是过时的，这时接收者会立即拒绝 RPC 请求，并将包括了接收者任期信息的响应发送回发送者，这样当发送者接收到响应时就会意识到，它的任期号是过期的，此时它就会停下并作为跟随者继续运行，同时它还会更新自己的任期号，并与其他服务器保持一致。反之，如果接收者的任期号更老，如果这时接收者不是跟随者，那么它也会停下，并作为跟随者，而且更新它自己的任期号。略微不同的是接收者不会拒绝 RPC ，它会接收 RPC 请求。

这里比较有趣的是选举过程会导致任期号的更新，即当候选者请求投票并与大多数服务器发生通信后，它会将自己的任期号随着 RPC 请求发送出去，这样所有的接收者都会更新自己的任期号，并与候选者保持一致，所以当新领导者被选出后，集群里的多数服务器都会更新到这个任期号。这也就意味着，一旦选举完成，被罢免的领导者是无法提交新记录的，因为它需要与至少一台服务器进行通信，这样它就能发现自己的任期号更老，这时它就会停止领导者的行为并作为跟随者继续运行。

还有一些比较典型的场景，这里不作更多的讨论，但可以用任期号来处理所有类似的问题。

客户端协议

现在让我们看看 Raft 协议的第五部分，即客户端是如何与系统进行交互的。这点并不复杂，客户端将命令发送给领导者，并获得响应，如果客户端不知道哪台服务器是领导者也没关系，它可以与集群的任意一台服务器进行通信，如果这台服务器不是领导者，那么它会告知客户端，并将客户端重定向到领导者，然后客户端会再次发送请求。只有在领导者记录下命令，并已经将其提交，然后发送给状态机执行之后，才会将结果返回给客户端。这里比较微妙的是，如果领导者发生崩溃或请求发生超时该怎么办？如果发生这种情况，客户端会随机挑选另一台服务器并再次发送请求，最终它会将请求发送到新的领导者，新的领导这会执行该命令。这个可以保证命令最终总能被执行。

但这留有一个风险，即命令有可能被执行两次。

问题在于领导者会在执行完命令后响应客户端之前发生崩溃，所以命令本身是无法知道自己是否被记录或已被执行。这时客户端就会再次发起请求，这样命令就又被执行了一遍。这是不能被接受的，因为我们要每条命令执行且仅被执行一次。Raft 解决这个问题的办法是让客户端为每条命令生成一个唯一的 ID ，并将其与命令一起发送给领导者，当领导者记录该条命令时，也会包括这个唯一 ID ，但在领导者接受命令之前，它会进行检查，看其他记录中是否已存在相同的 ID ，如果存在相同的，那么它就会知道该条命令请求是多余的，所以它会找到该条记录，并忽略这条新命令，并将老的执行结果返回给客户端。

所以只要客户端不崩溃，结果最多只会被执行一次。这也是我们希望系统应该具备的线性一致性。

接下来要介绍 Raft 协议的第六部分，也是最后一部分。

配置变更

我们已经有了应对配置发生变更的处理机制。当我们提到配置，指的是集群服务器的信息，包括每台服务器的 ID 、网络地址等。这些信息都非常重要，因为我们需要用它们来决定多数票的具体数量，从而进行领导者选举或用来提交日志记录。我们要支持这些变更的原因在于，比如当服务器出现故障的情况，它们可以被新的机器替换，或者集权管理员希望能更改副本数量，我们希望所有的这些事情都能在安全自动的条件下完成，不要因为配置的变更导致系统出现故障或停机的情况。

必须要意识到，我们无法直接从旧配置切换到新配置。我们来看个例子。假设系统集群有三台服务器正在运行，这时我们希望再增加两台服务器，所以最终集群内会有五台服务器。如果我们只是要求每台服务器从旧配置切到新配置，问题是这个切换不能无法同时完成，时间上总会有先有后。而这可能会导致冲突的大多数。因为 S1、S2 可以在某个时候形成旧集群的大多数，并决定领导者。而与此同时，另外三台服务器 S3、S4、S5 已经切至新的配置，它们也形成了该配置状态下的大多数。所以它们也可以决定领导者，确认提交状态。这样就会与 S1、S2 发生冲突。这样，我们就需要使用两段协议（two-phase protocol），无法在一段内达到目的。

这当然也是所有分布式决策的所必须使用的方式。

联合共识

解决方案是使用两段协议的方式来更改配置信息。

Raft首先切换到称为多边共识（joint consensus）的中间阶段。在这个阶段中，集群包括所有的服务器上新旧两种配置，但是如选举和提交的决策，需要在新旧两个独立的配置状态下达成一致。

集群配置以 C_old 开始，然后客户端向领导者发送请求，当接收者收到请求（Leader收到从 C_old 切换成 C_new 的成员变更请求）之后，会向日志里新增一条记录，要求记录新配置 C_old+new ，配置与其他普通的命令记录一样，领导者会用 AppendEntries RPC 请求将其发送给集群的其他服务器，**配置变更唯一的不同在于它们会立即生效，一旦服务器将新配置记录到日志中，那么它就立刻生效，并不需要等待该日志记录变为已提交状态。所以此时在领导者上已经认为 C_old+new 已生效，这意味着对于要提交的任何日志条目，要求该条目分别在新旧配置服务器下同时都成为大多数。**现在，在该条目被复制或到达提交点之前，可能会使用C_old或C_old+new作出决定。例如，如果领导者在记录新配置记录后就发生崩溃，有可能某些其他旧配置的机器仍然处于工作状态，被选举成领导者管理集群。但在某个时间点，C_old+new 会变为已提交的状态，在此种状态下，任何机器就无法只根据 C_old 来做出决策。为了让领导者被成功选举，它必须保证所有的记录都已提交，所以一旦 C_old+new 记录已提交，它就能保证任意选举的领导者都有该记录，也就是说领导者已使用该配置。所以在这个时候，集群是处于联合共识下运行的，一旦联合共识被提交确认，领导者就可以将配置变更 C_new 写入日志记录，并发送给集群其他服务器。所以在这个时候，集群下服务器配置可能在 C_new 或 C_old+new 的状态，因为这时服务器也可能再次出现崩溃，另一服务器会替代成为领导者，并使用联合共识下的 C_old+new 配置。但最终新配置记录 C_new 会处于提交状态，一旦出现这种情况，集群所有未来的决策都将基于 C_new 。所以关键在于，不存在 C_old 或 C_new 在不进行相互协调的前提下就能做出决策的情况。C_old 可以独立做出决策，C_new 也可以独立做出决策，但是两者不会发生重叠。在这两段时间之间，两个配置需要相互协调，这就能保证，集群不会两个独立的达成共识的群体存在。

在这里，两段协议是一个基础协议。任何共识性算法都需要使用两段协议来对配置进行变更，实际上任何分布式一致都需要两段协议。

这个协议还有些需要注意的地方。

在过度期间，有可能服务器来自于任何一种配置都能被选举为集群领导者，这里比较微妙的是如果当前的领导者不在新配置里，那么它最终会停下，并转换为跟随者。在 Raft 里，旧领导者在 C_new 处于已提交状态后立即停止并转换成跟随者。这时其他的跟随者会超时，并选举新的领导者，这时被选举的领导者所使用的配置一定是 C_new 。尽管如此，旧的领导者也还是会领导一小段时间。

总结

参考

2013 Raft lecture, Diego Ongaro
2013 Raft user study
Wiki: Byzantine fault tolerance

你可能感兴趣的:(分布式一致性协议,raft)

常见的消息队列（MQ）及其区别
常见的消息队列（MQ）及其区别消息队列协议特点适用场景性能表现消息持久化方式是否保证消息顺序RabbitMQAMQP功能完备、稳定可靠，支持多种消息路由模式适用于对消息可靠性和事务支持要求较高的应用高可靠性，但在高并发下性能一般消息和队列都可以设置为持久化，保证重启后不丢失支持顺序消息，顺序性较好Kafka自定义协议高吞吐量、低延迟、良好的可扩展性适合处理海量的日志数据、大规模数据场景极高吞吐量，
火绒终端安全管理系统V2.0访问控制功能大揭底火绒终端安全管理系统火绒安全安全网络网络安全火绒
火绒终端安全管理系统V2.0访问控制功能，提供针对IP协议层访问控制、计算机应用程序执行与网络访问、设备控制等功能的查看与细节配置。协议控制在IP协议层控制数据包进站、出站行为，并且针对这些行为做规则化的控制。需用户或管理员手动配置对应规则，当发现有触发IP协议控制规则的操作时，火绒可根据用户设置的规则放过或阻止。IP黑名单当终端有不受欢迎的IP访问时，用户可以添加这些IP加入IP黑名单中，以阻止
RHEL5系统配置双网卡绑定 Linux GvCybersecurity linux php 运维
使用Linux配置双网卡绑定以提高网络性能在企业网络环境中，使用多个网络接口卡（NIC）可以提高网络性能和可靠性。在RedHatEnterpriseLinux5（RHEL5）系统中，我们可以配置双网卡绑定（也称为网卡绑定、链路聚合或链路聚合控制协议）来利用多个网络接口卡的带宽。本文将介绍如何在RHEL5系统中配置双网卡绑定。双网卡绑定的优势双网卡绑定通过将多个NIC绑定为一个逻辑接口，提供了以下优
4.WebSocket 配置与Nginx 的完美结合 m0_74822999 面试学习路线阿里巴巴 websocket nginx 网络协议
序言在现代web应用中，WebSocket作为一种全双工通信协议，为实时数据传输提供了强大的支持。若要确保WebSocket在生产环境中的稳定性和性能，使用Nginx作为反向代理服务器是一个明智的选择。本篇文章将带你了解如何在Nginx中配置WebSocket，并验证其是否正常工作。1.Nginx中的WebSocket配置1.1安装Nginx在进行配置之前，确保你的系统上已安装Nginx。你可以使
RESTful（REST风格）是什么？（Java学习笔记） L葵-阳S Spring MVC java restful 学习
RESTful（REST风格）是一种当前比较流行的互联网软件架构模式，它充分并正确地利用HTTP协议的特性，为我们规定了一套统一的资源获取方式，以实现不同终端之间（客户端与服务端）的数据访问与交互。RESTREST:RepresentationStateTransfer的缩写,中文意思就是：表现层资源表诉状态转移。Resource（资源）当我们把Web工程部署到服务器中，那么工程中的所有的内容都可
HTTP协议中Options请求的使用场景阿湯哥 http 网络协议网络
在HTTP协议中，OPTIONS请求方法主要用于以下两种典型场景：1.CORS预检请求（PreflightRequest）当浏览器发起跨域请求（不同源）且请求满足某些条件时，浏览器会自动先发送一个OPTIONS请求（称为预检请求），以确认服务器是否允许实际请求。触发条件（满足任意一条即触发预检）：使用非简单请求方法（如PUT,DELETE,PATCH等，简单方法仅限GET,HEAD,POST）。请
HTTPS与SSL证书的关系后端
HTTPS与SSL证书：安全通信的基石在当今互联网时代，网络安全至关重要。HTTPS和SSL证书是保障网站安全通信的两大关键要素，它们之间密不可分，共同为用户构建起安全的网络环境。一、HTTPS：安全的通信协议HTTPS(HypertextTransferProtocolSecure)是HTTP的安全版本，用于在浏览器和网站之间进行加密通信。它通过在HTTP协议的基础上加入SSL/TLS协议，对传
Python SMTP：邮件发送的强大工具 lsx202406 开发语言
PythonSMTP：邮件发送的强大工具在当今的信息时代，电子邮件仍然是企业、个人之间沟通的重要方式。Python作为一种功能强大的编程语言，提供了多种库来支持邮件发送。其中，SMTP（SimpleMailTransferProtocol，简单邮件传输协议）是最常用的邮件发送协议之一。本文将详细介绍Python中使用SMTP发送邮件的方法，并探讨其应用场景。SMTP简介SMTP是一种用于在互联网上
TCP-UDP-DHCP协议介绍 1op 网络协议网络安全
1.UDP协议UDP是工作在OSI（开放系统互连，OpenSystemsInterconnection）模型中传输层的协议。它使用IP作为底层协议，是为应用程序提供一种以最少的协议机制向其他程序发送消息的协议。其主要特点是无连接，不保证可靠传输和面向报文。2.TCP协议TCP（TransmissionControlProtocol，传输控制协议）是一种面向连接的、可靠的、基于字节流的传输层通信协议
网络工程师干货：TCP/IP协议大全 wljslmz 网络技术网络 tcp/ip php
TCP/IP协议是现代计算机网络通信的基础，是互联网及局域网广泛使用的一套协议。TCP/IP协议集包括许多协议，其中最重要的是传输控制协议(TCP)和因特网协议(IP)。这些协议定义了数据如何在网络上进行传输和接收，为网络设备提供了通信的规则和标准。TCP/IP协议集采用分层模型，以便于网络的设计、实现和管理。TCP/IP协议模型由四个层次组成，分别是应用层、传输层、网络层和网络接口层。每一层负责
Figure自研模型Helix发布，人形机器人迈向新纪元？(2) 广拓科技机器人
Figure自研模型Helix发布，人形机器人迈向新纪元？Helix作为Figure公司自主研发的端到端人形机器人视觉-语言-动作（VLA）通用大模型，在技术层面实现了多项重大突破，为机器人的智能化发展开辟了新的道路。（一）工业领域变革Helix模型在工业领域展现出了巨大的应用潜力，有望引发工业生产方式的深刻变革。目前，Figure公司已与宝马签署合作协议，计划在宝马位于美国南卡罗来纳州的工厂内部
精准识别IP应用场景 IpdataCloud tcp/ip 网络协议网络
基于全球领先的IP应用场景识别服务IPv4/IPv6全量数据库，为企业提供高精度、低延迟的场景化解析能力，助您构建更安全、智能的网络生态。精准识别，毫秒响应全量数据覆盖，依托全球最大的IP地址库，支持IPv4/IPv6双协议解析，精准识别19类核心应用场景，包括企业专线、政府机构、移动网络、卫星通信等细分类型。通过返回运营商、ASN号及场景分类标签，企业可快速判断IP属性，识别异常流量风险。IP应
【计算机网络】数据链路层数据帧（Frame）格式菜萝卜子计算机网络计算机网络网络
在计算机网络中，数据帧（Frame）是数据链路层的协议数据单元（PDU），用于在物理介质上传输数据。数据帧的格式取决于具体的链路层协议（如以太网、PPP、HDLC等）。以下是常见数据帧格式的详细说明：**以太网（Ethernet）数据帧格式**以太网是最常用的局域网技术，其数据帧格式有两种标准：IEEE802.3和EthernetII（DIX标准）。以下是EthernetII的帧格式：字段长度（字
HTTPS（超文本传输安全协议）工作过程小许不内卷 https 网络协议 http
一、简述HTTPSHTTPS超文本传输协议（全称：HypertextTransferProtocolSecure），是以安全为目标的HTTP通道，在HTTP的基础上通过传输加密和身份认证保证了传输过程的安全性。HTTPS在HTTP的基础下加入SSL，HTTPS的安全基础是SSL，因此加密的详细内容就需要SSL。HTTPS存在不同于HTTP的默认端口及一个加密/身份验证层（在HTTP与TCP之间）。
防御-day6-内容安全小许不内卷安全
一、文件过滤技术这里说的文件过滤技术，是指针对文件的类型进行的过滤，而不是文件的内容。想要实现这个效果，我们的设备必须识别出：承载文件的应用---承载文件的协议很多，所以需要先识别出协议以及应用。文件传输的方向---上传，下载文件的类型和拓展名---设备可以识别出文件的真实类型，但是，如果文件的真实类型无法识别，则将基于后缀的拓展名来进行判断，主要为了减少一些绕过检测的伪装行为。二、内容过滤技术文
OKHttp 3.10源码解析（四）：连接机制十月开源框架 Android
OKhttp的底层用的是Socket连接而不是URLConnection，所以整体来说还是比较复杂的，涉及到Http协议的封装和解封装、TLS/SSL安全协议的封装、Http2的封装等等，但还是非常值得我们去学习一下的，本篇文章不会对这些底层原理有详细的解析，但读完之后至少大概知道Http请求的底层是如何实现的一.HTTP请求的优化1.keep-alive机制我们知道，一个HTTP的请求需要经过三
TCP/IP协议 DL庭网络
TCP/IP（TransmissionControlProtocol/InternetProtocol）是互联网的基础通信协议套件，定义了计算机在网络中通信的标准方式。它由多个协议组成，采用分层架构，确保数据在不同设备和网络间可靠传输。以下是TCP/IP协议的详细介绍：一、历史背景起源：20世纪70年代由美国国防部高级研究计划局（DARPA）开发，最初用于ARPANET（互联网前身）。标准化：19
专题三：简单网络管理协议SNMP 网工老刘网络
一、SNMP的基本概念与工作原理SNMP主要由管理站（Manager）、代理（Agent）和管理信息库（MIB）三部分组成。管理站是管理进程所在的系统，代理是被管理设备中执行管理任务的进程，而MIB则是一个虚拟的数据库，用于存储被管理设备的各种信息。工作时，管理站通过SNMP协议向代理发送请求，代理从MIB中获取相应信息返回给管理站。SNMP基于UDP；客户端使用161端口接收和发送请求，服务端1
《架构演进之路：突破与成长》——二次初稿感悟和思考猿脑2.0 架构演进之路 python
前言：时间一晃，第二次初稿的时间(9月13日）已经过去8天了，剩下的5位合写团队成员未按时间提交二次初稿，我有一点小失望，失望的不是大家没有按时交稿，而是没有提前沟通卡点和未交稿的原因，好像已经从生活中忘却。既然问题来了，作为发起人我有主要责任。因为是非协议性合写，所以当问题来了，我第一想到的是要如何解决问题，而不是苛责他人。列出几个大家可能没有按时交稿的原因：1合写的责任弱相关性导致动力不足。优
科普：HTTP端口80和HTTPS端口443 人工干智能安装应用架构 http https 网络协议
你会发现，有的网址不带端口号，怎么回事？HTTP协议默认端口：HTTP协议的默认端口是80。当用户在浏览器中输入一个没有指定端口的以http://开头的网址时，浏览器会自动使用80端口与服务器建立连接，进行超文本数据的传输。HTTPS协议默认端口：HTTPS协议的默认端口是443。HTTPS是在HTTP的基础上通过SSL/TLS协议来加密数据传输。基本定义HTTP端口80：HTTP即超文本传输协议
HDMI/DVI中TMDS编解码算法的理解 yo_ohoh 视频图像处理 fpga开发视频编解码
HDMI/DVI中TMDS编解码算法的理解TMDS简介TMDS编码TMDS解码TMDS简介HDMI和DVI协议使用TMDS作为它们的物理层。支持高达225MHz的传输速率，一个传输链路能满足高达2048*1536分辨率电视信号。一般来说，一个HDMI/DVI接口包含四个TMDS通道，三条数据通道和一条时钟通道，每条通道采用差分电平传输，即一条通道要2根线，正极和负极。TMDS编解码算法可以使得被传
TMDS数据编码算法小灰灰的FPGA FPGA fpga verilog 算法
TMDS，TransitionMinimizedDifferentialSignaling,即最小化差分传输信号，在DVI（数字视频接口，只能传输视频）和HDMI（音视频均可传输）协议中用于传输音视频数据，使用差分信号传输高速串行数据。1、TMDS接口TMDS连接从逻辑功能上可以划分成两个阶段：编码和并串转换。在编码阶段，编码器将视频源中的像素数据、HDMI的音频/附加数据，以及行同步和场同步信号
如何安装vm和centos 小白的白是白痴的白 centos linux 运维
一、安装VMware虚拟机1.**下载VMwareWorkstationPro**：-访问VMware官网，找到下载页面，选择适合您操作系统的版本进行下载。2.**安装VMwareWorkstationPro**：-打开下载好的安装包，点击“下一步”。-勾选“我接受许可协议中的条款”，继续点击“下一步”。-勾选“增强型键盘驱动程序”，并根据需要选择是否安装其他附加组件。-选择安装路径，建议选择非系
路由协议 RookieLeslie Cisco
路由器依照下列选路原则进行路由选择1、子网掩码最长匹配2、管理距离最小优先3、度量值最小优先距离矢量路由协议：距离矢量路由选择算法是定期地将路由表拷贝，从一个路由器发往另一个路由器RIP和IGRP都是属于距离矢量路由协议，EIGRP也属于距离矢量协议，但它是一个高级的距离矢量路由协议距离矢量路由协议环路解决方法：最大跳计数（RIP允许的最大跳数为15，当一个目标网络为16时，RIP就认为该网络是不
路由协议有哪些？你的四舅老爷路由协议网络网络协议 p2p
1、RIP协议-路由信息协议，属于最早的动态路由协议优点:节约成本，对资源消耗较低，配置简单，对硬件要求低，占用CPU、内存低，所以在小型网络中还有使用到。缺点:计算路由慢，链路变化了收敛慢，能够保存的路由表相对较小，最多只能支持15台设备的网络，只适用于小型网络2、OSPF协议-开放最短路径优先协议，企业网主要使用的协议优点:技术成熟，碰到的问题基本上在资料上都能够查到，收敛快，由于cisco的
串口输入缓冲区历史数据干扰问题 python的解决方案 huiyuanzhenduo python 单片机开发语言
串口输入缓冲区历史数据干扰问题python的解决方案,非常简单加上这行代码就行self.serial.reset_input_buffer()下面详细介绍问题分析接收数据包含历史残留的原因是：串口接收缓冲区中未及时清理的历史数据与新响应混合。ModbusRTU协议基于时序传输，若在发送新指令前未清空缓冲区，会导致残留数据被误读。解决方案在发送新命令前清空串口输入缓冲区，确保只读取当前命令的响应。修
计算机网络之路由协议（自治系统） DKPT #计算机网络计算机网络开发语言算法笔记学习
一、自治系统（AS）自治系统是由同一个技术管理机构管理、使用统一选路策略的一些路由器的集合。它是网络的基本构成单位，每个自治系统是一个独立运营并自主决定与谁交换流量的实体。自治系统内部运行内部网关协议（IGP），而自治系统之间则运行外部网关协议（EGP）。二、路由协议内部网关协议（IGP）：在一个自治系统内部使用的路由选择协议。主要协议包括：RIP（路由信息协议）、OSPF（开放最短路径优先协议）
SAM应用：医学图像和视频中的任何内容分割中的基准测试与部署烧技湾 AI &Computer Vision SAM MED2SAN 医学图像分割分割一切
医学图像和视频中的任何内容分割：基准测试与部署目录摘要：一、引言1.1SAM2在医学图像和视频中的应用二.结果2.1数据集和评估协议2.2二维图像分割的评估结果三讨论四局限性和未来的工作五、方法5.1数据来源和预处理5.2微调协议5.3评估指标总结关键字：SAM、分割一切基础模型、医学图像、视频、多模态最近医学分割模型发展迅速，基于SAM的医学图像处理得到了进一步的发展。为了追踪医学图像处理的最新
http 协议和 https 协议的区别是什么？互联网之路. 知识点 https
互联网各领域资料分享专区(不定期更新)：Sheet正文HTTP（超文本传输协议）和HTTPS（安全超文本传输协议）的核心区别在于安全性，以下是两者的主要对比：1.协议与安全性HTTP：数据以明文形式传输，易被窃听、篡改或中间人攻击。HTTPS：通过SSL/TLS协议对数据进行加密，确保传输过程中的机密性和完整性，防止数据泄露或篡改。2.默认端口HTTP：使用80端口。HTTPS：使用443端口。3
HTTP和HTTPS详解 Cedicn 计算机网络 http https 网络协议
HTTPHTTP超文本传输协议，是基于TCP实现的应用层协议。HTTP的工作过程一次HTTP操作称为一个事务，其整个工作过程如下：1）地址解析如用客户端浏览器请求这个页面：localhost.com:8080/index.htm从中分解出协议名、主机名、端口、对象路径等部分，对于我们的这个地址，解析得到的结果如下：协议名：http主机名：localhost.com端口：8080对象路径：/inde
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多