让我思考一下

Raft共识算法

Raft共识算法在分布式系统中是常用的共识算法之一，论文原文In Search of an Understandable Consensus Algorithm ，作者在论文中指出Poxas共识算法的两大问题，其一是难懂，其二是应用到实际系统存在困难。针对Paxos存在的问题，作者的目的是提出一个易懂的共识算法，论文中有单独一小节论述Raft是一个实用的、安全可用、有效易懂的共识算法。本文描述了Raft共识算法的细节，很多内容描述及引用图片均摘自论文原文。

Raft概述

我们主要分以下三部分对Raft进行讨论：

Leader election——a new leader must be chosen when
an existing leader fails. （领导人选举）
Log replication——the leader must accept log entries from clients and replicate them across the cluster,
forcing the other logs to agree with its own.（日志复制）
Safety——the key safety property for Raft. （安全性）

正常工作过程中，Raft分为两部分，首先是leader选举过程，然后在选举出来的leader基础上进行正常操作，比如日志复制操作等。

一个Raft集群通常包含$2N+1$个服务器，允许系统有$N$个故障服务器。每个服务器处于3个状态之一：leader、follower或candidate。正常操作状态下，仅有一个leader，其他的服务器均为follower。follower是被动的，不会对自身发出的请求而是对来自leader和candidate的请求做出响应。leader处理所有的client请求（若client联系follower，则该follower将转发给leader)。candidate状态用来选举leader。状态转换如下图所示：

为了进行领导人选举和日志复制等，需要服务器节点存储如下状态信息：

状态	所有服务器上持久存在的
currentTerm	服务器最后一次知道的任期号（初始化为 0，持续递增）
votedFor	在当前获得选票的候选人的 Id
log[]	日志条目集；每一个条目包含一个用户状态机执行的指令，和收到时的任期号

状态	所有服务器上经常变的
commitIndex	已知的最大的已经被提交的日志条目的索引值
lastApplied	最后被应用到状态机的日志条目索引值（初始化为 0，持续递增）

状态	在领导人里经常改变的（选举后重新初始化）
nextIndex[]	对于每一个服务器，需要发送给他的下一个日志条目的索引值（初始化为领导人最后索引值加一）
matchIndex[]	对于每一个服务器，已经复制给他的日志的最高索引值

Raft在任何时刻都满足如下特性：

Election Safety：在一个任期中只能有一个leader；
Leader Append-Only：leader不会覆盖或删除日志中的entry，只有添加entry（follower存在依据leader回滚日志的情况）；
Log Matching：如果两个日志包含了一条具有相同index和term的entry，那么这两个日志在这个index之前的所有entry都相同；
Leader Completeness：如果在某一任期一条entry被提交committed了，那么在更高任期的leader中这条entry一定存在；（领导人选举时会保证这一性质，后面会讲到这个问题）
State Machine Safety：如果一个节点将一条entry应用到状态机中，那么任何节点也不会再次将该index的entry应用到状态机里；

下面我们详细讨论这几部分。

Leader选举（Leader election）

一个节点初始状态为follower，当follower在选举超时时间内未收到leader的心跳消息，则转换为candidate状态。为了避免选举冲突，这个超时时间是一个随机数（一般为150~300ms）。超时成为candidate后，向其他节点发出RequestVoteRPC请求，假设有$2N+1$个节点，收到$N+1$个节点以上的同意回应，即被选举为leader节点，开始下一阶段的工作。如果在选举期间接收到eader发来的心跳信息，则candidate转为follower状态。

在选举期间，可能会出现多个candidate的情况，可能在一轮选举过程中都没有收到多数的同意票，此时再次随机超时，进入第二轮选举过程，直至选出leader或着重新收到leader心跳信息，转为follower状态。

正常状态下，leader会不断的广播心跳信息，follower收到leader的心跳信息后会重置超时。当leader崩溃或者出现异常离线，此时网络中follower节点接收不到心跳信息，超时再次进入选举流程，选举出一个leader。

这里还有补充一些细节，每个leader可以理解为都是有自己的任期(term)的，每一期起始于选举阶段，直到因节点失效等原因任期结束。每一期选举期间，每个follower节点只能投票一次。图中t3可能是因为没有获得超半数票等造成选举失败，须进行下一轮选举，此时follower可以再次对最先到达的candidate发出的RequestVote请求投票（先到先得）。

对所有的请求（RequestVote、AppendEntry等请求），如果发现其Term小于当前节点，则拒绝请求，如果是candidate选举期间，收到不小于当前节点任期的leader节点发来的AppendEntry请求，则认可该leader，candidate转换为follower。

日志复制（Log replication）

leader选举成功后，将进入有效工作阶段，即日志复制阶段，其中日志复制过程会分记录日志和提交数据两个阶段。

整个过程如下：

首先client向leader发出command指令；（每一次command指令都可以认为是一个entry，或者说是日志项）
leader收到client的command指令后，将这个command entry追加到本地日志中，此时这个command是uncommitted状态，因此并没有更新节点的当前状态；
之后，leader向所有follower发送这条entry，也就是通过日志复制AppendEntries消息 (可以是一条也可以是多条日志项) 将日志项复制到集群其他节点上，follower接收到后（这里有判断条件的，并不是所有leader发送来的日志项都无条件接收，而且还可能存在本地与leader日志不一致的情况，后面会详细说明，这里先看正常情况）追加到本地日志中，并回应leader成功或者失败；
leader收到大多数follower的确认回应后，此entry在leader节点由uncommitted变为committed状态，此时按这条command更新leader状态，或者说将该日志项应用到状态机，然后向client返回执行结果；
在下一心跳中(这里也可以是或者说多数情况下是新的日志复制AppendEntries消息，会带有相关信息，后面后详细的字段说明会讲到)，leader会通知所有follower更新确认的entry，follower收到后，更新状态，这样，所有节点都完成client指定command的状态更新。

可以看到client每次提交command指令，服务节点都先将该指令entry追加记录到日志中，等leader确认大多数节点已追加记录此条日志后，在进行提交确认，更新节点状态。如果还对这个过程有些模糊的话，可以参考Raft动画演示，较为直观的演示了领导人选举及日志复制的过程。

安全（Safety）

前面描述了Raft算法是如何选举和复制日志的。然而，到目前为止描述的机制并不能充分的保证每一个状态机会按照相同的顺序执行相同的指令。我们需要再继续深入思考以下几个问题：

第一个问题，leader选举时follower收到candidate发起的投票请求，如果同意就进行回应，但具体的规则是什么呢？是所有的follower都有可能被选举为领导人吗？
第二个问题，leader可能在任何时刻挂掉，新任期的leader怎么提交之前任期的日志条目呢？

选举限制

针对第一个问题，之前并没有细讲，如果当前leader节点挂了，需要重新选举一个新leader，此时follower节点的状态可能是不同的，有的follower可能状态与刚刚挂掉的leader相同，状态较新，有的follower可能记录的当前index比原leader节点的少很多，状态更新相对滞后，此时，从系统最优的角度看，选状态最新的candidate为佳，从正确性的角度看，要确保Leader Completeness，即如果在某一任期一条entry被提交成功了，那么在更高任期的leader中这条entry一定存在，反过来讲就是如果一个candidate的状态旧于目前被committed的状态，它一定不能被选为leader。具体到投票规则：
1）节点只投给拥有不比自己日志状态旧的节点；
2）每个节点在一个term内只能投一次，在满足1的条件下，先到先得；

我们看一下请求投票 RPC（由候选人负责调用用来征集选票）的定义：

参数	解释
term	候选人的任期号
candidateId	请求选票的候选人的 Id
lastLogIndex	候选人的最后日志条目的索引值
lastLogTerm	候选人最后日志条目的任期号

返回值	解释
term	当前任期号，以便于候选人去更新自己的任期号
voteGranted	候选人赢得了此张选票时为真

接收者实现：

如果term < currentTerm返回 false
如果 votedFor 为空或者为 candidateId，并且候选人的日志至少和自己一样新，那么就投票给他

可以看到RequestVote投票请求中包含了lastLogIndex和lastLogTerm用于比较日志状态。这样，虽然不能保证最新状态的candidate成为leader，但能够保证被选为leader的节点一定拥有最新被committed的状态，但不能保证拥有最新uncommitted状态entries。

提交之前任期的日志条目

领导人知道一条当前任期内的日志记录是可以被提交的，只要它被存储到了大多数的服务器上。但是之前任期的未提交的日志条目，即使已经被存储到大多数节点上，也依然有可能会被后续任期的领导人覆盖掉。下图说明了这种情况：

如图的时间序列展示了为什么领导人无法决定对老任期号的日志条目进行提交。在 (a) 中，S1 是领导者，部分的复制了索引位置 2 的日志条目。在 (b) 中，S1崩溃了，然后S5在任期3里通过S3、S4和自己的选票赢得选举，然后从客户端接收了一条不一样的日志条目放在了索引 2 处。然后到 (c)，S5又崩溃了；S1重新启动，选举成功，开始复制日志。在这时，来自任期2的那条日志已经被复制到了集群中的大多数机器上，但是还没有被提交。如果S1在(d)中又崩溃了，S5可以重新被选举成功（通过来自S2，S3和S4的选票），然后覆盖了他们在索引 2 处的日志。反之，如果在崩溃之前，S1 把自己主导的新任期里产生的日志条目复制到了大多数机器上，就如 (e) 中那样，那么在后面任期里面这些新的日志条目就会被提交（因为S5 就不可能选举成功）。这样在同一时刻就同时保证了，之前的所有老的日志条目就会被提交。

为了消除上图里描述的情况，Raft永远不会通过计算副本数目的方式去提交一个之前任期内的日志条目。只有领导人当前任期里的日志条目通过计算副本数目可以被提交；一旦当前任期的日志条目以这种方式被提交，那么由于日志匹配特性，之前的日志条目也都会被间接的提交。

当领导人复制之前任期里的日志时，Raft 会为所有日志保留原始的任期号。

对Raft中几种情况的思考

follower节点与leader日志内容不一致时怎么处理？

我们先举例说明：正常情况下，follower节点应该向B节点一样与leader节点日志内容一致，但也会出现A、C等情况，出现了不一致，以A、B节点为例，当leader节点向follower节点发送AppendEntries,leaderCommit=7时，我们分析一下发生了什么，B节点日志与prevLogIndex=7,prevLogTerm=3相匹配，将index=7（x<-5）这条entry提交committed，并在日志中新加入entryx<-4，处于uncommitted状态；A节点接收到时，当前日志index与prevLogIndex=7,prevLogTerm=3不相匹配，拒接该请求，不会将x<-4添加到日志中，当leader知道A节点因日志不一致拒接了该请求后，不断递减preLogIndex重新发送请求，直到A节点index,term与prevLogIndex,prevLogTerm相匹配，将leader的entries复制到A节点中，达成日志状态一致。

 
 我们看一下附加日志AppendEntries RPC（由领导人负责调用复制日志指令；也会用作heartbeat）的定义： 
  
   
    
    参数 
    解释 
    
   
   
    
    term 
    领导人的任期号 
    
    
    leaderId 
    领导人的 Id，以便于跟随者重定向请求 
    
    
    prevLogIndex 
    新的日志条目紧随之前的索引值 
    
    
    prevLogTerm 
    prevLogIndex 条目的任期号 
    
    
    entries[] 
    准备存储的日志条目（表示心跳时为空；一次性发送多个是为了提高效率） 
    
    
    leaderCommit 
    领导人已经提交的日志的索引值 
    
   
  
  
   
    
    返回值 
    解释 
    
   
   
    
    term 
    当前的任期号，用于领导人去更新自己 
    
    
    success 
    跟随者包含了匹配上 prevLogIndex 和 prevLogTerm 的日志时为真 
    
   
  
 接收者实现： 
  
  如果 term < currentTerm 就返回 false； 
  如果日志在 prevLogIndex 位置处的日志条目的任期号和 prevLogTerm 不匹配，则返回 false； 
  如果已经存在的日志条目和新的产生冲突（索引值相同但是任期号不同），删除这一条和之后所有的；（raft中follower处理不一致的一个原则就是一切听从leader） 
  附加日志中尚未存在的任何新条目； 
  如果 leaderCommit > commitIndex，令 commitIndex 等于 leaderCommit 和 新日志条目索引值中较小的一个； 
  
 简单总结一下，出现不一致时核心的处理原则是一切遵从leader。当leader向follower发送AppendEntry请求，follower对AppendEntry进行一致性检查，如果通过，则更新状态信息，如果发现不一致，则拒绝请求，leader发现follower拒绝请求，出现了不一致，此时将递减nextIndex，并重新给该follower节点发送日志复制请求，直到找到日志一致的地方为止。然后把follower节点的日志覆盖为leader节点的日志内容。 
 leader挂掉了，怎么处理？ 
 前面可能断断续续的提到这种情况的处理方法，首要的就是选出新leader，选出新leader后，可能上一任期还有一些entries并没有提交，处于uncommitted状态，该怎么办呢？处理方法是新leader只处理提交新任期的entries，上一任期未提交的entries，如果在新leader选举前已经被大多数节点记录在日志中，则新leader在提交最新entry时，之前处于未提交状态的entries也被committed了，因为如果两个日志包含了一条具有相同index和term的entry，那么这两个日志在这个index之前的所有entry都相同；如果在新leader选举前没有被大多数节点记录在日志中，则原有未提交的entries有可能被新leader的entries覆盖掉。 
 出现网络分区时怎么处理？ 
 分布式系统中网络分区的情况基本无法避免，出现网络分区时，原有leader在分区的一侧，此时如果客户端发来指令，旧leader依旧在分区一测进行日志复制的过程，但因收不到大多数节点的确认，客户端所提交的指令entry只能记录在日志中，无法进行提交确认，处于uncommitted状态。而在分区的另一侧，此时收不到心跳信息，会进入选举流程重新选举一个leader，新leader负责分区零一侧的请求，进行日志复制等操作。因为新leader可以收到大多数follower确认，客户端的指令entry可以被提交，并更新节点状态，当网络分区恢复时，此时两个leader会收到彼此广播的心跳信息，此时，旧leader发现更大term的leader，旧leader转为follower，此时旧leader分区一侧的所有操作都要回滚，接受新leader的更新。 
 成员变更 
 在分布式系统中，节点数量或者说服务器数量不是一成不变的，我们有可能会随时增减节点数量，当增加节点时，有可能会出现两个leader选举成功的情况，主要是新旧配置不一致造成的，怎么处理呢？最简单粗暴的就是把目前所有节点都停掉，更新配置，再重启所有节点，但会造成一段时间服务不可用，很多情况下这是不能被允许的。raft的解决办法原论文中是联合共识（Joint Consensus）的办法，后来又提出了单节点变更（single-server changes）的方法。我们下面详细描述一下这个问题。 
 Raft要求，在任一任期内，只能有一个leader，而成员变更的麻烦就在于，成员变更时可能会出现两个leader，以一个例子说明：原系统有3个节点，成员为[1,2,3]，现新增成员4、5。假设在成员变更时，1、2与3发生分区，此时，[1,2]为一组，1通过1、2两节点选举为leader，而5通过3、4、5选举为leader，就形成了2个leader并存的情况。 
  
 因为每个节点新旧配置更新的时间不同，造成了在某一时刻，可能会存在新旧配置的两个大多数情况的存在，上图中，旧配置的大多数是两个节点，而新配置的大多数是三个节点，在图中红线头的时刻存在两个大多数的情况，如果此时出现网络分区进行选举时就会出现两个leader的情况。 
 怎么解决呢？用什么办法才能不让上面两个大多少情况的出现呢？可通过单节点变更解决，即通过一次变更一个节点实现成员变更。主要思想是利用“一次变更一个节点，不会同时存在旧配置和新配置的两个大多数”的特性，实现成员变更。比如上面的情况，就可先将3节点集群[A,B,C]变更为4节点集群[A,B,C,D]，再将4节点集群变更为5节点集群[A,B,C,D]。 
  
  为什么单节点变更不会造成两个大多数情况的出现呢？我们可以进行如下推理：假设原节点数为2n+1，则旧配置的大多数major_old=n+1，新加入1个节点，新配置节点数为2n+2，则新配置的大多数为major_new=n+2，同时存在两个大多数所需节点数目为major=major_old+major_new=n+1+n+2=2n+3>2n+2，也就是两个大多数所需节点数超出了节点总数，故不存在这种情况，如何是删除成员，其推理过程类似，结论相同。 
  
 具体的，我们依旧以这个3节点集群变更为5节点集群为例进行说明。假设现3节点集群[A,B,C]，节点A为leader，配置为[A,B,C]，我们先向集群加入节点D,新的配置为[A,B,C,D]，成员变更通过以下两步实现： 
  
  第一步，leader节点A向新节点D同步数据； 
  第二步，leader将新配置[A,B,C,D]作为一个日志项复制到新配置中的所有节点（A,B,C,D）上，然后将新配置的日志项应用到本地状态机，完成单节点变更。 
  
 在变更后，现有集群的配置项就是[A,B,C,D]，添加E节点也是同样的步骤。上面的描述如果理解的比较模糊的话，其实raft是采用将修改集群配置的命令放在日志条目中来处理的，其修改配置项，就是一条日志项，其流程与普通的日志项相同，只不过最后状态机执行的结果是配置变更。 
 日志压缩 
 日志压缩主要是为了解决无限增长的日志与有限的存贮空间的矛盾，可以想一个问题：对于已经committed的日志项，是否有必要一直保存下去？如果没有必要的话，是否可以对部分已committed的日志项删减或压缩呢？raft的主要的解决办法是采用快照进行日志压缩。 
  
 如上图所示，对于日志索引5之前的日志项可以删除，只保留一个快照（保存有当前状态以及一些任期索引号等元信息）即可。 
 具体工程实现时，一般每个节点独立打快照，当日志超过一定量会触发快照操作，具体实现以及更多细节待以后深究。 
 Client Protocol 
 raft共识算法真正工作时还需有一个客户端协议（client protocol），综合解决一些列的问题。比如会遇到下面这些问题：client怎么和集群交互呢？client如果知道leader节点的话，可以直接将command发给leader节点，如果不知道的话，可以随意发给集群中已知的节点，节点会将client的请求转给leader。其实上面还有个问题，client发送请求（或者command）给leader,但是leader迟迟不给回应怎么办？重试是一个办法。连接的leader崩溃了client怎么办？如果client超时重发command，怎么保证command不被状态机执行两次？client生成command的时候要给加上唯一ID，当server的日志中已存在相同command时会忽略。 
 附录 
 这里附加一张论文中的截图，里面详细讲明了不同节点需要维护什么信息，每个消息是怎么定义的，以及消息该如何处理等，不包含日志压缩以及成员变更部分： 
  
 这里补充一点，raft共识算法与pbft共识算法解决的是不同的问题，即raft节点不能存在恶意节点，节点消息可以延迟、丢失，但不能造假或作恶，即不能存在拜占庭节点。 
 本文对raft共识算法做了一个整体的梳理学习，可能会存在某些细节描述不清晰的地方，在真正工程代码实现时，还会存在更多的细节问题，同时，这里缺少证明为什么raft算法是正确的证明，有待今后更深一步理解共识算法后再行补充。

参数	解释
term	领导人的任期号
leaderId	领导人的 Id，以便于跟随者重定向请求
prevLogIndex	新的日志条目紧随之前的索引值
prevLogTerm	prevLogIndex 条目的任期号
entries[]	准备存储的日志条目（表示心跳时为空；一次性发送多个是为了提高效率）
leaderCommit	领导人已经提交的日志的索引值

返回值	解释
term	当前的任期号，用于领导人去更新自己
success	跟随者包含了匹配上 prevLogIndex 和 prevLogTerm 的日志时为真

ETCD 六 etcd总体架构 wanghaichao1234 etcd etcd 架构数据库
etcd源码结构etcd项目代码的目录结构：包名用途apiprotobuf定义client/v3客户端sdkcontribraftexample实现etcdctl命令行客户端实现，用于网路的操作etcdutl命令行管理工具，直接操作etcd数据文件。hack基准测试、测试集群、k8s部署、分支管理、证书等pkg实用程序包的集合raftraft实现server.auth角色身份验证server.em
Kafka和Pulsar深入解析 jasen91 大数据开发 kafka 分布式
Kafka多租户：单租户系统数据迁移：依赖MirrorMaker，需要额外维护。市场上也有ConfluentReplicator等供应商工具。分层存储：由供应商提供商业使用。组件依赖：KafkaRaft（KRaft）从Kafka2.8开始处于早期访问模式，允许Kafka在没有ZooKeeper的情况下工作。这对Kafka来说是一个显著的优势，因为它简化了Kafka的体系结构并降低了学习成本。云原生
Paxos 算法详解（一）林木森^~^ 数据结构和算法算法分布式 java
前言提到分布式算法，就不得不提Paxos算法，在过去几十年里，它基本上是分布式共识的代名词，因为当前最常用的一批共识算法都是基于它改进的。比如，FastPaxos算法、CheapPaxos算法、Raft算法、ZAB协议等等。兰伯特提出的Paxos算法包含2个部分：一个是BasicPaxos算法，描述的是多节点之间如何就某个值（提案Value）达成共识；另一个是Multi-Paxos思想，描述的是执
hackcon ctf 2018 | pwn wp fantasy_learner
BOF漏洞点:栈溢出利用过程栈溢出跳转callMeMaybe函数获得flagexpSheSellsSeaShells90流程分析:给出了输入的栈地址有一个栈溢出点没有nx利用过程:根据以上三点，得出可以使用ret2shellcode使用shellcraft生成shellcode利用栈溢出，输入并跳转到shellcodeexpSimpleYetElegent150这道题目做了最久，卡在了能否根据_d
2022年最新Kubernetes常见面试题汇总云小七 kubernetes 容器云原生 java
常规题1.简述etcd及其特点答∶etcd是CoreOS团队发起的开源项目，是一个管理配置信息和服务发现（servicediscovery）的项目，它的目标是构建一个高可用的分布式键值（key-value）数据库，基于Go语言实现。特点∶●简单∶支持REST风格的HTTP+JSONAPI●安全∶支持HTTPS方式的访问●快速：支持并发1k/s的写操作●可靠∶支持分布式结构，基于Raft的一致性算法
DeepSeek缓存命中技术，成本降低10倍智匠MindCraft Al 人工智能 gpt ai 功能测试 AI编程
DeepSeek系列升级：DeepSeek发布最新的缓存命中技术，有效降低成本至0.1元/百万tokens，适用于文件读取和固定提示词。点评：由于token消耗大部分是在系统提示词中，妥善使用确实可以极大降低成本，同时还能保证较高的输出质量。今天就分享到这里，在智匠AI（MindCraftAI）上可以体验到最新更新的模型。
【学习笔记】无人机系统（UAS）的连接、识别和跟踪（十一）-无人机A2X功能和特性瑶光守护者 5G-A 无人机学习笔记无人机 3GPP 5G
目录引言6.2高级功能和特性6.2.1A2X通信的授权和配置6.2.2A2X通信6.2.3A2X应用服务器发现6.2.4A2X通信的QoS处理6.2.5A2X服务订阅6.2.6标识符6.2.7EPSA2X与5GSA2X之间的互操作性6.2.8A2X使用的MBS服务描述引言3GPPTS23.256技术规范，主要定义了3GPP系统对无人机（UAV）的连接性、身份识别、跟踪及A2X（Aircraft-t
【学习笔记】无人机系统（UAS）的连接、识别和跟踪（五）-无人机跟踪瑶光守护者 5G-A 无人机学习笔记无人机 3GPP 5G
目录引言5.3无人机跟踪5.3.1无人机跟踪模型5.3.2无人机位置报告流程5.3.3无人机存在监测流程引言3GPPTS23.256技术规范，主要定义了3GPP系统对无人机（UAV）的连接性、身份识别、跟踪及A2X（Aircraft-to-Everything）服务的支持。3GPPTS23.256技术规范：【免费】3GPPTS23.256技术报告-无人机系统（UAS）的连接、识别和跟踪资源-CSD
【学习笔记】无人机系统（UAS）的连接、识别和跟踪（二）-定义和缩写瑶光守护者 5G-A 无人机学习笔记无人机物联网 3GPP 5G
引言3GPPTS23.256技术规范，主要定义了3GPP系统对无人机（UAV）的连接性、身份识别、跟踪及A2X（Aircraft-to-Everything）服务的支持。3GPPTS23.256技术规范：【免费】3GPPTS23.256技术报告-无人机系统（UAS）的连接、识别和跟踪资源-CSDN文库3.定义和缩写3.1定义就本文件而言，适用TR21.905[1]中给出的术语和定义以及以下内容。如
深度学习思考夜雪朝歌
神经网络如果能了解每一层输出的意义，就可以避免end－to－end的黑箱理论，对理论话深度学习很有意义，一个思路是经验值，将每一层在特定任务下都有输出，对结果作经验总结，比方说浅层输出低层次的几何轮廓特征，高层输出语意特征，我曾经在objecttracking用过这样的方法,在大数据集测试，每一层都输出结果，并且和handcraftfeature做比较，发现浅层的效果不如handcraftfeat
2024/9/7 英语每日一段何事驚慌笔记
PromisingfreedomtoBlackmenandwomenonlyafteraperiodoftimealsopermittedenslaverstosneakinstipulationsthatledtofurtherdelays.FitchHallsignedanagreementin1794tofreeawomannamedMaryandheryoungdaughteraftert
Databend Meta-Service 架构概述 Databend 架构
Databend的meta-service是一个基于Raft共识算法的分布式服务。其核心架构可以概括为一个Raft应用，如图中虚线框所示。Raft协议的主要组成部分包括：分布式日志（Log）状态机（StateMachine）分布式日志日志主要用于记录分布式系统的操作。当一条日志被写入本地并通过网络同步到其他Raft节点后，系统会等待日志在多数节点上完成持久化。一旦达到多数派写入，该日志条目就被视为
Java8新特性之consumer的用法 Java训练员拓展小知识 java 开发语言后端
consumer是一个函数式接口（可以采用lambda写法），它的源码如下@FunctionalInterfacepublicinterfaceConsumer{voidaccept(Tt);defaultConsumerandThen(Consumerafter){Objects.requireNonNull(after);return(Tt)->{accept(t);after.accept(
Java 常用函数式接口案例之Consumer接口夏沐_lk Java基础 java 函数式编程 Consumer接口
案例1importjava.util.function.Consumer;/***java.util.function.Consumer:该接口的作用与Supplier接口作用相反，将创建的参数消费（使用）掉。*Consumer接口中包含了唯一一个抽象方法voidaccept(Tt);消费一个指定泛型的数据**defaultConsumerandThen(Consumerafter){*Objec
RAFT：Adapting Language Model to Domain Specific RAG 蒸土豆的技术细节语言模型人工智能自然语言处理
论文链接简单来说，就是你SFT微调的时候得考虑RAG的场景。RAG什么场景？你检索top-k回来，里面有相关doc有不相关doc，后者是影响性能的重要原因，LLM需要有强大的识别能力才能分得清哪块和你的query相关。微调就是为了这个。你做领域微调时，根据chunk生成query、answer，然后直接拿这仨微调，这里面没有干扰项，没有“不相关doc”，就扛不住RAG的噪声。RAFT就是针对这个搞
RAFT: Adapting Language Model to Domain Specific RAG UnknownBody RAG for LLM 语言模型人工智能自然语言处理
本文是LLM系列文章，针对《RAFT:AdaptingLanguageModeltoDomainSpecificRAG》的翻译。RAFT：使语言模型适应特定领域的RAG摘要1引言2LLM用于开卷考试3RAFT4评估5RAFT推广到Top-KRAG6相关工作7结论摘要在文本数据的大型语料库上预训练大型语言模型（LLM）现在是一种标准范式。当将这些LLM用于许多下游应用程序时，通常会通过基于RAG的计
特定领域 RAG 新突破：LlamaPack 实现 RAFT 论文方法技术狂潮AI 大模型企业实战 LLM应用实战 AI编程实战人工智能 RAFT（检索增强微调）LlamaIndex LlamaPack
一、前言在上一篇文章《RAFT：让大型语言模型更擅长特定领域的RAG任务》中，我们介绍了RAFT训练方法，RAFT（检索增强微调）是一种训练方法，可以提高大型语言模型(LLM)在开卷、域内问答任务中的性能。给定一个问题和一组检索到的文档，RAFT训练LLM从文档中识别并引用最相关的片段，这些片段有助于回答问题，同时忽略不相关或分散注意力的信息。通过训练模型识别相关信息并提供佐证，RAFT可以增强L
inexpensive electronic digital chouxiao4977
KualaLumpurgathersallkindsofmerchandise,fromtraditionaltolocalizedartsinadditiontocrafts,intheworldfamousmanufacturerfashionforyoutoinexpensiveelectronicdigitalproducts.Concurrently,ithasbothequallyla
Keras-OCR：高效且易用的深度学习 OCR 库吕真想Harland
Keras-OCR：高效且易用的深度学习OCR库keras-ocrApackagedandflexibleversionoftheCRAFTtextdetectorandKerasCRNNrecognitionmodel.项目地址:https://gitcode.com/gh_mirrors/ke/keras-ocr是一个基于Python的开源库，它利用[Keras](https和TensorFl
kafka3.7.1 单节点 KRaft部署&测试发送和接收消息运维小弟| srebro.cn openeuler kafka 运维运维云原生
一、环境准备kafka3.7.1包下载地址：https://mirrors.nju.edu.cn/apache/kafka/3.7.1/kafka_2.13-3.7.1.tgzopenjdk11.0.2下载地址：https://mirrors.nju.edu.cn/openjdk/11.0.2/openjdk-11.0.2_linux-x64_bin.tar.gz二、openjdk安装【如已安装，
MC联机无法连接到服务器怎么解决 qq177803623 服务器运维云计算
MC联机无法连接到服务器？弹性云服务器来帮您解决！在《我的世界》（Minecraft，简称MC）的联机冒险中，无法连接到服务器无疑是每个玩家最头疼的问题之一。无论是与好友组队探险，还是加入心仪的社区服务器，一旦遇到连接问题，所有的乐趣和期待都可能化为泡影。今天，我们就来聊聊如何解决MC联机无法连接到服务器这个问题?常见的MC联机连接问题①IP地址或端口号错误：检查您输入的服务器IP地址和端口号是否
[数据集][目标检测]卫星遥感舰船检测数据集VOC+YOLO格式2238张17类别 FL1623863129 数据集目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：2238标注数量(xml文件个数)：2238标注数量(txt文件个数)：2238标注类别数：17标注类别名称:[“AircraftCarrier”,“AuxiliaryShips”,“Cargo”,“Commander”
**脑图制作的Bootstrap Bundle项目指南** 潘惟妍
脑图制作的BootstrapBundle项目指南bootstrap-bundleBraincraftedBootstrapBundleintegratesBootstrapintoSymfony2byprovidingtemplates,Twigextensions,servicesandcommands.项目地址:https://gitcode.com/gh_mirrors/bo/bootstr
Xline v0.2.0: 一个用于元数据管理的分布式KV存储达坦科技DatenLord Xline 分布式 rust KV存储元数据管理 DatenLord达坦科技
Xline是什么？我们为什么要做Xline？Xline是一个基于Curp协议的，用于管理元数据的分布式KV存储。现有的分布式KV存储大多采用Raft共识协议，需要两次RTT才能完成一次请求。当部署在单个数据中心时，节点之间的延迟较低，因此不会对性能产生大的影响。但是，当跨数据中心部署时，节点之间的延迟可能是几十或几百毫秒，此时Raft协议将成为性能瓶颈。Curp协议就是为了解决这个问题而设计的。它
大数据生态圈里的一致性算法宇宙湾
大数据生态圈中，保证一致性的方式举不胜举Hadoop用Zookeeper（Zab，Paxos+事务顺序）ElasticSearch用Hash路由算法（非一致性Hash）Cassandra用Gossip闲话算法Redis用Raft选举算法他们各有什么区别，为什么会如此选型？Paxos选举算法Paxos是最先解决拜占庭将军问题的算法，利用过半选举的机制，保证了集群数据副本的一致性（微服务中服务注册与发
一种用于航天器姿态跟踪的新型角速度观测器（三） beegreen 控制与信号处理动态规划数学建模
一种用于航天器姿态跟踪的新型角速度观测器（三）AnewangularvelocityobserverforattitudetrackingofspacecraftISATransactions130(2022)377–388DOI:10.1016/j.isatra.2022.03.025摘要：本文提出了一种基于收缩分析的新型航天器姿态跟踪角速度观测器。观测器在惯性参考系中通过估计惯性角动量来设计，
探索音乐创作的新境界：Audiocraft-WebUI v2.0 廉娴鹃Everett
探索音乐创作的新境界：Audiocraft-WebUIv2.0audiocraft-webuiQuickwebuiforaudiocraft项目地址:https://gitcode.com/gh_mirrors/au/audiocraft-webui随着科技的进步，音乐创作也迎来了智能化的春风。今天，我们要为大家隆重介绍一个颠覆性的开源项目——Audiocraft-WebUIv2.0，它是Face
Kafka-3.3.4摒弃zookeeper集群部署操作文档 ShoShin1020 kafka zookeeper 分布式
一、集群规划kafka从2.8版本开始，就允许用户在不需要zookeeper的情况下运行。真正全面摒弃zookeeper的版本是3.0，在后面的版本kafka使用了新的元数据管理方式kraft,提高了Kafka的可扩展性、可用性和性能。下载地址：ApacheKafka这里下载kafka_2.13-3.4.0.tgz版本，自带有支持raft模式主机名称IPprocess.rolesnode.idma
The password will become valid in 1 hour. 橙姜
Thepasswordwillbecomevalidin1hourafteryouchangeit.
【vscode】vscode+cmake+llvm+ninja开发环境的搭建(draft) 真·Wild·攻城狮码农日常 vscode c++
文章目录前言1软件、工具和插件安装1.1vscode安装1.2cmake安装1.3安装LLVM1.4安装Ninja1.5vscode插件安装2工具链和CMakeLists2.1工具链（toolchain.cmake）2.2CMakeLists.txt2.3基本语法注释前言本文是一个使用vscode的小白扫盲贴。所谓工欲善其事必先利其器，作为码农的生产工具，vscode的开发配置是生产的第一步。1软
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

Raft共识算法

Raft概述

Leader选举（Leader election）

日志复制（Log replication）

安全（Safety）

选举限制

提交之前任期的日志条目

对Raft中几种情况的思考

follower节点与leader日志内容不一致时怎么处理？

leader挂掉了，怎么处理？

出现网络分区时怎么处理？

成员变更

日志压缩

Client Protocol

附录

你可能感兴趣的:(Raft共识算法)