Bokk

2020 6.824 的 Raft Lab 2B

前言
一、Raft2B
二、SendHeartbeat
- 2.1 框架
- 2.2、发送部分的AppendEntriesArgs
- 2.3、接收部分的处理
- - - 2.3.1 成功处理
    - 2.3.2 失败处理
- 2.4、最后, SendHeartbeat的实现如下
三、 AppendEntries
- 3.1 整体框架
- 3.2 日志对比
- 3.3 日志保存
- 3.4 跟新commitIndex
- 3.5 最后, AppendEntries的实现如下
四、其他一些相关修改
- 4.1 start
- 4.2 RequestVote跟新
- 4.3 ApplyLog
总结

前言

做2020的MIT6.824，完成了实验Raft Lab2B，通过了测试，对于之前一个实验请参考2020 6.824 的 Raft Lab 2A

这个实验坑明显比2A多，花了大概3周时间才全部pass，其中20%时间在理解，10%时间在coding，剩下70%时间在debug，于是顺便养成看log的习惯

Lab2B 部分我也是没有做优化的，也就是这个部分的优化实现，没有conflictIndex以及conflictTerm同样也是可以通过Lab2B的Test的

下面有这个链接对我的实验测试很有帮助，主要是为了多测测试，保证没有因为概率通过而miss掉的一些测试用例

并行运行测试的shellscript

##每20个test并行运行，运行100次2B的test
bash test_many.sh 100 20 2B

实验要求是不能参考别人的代码的，这个我没有完全准守，下面是我参考的链接。不过，使用别人的代码同时也给我挖了个坑，就是把别人的代码片段copy过来自己用，有时候一些边界条件特别容易忽略，所以其实看看别人的思路(框架)，再结合自己的代码自己实现，可以少采坑，当然，最好是自己重头到尾撸一遍。好了，下面是我参考的实现

2017 版本的Raft
2020 版本的Raft
C++ 版本的Raft

一、Raft2B

在整体框架上我还是沿用了我Raft 2A的设计，那么2B的实现主要完善了2A中的两个方法

AppendEntries()
SendHeartbeat()

同时，需要完成一些log同步相关的helper function

二、SendHeartbeat

2.1 框架

func (rf *Raft) SendHeartbeat() {
   for !rf.killed() {
   	...
   		for i := 0; i < len(rf.peers); i++ {
   			... 
   			args := AppendEntriesArgs{
   				...
   			}

   			go func(p int, args *AppendEntriesArgs) {
   				...
   				if reply.Success == true {
   					//成功处理
   					...
   				} else {
   					//失败处理
   					...
   				}
   			}(i, &args)
   		}
   	}()
   }
}

2.2、发送部分的AppendEntriesArgs

nextIndex := rf.nextIndex[i]
	entries := make([]LogEntry, 0)
	entries = append(entries, rf.log[nextIndex:]...)
	args := AppendEntriesArgs{
		Term:         rf.currentTerm,
		LeaderId:     rf.me,
		Entries:      entries,
		PrevLogIndex: rf.getPrevLogIndex(i),
		PrevLogTerm:  rf.getPrevLogTerm(i),
		LeaderCommit: rf.commitIndex,
}

AppendEntriesArgs增加了Entries, PrevLogIndex, PrevLogTerm, LeaderCommit
- PrevLogIndex是leader对每个peer记录nextIndex的前一个，也就是nextIndex-1
- PrevLogTerm是PrevLogIndex对应的Term
- Entrries 是针对peer而言的，是leader给peer发送的entries，至于发什么entries，取决于leader对peer记录的nextIndex之后的log，也就是append(entries, rf.log[nextIndex:]…)
前面提到的nextIndex是leader临时生成的，也就是在convertToLeader时候生成的

func (rf *Raft) convertToLeader() {
	...
	//每个节点下一次应该接收的日志的index（初始化为Leader节点最后一个日志的Index + 1）
	rf.nextIndex = make([]int, len(rf.peers))
	for i := 0; i < len(rf.peers); i++ {
		rf.nextIndex[i] = rf.getLastLogIndex() + 1
	}
	//每个节点已经复制的日志的最大的索引（初始化为0，之后递增）
	//init match index is [0 0 0]
	rf.matchIndex = make([]int, len(rf.peers))
}

2.3、接收部分的处理

2.3.1 成功处理

需要跟新nextIndex以及matchIndex, 注意nextIndex的值以及log的长度可能已经被别的线程修改了，所以对于matchIndex

rf.matchIndex[p] = args.PrevLogIndex + len(args.Entries)
rf.nextIndex[p] = rf.matchIndex[p] + 1

同时，需要查看commitIndex是否需要跟新，对应paper就是，其实就是找一个MatchIndex的中位数N，如果N更大则跟新当前MatchIndex

If there exists an N such that N > commitIndex, a majority of matchIndex[i] ≥ N, and log[N].term == currentTerm: set commitIndex = N

对应代码就是

func (rf *Raft) advanceCommitIndex() {
	sortedMatchIndex := make([]int, len(rf.matchIndex))
	copy(sortedMatchIndex, rf.matchIndex)
	sortedMatchIndex[rf.me] = len(rf.log) - 1
	sort.Ints(sortedMatchIndex)
	N := sortedMatchIndex[len(rf.peers)/2]
	if rf.currentState == Leader && N > rf.commitIndex && rf.log[N].Term == rf.currentTerm {
		rf.commitIndex = N
		rf.applyLog()
	}

2.3.2 失败处理

我当前的处理是不完整的，但是也是可以通过Test，思路就是减少matchIndex的值再发送一次，

rf.nextIndex[p] = args.PrevLogIndex

后续试验应该会有优化的。对于优化的实现，参考 MIT Tutor出品的student guide

2.4、最后, SendHeartbeat的实现如下

func (rf *Raft) SendHeartbeat() {
	for !rf.killed() {
		time.Sleep(10 * time.Millisecond)
		func() {
			rf.mu.Lock()
			defer rf.mu.Unlock()

			if rf.currentState != Leader {
				return
			}

			now := time.Now()
			if now.Sub(rf.lastBroadcastTime) < 100*time.Millisecond {
				return
			}
			
			rf.lastBroadcastTime = time.Now()
			for i := 0; i < len(rf.peers); i++ {
				if i == rf.me {
					continue
				}

				nextIndex := rf.nextIndex[i]
				entries := make([]LogEntry, 0)
				entries = append(entries, rf.log[nextIndex:]...)
				args := AppendEntriesArgs{
					Term:         rf.currentTerm,
					LeaderId:     rf.me,
					Entries:      entries,
					PrevLogIndex: rf.getPrevLogIndex(i),
					PrevLogTerm:  rf.getPrevLogTerm(i),
					LeaderCommit: rf.commitIndex,
				}

				go func(p int, args *AppendEntriesArgs) {
					reply := AppendEntriesReply{}
					ok := rf.sendAppendEntries(p, args, &reply)
					if !ok {
						return
					}
					rf.mu.Lock()
					defer rf.mu.Unlock()
					if rf.currentTerm != args.Term {
						return
					}
					if reply.Term > rf.currentTerm {
						rf.convertToFollower(reply.Term)
						return
					}
					if reply.Success == true {
						//如果成功：更新相应跟随者的 nextIndex 和 matchIndex
						rf.matchIndex[p] = args.PrevLogIndex + len(args.Entries)
						rf.nextIndex[p] = rf.matchIndex[p] + 1
						rf.advanceCommitIndex()
					} else {
						rf.nextIndex[p] = args.PrevLogIndex
					}
				}(i, &args)
			}
		}()
	}
}

三、 AppendEntries

2A的AppendEntries可是说是相当粗糙的，实验2B可是重头戏，paper说到的5个规则一个都不能少

Reply false if term < currentTerm (§5.1)

Reply false if log doesn’t contain an entry at prevLogIndex whose term matches prevLogTerm (§5.3)

If an existing entry conflicts with a new one (same index but different terms), delete the existing entry and all that follow it (§5.3)

Append any new entries not already in the log

If leaderCommit > commitIndex, set commitIndex = min(leaderCommit, index of last new entry)

3.1 整体框架

我的实现就是先检测reply=false的情况，使用goto早退出，然后处理日志的保存以及更新commitIndex

func (rf *Raft) AppendEntries(args *AppendEntriesArgs, reply *AppendEntriesReply) {
	rf.mu.Lock()
	defer rf.mu.Unlock()
	
	isSuccess := false
	conflictTerm := -1
	conflictIndex := -1
	
	...

	if args.Term < rf.currentTerm {
		goto label1
	}

	if args.Term > rf.currentTerm {
		...
	}

	//If a follower does not have prevLogIndex in its log, it should return with conflictIndex = len(log) and conflictTerm = None.
	if len(rf.log)-1 < args.PrevLogIndex {
		...
		goto label1
	}

	// 如果本地有前一个日志的话，那么term必须相同，否则false
	if args.PrevLogIndex > 0 && rf.log[args.PrevLogIndex].Term != args.PrevLogTerm {
		...
		goto label1
	}

	// 保存日志
	for i, logEntry := range args.Entries {
		...
	}
	
	// If leaderCommit > commitIndex, set commitIndex = min(leaderCommit, index of last new entry)
	if args.LeaderCommit > rf.commitIndex {
		...
	}

	isSuccess = true
	goto label1

label1:
	rf.applyLog()
	reply.Success = isSuccess
	reply.Term = rf.currentTerm
	reply.ConflictIndex = conflictIndex
	reply.ConflictTerm = conflictTerm
	return
}

3.2 日志对比

如果本地有日志，需要index跟term同时相同，否则就有conflictIndex
如果需要优化的话就是查找conflictIndex就是从rf.log最高的index开始往后一个一个检测，知道Term一直为止。不过这部分我没有做，直接返回即可

// 如果本地有前一个日志的话，那么term必须相同，否则false
if args.PrevLogIndex > 0 && rf.log[args.PrevLogIndex].Term != args.PrevLogTerm {
	goto label1
}

3.3 日志保存

把foller没有的entries补上
如果index一样term不一样，删除follower的index之后的所有log

// 保存日志
for i, logEntry := range args.Entries {
	index := args.PrevLogIndex + i + 1
	if index > len(rf.log)-1 {
		rf.log = append(rf.log, logEntry)
	} else {
		if rf.log[index].Term != logEntry.Term {
			rf.log = rf.log[:index]
			rf.log = append(rf.log, logEntry)
		} // term一样啥也不用做，继续向后比对Log
	}
}

3.4 跟新commitIndex

对应的paper

If leaderCommit > commitIndex, set commitIndex = min(leaderCommit, index of last new entry)

if args.LeaderCommit > rf.commitIndex {
	rf.commitIndex = args.LeaderCommit
	if len(rf.log)-1 < rf.commitIndex {
		rf.commitIndex = len(rf.log) - 1
	}
}

3.5 最后, AppendEntries的实现如下

func (rf *Raft) AppendEntries(args *AppendEntriesArgs, reply *AppendEntriesReply) {
	rf.mu.Lock()
	defer rf.mu.Unlock()
	
	isSuccess := false
	conflictTerm := -1
	conflictIndex := -1
	rf.lastReceived = time.Now()

	if args.Term < rf.currentTerm {
		goto label1
	}

	if args.Term > rf.currentTerm {
		rf.convertToFollower(args.Term)
	}

	//If a follower does not have prevLogIndex in its log, it should return with conflictIndex = len(log) and conflictTerm = None.
	if len(rf.log)-1 < args.PrevLogIndex {
		conflictIndex = len(rf.log)
		goto label1
	}

	// 如果本地有前一个日志的话，那么term必须相同，否则false
	if args.PrevLogIndex > 0 && rf.log[args.PrevLogIndex].Term != args.PrevLogTerm {
		goto label1
	}


	// 保存日志
	for i, logEntry := range args.Entries {
		index := args.PrevLogIndex + i + 1
		if index > len(rf.log)-1 {
			rf.log = append(rf.log, logEntry)
		} else {
			if rf.log[index].Term != logEntry.Term {
				rf.log = rf.log[:index]
				rf.log = append(rf.log, logEntry)
			} // term一样啥也不用做，继续向后比对Log
		}
	}

	// If leaderCommit > commitIndex, set commitIndex = min(leaderCommit, index of last new entry)
	if args.LeaderCommit > rf.commitIndex {
		rf.commitIndex = args.LeaderCommit
		if len(rf.log)-1 < rf.commitIndex {
			rf.commitIndex = len(rf.log) - 1
		}
	}

	isSuccess = true
	goto label1

label1:
	rf.applyLog()
	reply.Success = isSuccess
	reply.Term = rf.currentTerm
	reply.ConflictIndex = conflictIndex
	reply.ConflictTerm = conflictTerm
	return
}

四、其他一些相关修改

4.1 start

试验代码有改函数的解释，大概意思就是应用层使用Raft的时候回调用Start函数，如果Raft接收到但不是leader，返回false，否则把相关应用层发过来的command append在leader的log后面，填好对应参数(Index, Term)，立即返回

the service using Raft (e.g. a k/v server) wants to start agreement on the next command to be appended to Raft’s log. if this server isn’t the leader, returns false. otherwise start the agreement and return immediately

func (rf *Raft) Start(command interface{}) (int, int, bool) {
	rf.mu.Lock()
	defer rf.mu.Unlock()
	index := -1
	term := -1
	isLeader := true
	// Your code here (2B).
	term = rf.currentTerm
	isLeader = rf.currentState == Leader
	if isLeader {
		index = len(rf.log)
		entry := LogEntry{
			Command: command,
			Index:   index,
			Term:    term,
		}
		rf.log = append(rf.log, entry)
	}
	return index, term, isLeader
}

4.2 RequestVote跟新

在2A的实验中，VoteGranted 并没有考虑candidate的log时候跟receiver的log对比，也就是

If votedFor is null or candidateId, and candidate’s log is at least as up-to-date as receiver’s log, grant vote (§5.2, §5.4)

对于2B这个实验，log的对比是需要考虑进去的，所以在代码中加上isLogMoreUpToDate即可

func (rf *Raft) RequestVote(args *RequestVoteArgs, reply *RequestVoteReply) {
	...
	if (rf.votedFor == -1 || rf.votedFor == args.CandidateId) && rf.isLogMoreUpToDate(args.LastLogIndex, args.LastLogTerm) {
		rf.votedFor = args.CandidateId
		reply.VoteGranted = true
	} 
	...
}

func (rf *Raft) isLogMoreUpToDate(index int, term int) bool {
	return term > rf.getLastLogTerm() || (term == rf.getLastLogTerm() && index >= rf.getLastLogIndex())
}

4.3 ApplyLog

对应paper就是，也就对比commitIndex以及lastApplied，如果commitIndex更大，则同步applylog[lastApplied]到状态机，也就是发送一个包含ApplyMsg的messge给rf.applyCh

If commitIndex > lastApplied: increment lastApplied, applylog[lastApplied] to state machine (§5.3)

func (rf *Raft) applyLog() {
	for rf.commitIndex > rf.lastApplied {
		rf.lastApplied += 1
		entry := rf.log[rf.lastApplied]
		msg := ApplyMsg{
			CommandValid: true,
			Command:      entry.Command,
			CommandIndex: entry.Index,
		}
		rf.applyCh <- msg
	}
}

总结

DPrint真的非常重要，一定要多加log，这样才能更容易debug
需要静下心好好看paper，或者别的解读也行，目的就是需要明确Raft log的同步整个流程

MIT6.824 课程-MapReduce 余为民同志 6.824 mapreduce 分布式 6.824
MapReduce：在大型集群上简化数据处理概要MapReduce是一种编程模型，它是一种用于处理和生成大型数据集的实现。用户通过指定一个用来处理键值对(Key/Value)的map函数来生成一个中间键值对集合。然后，再指定一个reduce函数，它用来合并所有的具有相同中间key的中间value。现实生活中有许多任务可以通过该模型进行表达，具体案例会在论文中展现出来。以这种函数式风格编写的程序能够
CMU15-440-P0:Implementing a key-value messaging system sdj222555 分布式
准备继续更新blog。最近工作上一直在写业务，看些课程换换脑子。15-440是CMU的一个分布式课程http://www.cs.cmu.edu/~15-440/syllabus.html，其实之前在学校的时候就上过分布式的课程，当时用的MIT6.824的课件，可惜当时很多paper没有仔细去看，只是把作业做了下，除了lab1都没有写blog记录，导致后来有时间写blog的时候很多细节都不记得了。这
redis持久化背帆 redis redis 数据库
持久化：可以理解为mit6.824教的主从备份机制，状态转移对应RDB，复制状态机对应AOF，RDB是全部数据的二进制快照文件，AOF是文本追加的日志。RDB拷贝全部数据慢，是分钟级别的恢复机制但恢复更快，AOF通常设置1秒保存一次。官方推荐默认使用RDB，但AOF与RDB同时开启仅使用AOFRDB触发：1、主动执行save(阻塞)或bgsave(非阻塞)。2、达到阙值。3、关闭redis。RDB
6.824-Lab 1: MapReduce 向来痴_ mapreduce 大数据
lab1链接：6.824Lab1:MapReduce(mit.edu)介绍在这个实验中，你将构建一个MapReduce系统。你将实现一个工作进程（workerprocess），调用应用程序的Map和Reduce函数，并处理文件的读写，以及一个主进程（masterprocess），分配任务给工作进程并处理失败的工作进程。你将构建的系统与MapReduce论文中描述的相似。合作政策你必须自己编写你提交
MIT 6.5830 概述一颗小小的石头. MIT6.5830 数据库开发 mit课程
简介同MIT6.824系列类似，6.4830是关于DatabaseSystem的一门课程，官方主页链接。从课程信息可知，理论课分为21个课时，3个问题集，4个实验，1个项目。课程的ppt可以下载，对应的课堂回放可以直接在YouTube上观看。课程要求对数据库有基础理解，如下：SQL。会基本的crud操作，包括join、groupby等实操经验。执行/存储引擎聚簇索引查询优化分析内容21节课程比较啰
MapReduce 论文阅读笔记 MapReduce 简介 RzBu11d023r 分布式系统摘要性笔记 mapreduce big data 大数据
论文：MapReduce:SimplifiedDataProcessingonLargeClustersJeffreyDeanandSanjayGhemawatGooglehttps://pdos.csail.mit.edu/6.824/papers/mapreduce.pdfMapReduce是一种分布式系统中处理大数据方法。他提出是在2004，jeffdean和SanjayGhemawat的作
分布式一致性算法---Raft初探小帅吖分布式系统分布式共识算法 raft 分布式系统
读Raft论文也有一段时间了，但是自己总是以目前并没有完全掌握为由拖着这篇博客。今天先以目前的理解程度（做了6.824的lab2A和lab2B）对这篇论文做一个初步总结，之后有了更深入的理解之后再进行迭代，关于本文有任何疑问欢迎评论交流。另外需要说明的是本篇博客并没有对Raft算法的背景和基础知识进行全面介绍，所以需要有一定的基础之后进行阅读。基本概念三种状态及相互转换关系Raft算法中每个服务器
MIT 6.824 分布式系统 lab1 MapReduce 遇到死锁问题花里胡哨的菜只因 mapreduce 大数据
记录学习6.824的lab1遇到的坑（死锁了）代码逻辑借鉴：https://blog.csdn.net/weixin_45938441/article/details/124018485问题描述目前处于编写worker与coordinate进行RPC通信的环节，worker中的Map和Reduce方法还都没有开动只有一个打印逻辑，只是想先测一下，worker和coordinate之间能否正常通信。
【分布式-6.824】MIT分布式系统概述我要精通C++ 分布式分布式
1.引入论文地址：http://nil.csail.mit.edu/6.824/2020/schedule.html参考lab：https://github.com/aQuaYi/MIT-6.824-Distributed-Systems推荐书目：DDIA数据密集型应用系统设计https://book.douban.com/subject/30329536/--推荐书《DesigningData-
6.824 Lab3 KVRAFT总结 Countingstarss
1引言实验结果对于3A部分，可以稳定通过测试，结果如下：Test:oneclient(3A)......Passed--15.352021212Test:manyclients(3A)......Passed--16.453230466Test:unreliablenet,manyclients(3A)......Passed--17.152616311Test:concurrentappendt
CMU 15445 Project 2A 实现并发B+树的数据库索引（查询和插入）西部小笼包
项目文档在这里，这个PROJECT我大概看了下描述。还是比较有挑战的，所以我会写的详细一点。但和MIT6.824那样一步步手把手指导，还是会不同。这边我重点挑我认为不是无脑就可以实现的部分写。https://15445.courses.cs.cmu.edu/fall2018/project2/按照CHECKPOINTA的描述，大概我们会改动image.png在此之前，我建议你做一下HOMEWORK
MIT 6.824 练习1 Daniel_187 Go go 分布式网络爬虫爬虫
Hi,there!这是一份根据MIT6.824(2021)课程的第2课的课堂示例代码改编的2个go语言编程练习。像其他的编程作业一样，我去除了核心部分，保留了代码框架，并编写了每一步的提示练习代码在本文的最后面爬虫在第一部分，你需要实现3个版本的网络爬虫。1单线程爬虫首先，请为fakeFetcher类型实现Fetcher接口中的Fetch()方法。然后实现串行爬虫Serial()函数（递归），并在
【MIT 6.824 分布式系统】Lecture2中的 crawler.go 代码及解析背书包的小新爬虫 golang 开发语言
packagemainimport("fmt""sync")////SeveralsolutionstothecrawlerexercisefromtheGotutorial//https://tour.golang.org/concurrency/10//////Serialcrawler////看Mit这节课的时候，感觉mit的学生真的很不一样，一直在提问题，而且直接打断老师并说出自己的想法。
Redis集群:分布式的less is more SakamataZ redis 分布式数据库
Redis完全就是《数据密集型应用系统设计》的简单实现，主打一个**大道至简**。推荐配合这本书（或者15-445+6.824）一起看[1]。本文就从分布式视角来介绍下Redis集群模式，顺便看看一些经典的分布式问题在redis下如何解决。**这篇文章主要提供一个highlevel的视角，也就是聚焦于所有分布式系统都会有的一些问题，而不仅限于Redis，阅读时可以多带入自己熟悉的系统的视角。**比
6.824 Lab2 RAFT总结 Countingstarss
1引言大约用了20多天的时间完成了6.824的lab2，期间穿插了毕业预答辩，改论文，准备外审等等事情，最终磕磕绊绊的完成了Lab2，感觉算是自己写的程序中比较具有挑战性的了，因为在实验过程中需要认真的考虑并发、加锁、死锁等问题，并且实际RAFT论文中省去了很多细节，而且为了尽量通过测试与优化性能，本人也对与RAFT论文中很多细节进行更改，因此该Lab的完成具有一定挑战。实验结果开门见山，先放结果
MIT 6.824 -- MapReduce Lab Binary Oracle #MIT 6.824 mapreduce 大数据
MIT6.824--MapReduceLab环境准备实验背景实验要求测试说明流程说明实验实现GoLand配置代码实现对象介绍协调器启动工作线程启动Map阶段分配任务执行任务Reduce阶段分配任务执行任务终止阶段崩溃恢复注意事项并发安全文件转换golang知识点测试环境准备从官方git仓库拉取分支gitclonegit://g.csail.mit.edu/6.824-golabs-20206.82
MIT6.824-lab2A-2022篇（万字推导思路及代码构建）幸平xp 分布式后端分布式 golang
目录前言一、学习背景二、实验引入三、结构体实现3.1State的定义3.2AppendEntriesRPC的定义3.3RequestVoteRPC的定义四、领导选举4.1初始化raft节点4.2Ticker(建立主体的心跳）4.3投票RPC实现五、日志增量/心跳建立5.1心跳/日志增量RPC实现5.2Test情况六、DeBug杂谈总结前言趁着五一没啥事情，花两天把lab2A写一下…还是老样子，希望
MIT6.824-lab2B-2022篇（万字推导思路及代码构建）幸平xp 分布式开发语言 go 分布式
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、整体流程思路二、初始化，发送ticker2.1、初始化2.2、发送ticker三、进行日志增量的RPC3.1、进行reply构造3.2、处理reply四、Debug五、总结前言忙里偷闲总算是把lab2b肝完了…不得不说五月真是最近最忙的一个月。对于lab2b，难度其实确实比lab2a大，甚至是比整个Lab1大的。2b其
Mit6.824-lab2d-2022 eternalex Mit6.824 分布式
Mit6.824-lab2d-2022写在前面如果你听从了我在2a里的建议，计算下标时已经考虑到了snapshot并且有好好做过2a和2b实验的设计与debug，那2d实验和2c差不多一样简单，只完成snapshot和installSnapshot这两个功能，并在适时的位置调用即可。如果你是和我一样什么也没有准备，就一个实验一个实验接着往下做，那想要2d做到完善，就需要大量的填补漏洞与漫长的deb
Mit6.824-lab3a-2022 eternalex Mit6.824 分布式 go 算法
Mit6.824-lab3a-2022写在前面个人感觉lab3相比于lab2要简单不少，唯一的难点应该就是没有lab2那样明确的paper指导。对我来说花费时间最多的反而是对lab2的修补，用了一个大佬的lab2代码，两天就把lab3的代码全部通过测试，回过头来debug自己lab2的代码反反复复花了一个多星期。而且和lab2直接对raft进行debug不同，lab3要结合自己的逻辑然后和lab2
Mit6.824-lab3b-2022 eternalex Mit6.824 golang 分布式算法
Mit6.824-lab3b-2022写在前面个人感觉3b需要做的工作比3a还要简单，只是添加了个server的snapshot，但是由于加入了snapshot所以3a的测试对raft的代码要求又高了一个档次，我基本上所有的精力也都花到对raft部分的debug上了，由于进行apply的chan不能上锁，这里会出现各种乱序的bug，只能说这个地方的设计确实是有点难受了。而且每次十几万行的log信息
Mit6.824-lab2a-2022 eternalex Mit6.824 服务器 javascript 前端
Mit6.824-lab2a-2022实验介绍实验建议1.熟悉整个实验2.提前做好后两个实验的准备3.写好功能函数4.做足够的测试2a实验内容具体实现测试错误信息实验介绍lab2总体是要复现一个简易的Raft系统，这个实验被分为了四个部分2a，Leader的选举与保持；2b，log的添加；2c，数据持久化与服务器恢复2d，snapshot实现实验的重点是2a和2b，如果这两个部分没有打好基础，后面
MIT 6.824-lab2 Raft 东东儿 6.824 go raft算法分布式 mit 分布式一致性协议
这个lab2属实麻烦，花了两天时间写代码，最后花了四天时间来debug才通过，debug的手段也很有限，基本只能通过看日志来发现代码中的逻辑问题，最终回顾写出来的代码还乱得不行，先做个简单的记录，以后如果还有时间来重构一下代码。1.Raftraft算法是一种分布式共识算法，相对于paxos算法而言更加简单容易理解（看起来简单，实现起来也挺不容易的）。raft的论文很多，也有很多中文版的，看一看很容
mit6.824 2022 lab2 最佳损友1020 国外课程实验 raft mit6.824 lab2
MIT6.8242022RaftRaftleaderelectionlogpersistencelogcompaction整体测试后面发现的问题参考代码汇总博客：MIT6.8242022Raftleaderelection不论是访问还是修改Raft可变类成员，都需要加锁rf.mu.Lock()ifrf.state!=Leader{rf.mu.Unlock()return}args:=AppendE
MIT 6.824分布式 LAB3：kvraft Wedge_Ss 分布式数据库 go golang
Lab3要求实现数据库和raft算法的结合。分别需要设计客户端和服务端，Lab3的代码的复杂性远不如Lab2，因此代码量不是很多，尽量也避免修改raft的源码，不然出了bug改起来也头疼。客户端和服务端进行连接，服务端处运行着数据库服务，服务端同样还需要运行raft算法进行共识。客户端能够向服务端发起的请求有put,append,get。当客户端需要进行指定的功能时，给服务端的发送消息，然后会将操
MIT 6.824分布式 LAB2D：Raft Wedge_Ss 分布式 rpc golang
Lab2D是lab2的最后阶段了，这一阶段就是加了一个快照机制，但是这种实验中这个快照是何时以及如何进行的，建议大家事前先去看一看，不然就会碰到各种问题。例如，我在测试过程中莫名其妙发现leader死锁了，以及测试显示lastapplied的index值和commandIndex值不匹配等问题。这个实验的代码修改范围挺大，因为涉及到了rf.log的索引值的修改，以及logreplication的运
MIT 6.824分布式 LAB2A：Raft Wedge_Ss 分布式 golang
Lab2A被官方指定为中等难度，对于我这种之前很少写多线程的菜鸡而言，真的花费了大量时间，同时对于论文的理解不够深刻，导致我在写这个lab的过程中多次推倒重写其中的逻辑，以及锁使用的不熟练，让程序在执行过程中经常发生有raft节点死锁。后续记录一下，我写这个lab2A过程中的踩的坑。介绍Lab2A就是让你实现leader的选举，因此对于选举这块的逻辑务必要理清，否则写的过程中就会不知如何处理Las
MIT 6.824分布式 LAB2B：Raft Wedge_Ss 分布式 java rpc
Lab2B难度为hard，但是有了之前2A的经历，于我而言，2B的难度倒是远低于2A的难度。2B需要实现的功能就只是logreplication。在写2B的过程中，我还找到了之前2A写的一些bug，说实话，多线程的程序，有些bug真的很难发现，你会发现突然某次运行就有一个raft节点发生了死锁，没有任何响应了，大概率是因为锁设置的太多了，导致某处出现了死锁，同时此写这个lab对于我debug能力的
MIT6.824-Raft笔记:Raft初探、副本间log时序 Skyego 分布式共识算法 raft MIT6.824 笔记分布式存储
从宏观角度说明raft在程序中的作用，和客户端的关系，以及多个副本之间的关系；从微观角度说明多个副本之间raft对日志处理的流程。1.Raft初探宏观角度说明raft在程序中的作用，和客户端的关系，以及多个副本之间的关系。Raft会以库（Library）的形式存在于服务中。如果你有一个基于Raft的多副本服务，那么每个服务的副本将会由两部分组成：应用程序代码和Raft库，应用程序代码接收RPC或者
MIT6.824-Raft笔记:脑裂、Majority Vote(过半投票/过半选举) Skyego 分布式共识算法 raft MIT6.824 共识算法
本部分主要是问题引入，以及给出一个解决方案1脑裂（SplitBrain）replicationsystem的共同点：单点前面几个容错特性（fault-tolerant）的系统，有一个共同的特点。MapReduce复制了计算，但是复制这个动作，或者说整个MapReduce被一个单主节点控制。GFS以主备（primary-backup）的方式复制数据，会实际的复制文件内容，但它也依赖一个单主节点，来确
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。