SOFAJRaft 源码分析四（SPI机制、快照）

1.概述

这篇文章我们来学习一下JRaft的SPI机制，以及快照的实现。对于SPI，在框架开发，尤其是模块设计中是非常必要的，他可以实现可插拔的业务逻辑，实现解藕。对于快照，其实就是raft对日志的优化，避免新节点加入后大量的网络和磁盘IO，并且可以节省磁盘空间，是非常必要的。接下来我们慢慢看。

2.JRaft的SPI实现

主要实现类就是JRaftServiceLoader。
我们来看看使用方式

public static final JRaftServiceFactory defaultServiceFactory = JRaftServiceLoader.load(JRaftServiceFactory.class).first();

JRaftServiceLoader#load

public static  JRaftServiceLoader load(final Class service) {
    return JRaftServiceLoader.load(service, Thread.currentThread().getContextClassLoader());
}

public static  JRaftServiceLoader load(final Class service, final ClassLoader loader) {
    return new JRaftServiceLoader<>(service, loader);
}

通过当前线程上线文类加载器（其实就是AppClassLoader）去进行加载工作。当然这里直接用JRaftServiceLoader的类加载器也是一样的效果。

JRaftServiceLoader#first

public S first() { final List sortList = sort(); if (sortList.isEmpty()) { throw fail(this.service, "could not find any implementation for class"); } return sortList.get(0); }

这个sort方法其实就是获取到一个排序实现类的集合。然后从中获取第一个（最优先的）。

JRaftServiceLoader#sort

public List sort() { final Iterator it = iterator(); final List sortList = new ArrayList<>(); while (it.hasNext()) { sortList.add(it.next()); } if (sortList.size() <= 1) { return sortList; } sortList.sort((o1, o2) -> { final SPI o1_spi = o1.getClass().getAnnotation(SPI.class); final SPI o2_spi = o2.getClass().getAnnotation(SPI.class); final int o1_priority = o1_spi == null ? 0 : o1_spi.priority(); final int o2_priority = o2_spi == null ? 0 : o2_spi.priority(); return -(o1_priority - o2_priority); }); return sortList; }

这个方法其实实现很简单，就是通过迭代器，去迭代获取所有的实现，然后根据实现类的SPI注解中的priority，也就是优先级进行排序，最后返回一个有序的集合。
我们重点还是关注这个迭代器的实现。

JRaftServiceLoader#iterator

final Iterator> knownProviders = JRaftServiceLoader.this.providers.entrySet() .iterator(); @Override public boolean hasNext() { return this.knownProviders.hasNext() || JRaftServiceLoader.this.lookupIterator.hasNext(); } @Override public S next() { if (this.knownProviders.hasNext()) { return this.knownProviders.next().getValue(); } final Class cls = JRaftServiceLoader.this.lookupIterator.next(); try { final S provider = JRaftServiceLoader.this.service.cast(cls.newInstance()); JRaftServiceLoader.this.providers.put(cls.getName(), provider); return provider; } catch (final Throwable x) { throw fail(JRaftServiceLoader.this.service, "provider " + cls.getName() + " could not be instantiated", x); } }

knownProviders其实就是一个缓存，加载成功的会放在这个Map里面。也就是我们第二次调用iterator方法的时候，就不需要重新执行类加载过程了（也不会重新执行），直接从缓存中获取。
如果是第一次执行该方法，那么依赖lookupIterator去执行加载过程。我们先来看一下lookupIterator（LazyIterator）的实现。

LazyIterator#hasNext

@Override public boolean hasNext() { if (this.nextName != null) { return true; } if (this.configs == null) { try { final String fullName = PREFIX + this.service.getName(); if (this.loader == null) { this.configs = ClassLoader.getSystemResources(fullName); } else { this.configs = this.loader.getResources(fullName); } } catch (final IOException x) { throw fail(this.service, "error locating configuration files", x); } } while ((this.pending == null) || !this.pending.hasNext()) { if (!this.configs.hasMoreElements()) { return false; } this.pending = parse(this.service, this.configs.nextElement()); } this.nextName = this.pending.next(); return true; }

这里有个细节，就是加了一个this.nextName，如果不为空的话，直接返回true，因为后面在判断成功后会给this.nextName赋值。如果调用了hasNext方法，却没有调用next，那么下次调用hasNext就不用在走一遍判断逻辑。

其实方法逻辑很简单，就是获取对应路径下的文件，并加载出来。然后逐行解析。不管每行多个实现或者只有一个。都是可以适配的。到这里基本上就说完了。

实现还是比较简单。通过迭代器，懒加载，缓存来实现的。并加了优先级。

2.JRaft的快照

快照初始化

在节点初始化的时候，会启动快照的定时器snapshotTimer。
默认时间为一天执行一次。

SnapshotExecutorImpl#doSnapshot

这个方法流程如下：

判断节点状态，如果stop、savingSnapshot或downloadingSnapshot的时候，直接返回

如果没有新的数据则返回。

创建SnapshotWriter

封装成SaveSnapshotDone丢给fsmCaller

final SnapshotWriter writer = this.snapshotStorage.create(); if (writer == null) { Utils.runClosureInThread(done, new Status(RaftError.EIO, "Fail to create writer.")); reportError(RaftError.EIO.getNumber(), "Fail to create snapshot writer."); return; } this.savingSnapshot = true; final SaveSnapshotDone saveSnapshotDone = new SaveSnapshotDone(writer, done, null); if (!this.fsmCaller.onSnapshotSave(saveSnapshotDone)) { Utils.runClosureInThread(done, new Status(RaftError.EHOSTDOWN, "The raft node is down.")); return; }

在fsmCaller中的runApplyTask 方法会处理snapshot save事件，最终调用doSnapshotSave方法。

case SNAPSHOT_SAVE: this.currTask = TaskType.SNAPSHOT_SAVE; if (passByStatus(task.done)) { doSnapshotSave((SaveSnapshotClosure) task.done); } break;

FSMCallerImpl#doSnapshotSave

这个方法主要是为SnapshotWriter构建SnapshotMeta 对象，填充对应元数据，最后会调用onSnapshotSave 方法。

final SnapshotWriter writer = done.start(metaBuilder.build()); if (writer == null) { done.run(new Status(RaftError.EINVAL, "snapshot_storage create SnapshotWriter failed")); return; } this.fsm.onSnapshotSave(writer, done);

this.fsm.onSnapshotSave方法需要业务方去实现，主要就是快照的保存和压缩。业务方需将快照文件数据加入到SnapshotWriter中。

安装快照

安装快照实在Replicator中执行。

fillCommonFields返回false就调用installSnapshot方法。

或者当前要同步的日志数量为0（两种情况，一种是确实没有日志同步，另一种是日志被删除，存储到快照文件了，如果是被删除，就需要同步快照），也会调用installSnapshot方法。

if (!fillCommonFields(rb, this.nextIndex - 1, isHeartbeat)) { // id is unlock in installSnapshot installSnapshot(); if (isHeartbeat && heartBeatClosure != null) { Utils.runClosureInThread(heartBeatClosure, new Status(RaftError.EAGAIN, "Fail to send heartbeat to peer %s", this.options.getPeerId())); } return; } if (rb.getEntriesCount() == 0) { if (nextSendingIndex < this.options.getLogManager().getFirstLogIndex()) { installSnapshot(); return false; } // _id is unlock in _wait_more waitMoreEntries(nextSendingIndex); return false; }

installSnapshot方法会构建一个InstallSnapshotRequest发送给follower。InstallSnapshotRequest主要存储了快照的元数据以及一个uri信息。

InstallSnapshotRequestProcessor

该处理器主要用来接受leader发送的InstallSnapshotRequest请求。最后会调用handleInstallSnapshot 方法。

该方法和处理其他rpc请求的逻辑基本一致。如果当前节点ok，leader合法，会调用snapshotExecutor.installSnapshot方法。

this.snapshotExecutor.installSnapshot(request, InstallSnapshotResponse.newBuilder(), done);

SnapshotExecutorImpl#installSnapshot

该方法首先会构建一个下载快照的对象。然后调用registerDownloadingSnapshot去进行下载。

下载逻辑其实很简单：先加载元数据，建立文件和数据映射。然后去逐个去写文件。

public void installSnapshot(final InstallSnapshotRequest request, final InstallSnapshotResponse.Builder response, final RpcRequestClosure done) { final SnapshotMeta meta = request.getMeta(); final DownloadingSnapshot ds = new DownloadingSnapshot(request, response, done); // DON'T access request, response, and done after this point // as the retry snapshot will replace this one. if (!registerDownloadingSnapshot(ds)) { LOG.warn("Fail to register downloading snapshot."); // This RPC will be responded by the previous session return; } Requires.requireNonNull(this.curCopier, "curCopier"); try { //阻塞等待快照数据下载 this.curCopier.join(); } catch (final InterruptedException e) { Thread.currentThread().interrupt(); LOG.warn("Install snapshot copy job was canceled."); return; } loadDownloadingSnapshot(ds, meta); }

最后调用loadDownloadingSnapshot去安装文件数据。

具体逻辑在FSMCallerImpl的doSnapshotLoad 方法中。这个方法最后会调用业务状态机的onSnapshotLoad 方法。

public boolean onSnapshotLoad(final LoadSnapshotClosure done) { return enqueueTask((task, sequence) -> { task.type = TaskType.SNAPSHOT_LOAD; task.done = done; }); }

参考CounterStateMachine中的实现。首先判断数据是否有效（是否存在该文件），然后去从文件读取。最后set到value

public boolean onSnapshotLoad(final SnapshotReader reader) { if (isLeader()) { LOG.warn("Leader is not supposed to load snapshot"); return false; } if (reader.getFileMeta("data") == null) { LOG.error("Fail to find data file in {}", reader.getPath()); return false; } final CounterSnapshotFile snapshot = new CounterSnapshotFile(reader.getPath() + File.separator + "data"); try { this.value.set(snapshot.load()); return true; } catch (final IOException e) { LOG.error("Fail to load snapshot from {}", snapshot.getPath()); return false; } }

jraft的快照实现总结

存储快照

通过定时任务。定时执行存储逻辑。逻辑需要业务方实现。

传递快照

由leader决定是否需要传递。一般写入快照的日志会被删除。leader在发送日志时候，发现日志已经被删除的话，就需要传递快照。

传递快照方式

由leader发送一个条RPC，告诉follower需要来下载快照。这条RPC包括快照元数据和uri信息。
follower接收到RPC，会去主动下载leader的快照信息。下载成功后写入本地文件。

安装快照

初始化的时候会加载。或者下载完后会去主动加载。
加载逻辑很简单，就是根据下载的快照元数据信息去从磁盘加载数据，然后应用到状态机。

SOFAJRaft 源码分析四（SPI机制、快照）

1.概述

2.JRaft的SPI实现

JRaftServiceLoader#load

JRaftServiceLoader#first

JRaftServiceLoader#sort

JRaftServiceLoader#iterator

LazyIterator#hasNext

2.JRaft的快照

快照初始化

SnapshotExecutorImpl#doSnapshot

FSMCallerImpl#doSnapshotSave

安装快照

InstallSnapshotRequestProcessor

SnapshotExecutorImpl#installSnapshot

jraft的快照实现总结

你可能感兴趣的:(raft)