cmu440(11) Fault Tolerance, Logging and recovery 2
容错-使用检查点恢复在DS中实现容错进程弹性(当进程失败时)有多个进程(冗余)将它们分组(平面,分层),投票可靠的RPC(通信失败)需要考虑的几个案例(丢失的答复,客户端崩溃......)每种情况的几种可能的解决方案分布式提交协议由所有小组成员执行操作,或根本不执行2阶段提交,...(上次讲座)今天:发生故障,我们能恢复吗?恢复策略发生故障时,我们需要使系统进入无错状态(恢复)。这是容错的基础。后