Fault-Tolerance, Fast and Slow: Exploiting Failure Asynchrony in Distributed Systems
本文(OSDI18')主要介绍一种新的副本复制协议:SAUCR(场景可感知的更新与故障恢复)。它是一种混合的协议:在一定场景(正常情况)下:副本复制的数据缓存在内存中。故障发生时(多个节点挂掉,处于系统无法正常运行的边缘):副本复制的数据缓存同步刷入磁盘。该协议在保证高性能的同时,保证了很强的持久性和可用性。Introduction分布式存储系统通常通过维护多个副本来进行容错,这些协议都是基于Ma