如何利用云计算技术来实现基于Web的Client-Sever系统的non-stop Sever(灾难恢复)

最近看了一篇云计算方面的论文(COLO: COarse-grained LOck-stepping Virtual Machines forNon-stop Service),论文主要讲述的是针对目前的灾难恢复方式的不足,提出的利用PVM和SVM之间针对用户同一请求的响应相似性来判断SVM是否是PVM的有效备份。

这是原论文链接:https://www.researchgate.net/publication/259016214_COLO_COarse-grained_LOck-stepping_Virtual_Machines_for_Non-stop_Service


下面是我对这篇论文贡献的一个总结和一点疑问:

现状:                                                

A 之前的基于硬件实现的容错解决方案和基于替换物理节点的虚拟机备份方式存在着较高的开销,并且严重限制了它的可扩展性和适应性.

B 目前基于软件实现的备份方式(SBR)。指令水平的锁步策略只适用于单处理器,对于多处理器的处理性能会突降至原来的1/7;对于在带有周期性检查点的时间片边界备份的策略,存在频繁周期性检查带来的额外负载和由于输出缓存带来的网络延迟。

本文的突破和贡献                                      

本文提出了一种高可用性的,基于粗粒度锁步的虚拟机灾难恢复方案——COLO。它针对网络上客户端-服务器类型系统的Non-stop Service提供了有效,通用且应用无关的方案,并且把云计算环境下的高可靠性的IT基础设施作为一种服务。

相对于PVM与SVM状态完全实时一致的强条件,COLO采用判断PVM与SVM输出(响应)相似性这一较弱条件作为SVM是否是有效备份的依据,因为在客户看来如果PVM与SVM输出一致那么SVM就是PVM的有效备份,所以它允许PVM与SVM状态的短期或相对不一致。

对于用户的同一请求,当PVM与SVM响应不同时,COLO启动一个锁步将PVM状态与SVM同步后再恢复执行,所以在用户角度SVM永远是PVM的有效备份。虽然两者之间状态分歧的频率和状态达到一致的时间段和具体的服务有关,但是本文针对目前主要的云计算和数据中心的应用环境已经做了测试,COLO的性能对不同服务类型已经有了不同幅度而改善,并且存在着很大的潜力和研究价值。

疑问                                                  

1,在对于用户请求进行响应之前需要对PVM于SVM的输出进行相似性判断,这样频繁的判断产生的额外负载和响应延迟是否是可接受的?

2,本文测试了COLO在目前云计算和数据中心的主要应用环境中的性能,因为COLO的执行性能是和服务的semantics和PVM, SVM的determinis- tic execution performance 有关。所以能够证明它的应用无关性吗?


你可能感兴趣的:(备份,云计算,VM,灾难恢复,粗粒度锁)