[论文笔记] Exploiting Data Deduplication to Accelerate Live Virtual Machine Migration (CLUSTER, 2010)

Timespan: 1.18 – 1.22
Xiang Zhang, Zhigang Huo, Jie Ma, and Dan Meng. 2010. Exploiting Data Deduplication to Accelerate Live Virtual Machine Migration. In Proceedings of the 2010 IEEE International Conference on Cluster Computing (CLUSTER '10). IEEE Computer Society, Washington, DC, USA, 88-96. (gs:19)

 

    针对当前虚拟机动态迁移的主流方法Pre-copy,本文提出了MDD(Migration with Data Deduplication)方法,将数据去重引入到迁移过程,可以降低迁移的数据量、减少迁移时间和宕机时间。该方法基于以下技术或特性:(1) self-similarity of run-time memory image; (2) hash based fingerprint; (3) Run Length Encode(RLE)。

1. (SI)本文方法针对的场景:集群环境,使用了shared storage(SAN/NFS),迁移时只需要传输VCPU context和memory image.
   主要考虑三个性能指标:total data transferred, total migration time, downtime

2. (SIII.A)先研究了在第一个迁移阶段和后两个迁移阶段,重复或相似的页面分别有多少;给出了相关的数字分析,结论当然是均有较大的重复率。
第一个阶段是不同页面进行相似性比较(80%及以上相似度的页面比例约15%~44%),后两个阶段是同一个页面的不同版本进行相似性比较(80%及以上相似度的页面比例约47%~97%)。

3. RLE编码简介
一种无损的压缩算法。假设一个图像的像素色彩值是这样排列的:红红红红红红红红红红红红蓝蓝蓝蓝蓝蓝绿绿绿绿,经过RLE压缩后就成为了:红12蓝6绿4。
(SIII.C)介绍了使用异或操作来取得两个相似页面的码,然后将这个码使用RLE进行压缩。


4. 本文提出的MDD方法与Xen的默认迁移算法相比,可以降低56.6%的数据传输量、34.93%的迁移时间、26.16%的宕机时间。

你可能感兴趣的:(migration)