原 文:https://people.gnome.org/~markmc/qcow-image-format.html
QCOW2镜像格式是Qemu支持的磁盘镜像格式之一。它可以使用一个文件来表示一个固定大小的块设备。与Raw镜像格式相比,QCOW2具有如下优点:
qemu-img是管理镜像文件文件最常用的命令,使用方法如下:
# 创建一个名为test.qcow2,大小为4G的qcow2镜像
$ qemu-img create -f qcow2 test.qcow2 4G
# 将QCOW2格式的test.qcow2文件转换成raw格式的test.img文件
$ qemu-img convert test.qcow2 -O raw test.img
QCOW2头
每一个QCOW2文件均以一个大端(big endian)格式的头开始,其格式如下:
typedef struct QCowHeader {
uint32_t magic;
uint32_t version;
uint64_t backing_file_offset;
uint32_t backing_file_size;
uint32_t cluster_bits;
uint64_t size; /* in bytes */
uint32_t crypt_method;
uint32_t l1_size;
uint64_t l1_table_offset;
uint64_t refcount_table_offset;
uint32_t refcount_table_clusters;
uint32_t nb_snapshots;
uint64_t snapshots_offset;
} QCowHeader;
通常一个镜像文件包含以下几部分:
二级检索
对于QCOW2镜像格式,磁盘设备的内容保存在簇中。每一个簇包含多个512字节的扇区。
为了将给定的地址定位到簇的地址,必须要遍历L1表和L2表。L1表中存储了一组到L2表的偏移值,而L2表中存储了一组到簇的偏移值。
根据cluster_bits字段,给定的地址被划分为三个单独的偏移值。假设cluster_bits的值为12,那么地址可按如下步骤划分:
注意,L1表的最小值可以通过给定的磁盘镜像大小来计算,计算方法如下:
l1_size = round_up(disk_size / (cluster_size * l2_size), cluster_size)
总而言之,为了将磁盘镜像地址映射到镜像文件偏移值,需要经历如下步骤:
如果L1或者L2表中获取的偏移值为0,则表示磁盘镜像对应的区域尚未被分配。
还需注意的是,L1和L2表中偏移值的高2位为“Copied”和“Compress”的预留比特位。具体细节见下文。
引用计数
每一个簇都会被引用计数,这样做的目的是允许这些簇在不被任何快照使用的前提下能够及时的释放。
每一个簇的引用计数为2字节,这2字节的引用计数均保存在簇大小的块中。refcount块在镜像中的偏移值可以检索refcount表得到,而引用计数表则由refcount_table_offset和refcount_table_clusters共同定位,其中refcount_table_offset指定了refcount表相对起始位置的偏移值,refcount_table_clusters指定了refcount表占用的簇数。
为了获取某个簇的引用计数,可以将簇偏移值划分为refcount表偏移值和refcount块偏移值。由于refcount块是一个两字节的存储项,簇偏移值的低cluster_size – 1位表示块偏移值,其余的位数表示表偏移值。
这里QCOW2有一个优化处理,如果任何由L1表或者L2表的指向的簇的引用计数为1,则L1或L2表项最高位被置为“copied”标记。这意味着没有快照在使用当前簇,当前簇可以直接被写入,而不需要创建引用当前簇的快照。
Copy-on-Write镜像
QCOW2镜像可以用来存储另一个磁盘镜像的修改内容,而不影响原有磁盘的内容。这种镜像被称之为拷贝镜像,以用户的角度看起来像是一个独立的镜像文件,但是其中的大部分数据是从原始镜像中获取到的。只有原始镜像的簇发生改变的内容才会被存储到拷贝镜像中。
这种表示方式很容易实现。可以通过在Copy-on-write镜像中包含原始磁盘镜像中的路径,头文件中记录原文件的路径字符串。
当读取Copy-on-write镜像中的簇时,首先检查该区域是否存在Copy-on-write镜像文件内。如果不存在,则从原始磁盘镜像中读取对应的位置。
快照
快照同COW文件概念比较相似,区别在于原文件是可写的,而快照不可写。
近一步解释—一个COW镜像也可被称为“快照”,因为COW确实表示了原始镜像文件的状态。我们可以通过创建多个COW镜像来实现对原始镜像的“快照”,每一个镜像指向原始镜像。值得注意的是,原始镜像必须保持只读,而COW快照为可写。
快照—“真实快照”—存在于原始镜像文件中。每个快照都是原始镜像在过去的某个时刻的只读记录。原始镜像文件一直保持可写的状态,当原始文件发生改变时,写时复制出来的簇可以被不同的快照引用。
每个快照对应如下头:
typedef struct QCowSnapshotHeader {
/* header is 8 byte aligned */
uint64_t l1_table_offset;
uint32_t l1_size;
uint16_t id_str_size;
uint16_t name_size;
uint32_t date_sec;
uint32_t date_nsec;
uint64_t vm_clock_nsec;
uint32_t vm_state_size;
uint32_t extra_data_size; /* for extension */
/* extra data follows */
/* id_str follows */
/* name follows */
} QCowSnapshotHeader;
各字段解释如下:
每创建一个快照就会增加一个头文件,复制L1表的内容,并增加所有L2表中的引用计数和被L1表引用的数据簇。之后,如果镜像中的任何L2表或者数据簇被修改了—也就是说,簇的引用计数值超过1,并且/或者当前簇的“拷贝”标志已被标记—Qemu会先拷贝这些L2表和数据簇,而后再进行写入。这样所有的快照都不会被修改。
压缩
QCOW2镜像格式支持压缩特性,允许每一个簇可以独立通过zlib进行压缩。
可以通过如下步骤从L2表中获取簇偏移值:
加密
QCOW2镜像格式同样支持簇的加密特性。
若QCowHeader头中的crypt_method字段值为1,则会采用16字符128比特的AES秘钥进行加密。
簇中的每一个扇区都是通过AES密码块链接模式单独进行加密,采用小端模式的扇区偏移地址(相对于设备的起始位置)来作为128位初始化向量的头64位。
QCOW2镜像与上一代镜像
QCOW2相对于QCOW有如下不同之处: