相信大家对OVF都不会陌生,本文将介绍OVF文件格式的一些技术实现。

OVF全称是OpenVirtual Format,中文全称为开放虚拟化格式,是一种针对虚拟设备(或者可以允许软件运行的虚拟机)打包和发布的开放标准。这个标准被描述为一个“针对于虚拟机打包和发布的一种开源、安全、便携、高效率且可扩展的文件格式”。并且这个标准不依托任何特定的Hypervisor或处理器架构。打包和发布所使用的OVF包(英语:OVFPackage)可以用来包含一个或多个虚拟系统并且每一个都可以单独解耦成一个虚拟机。


OVF文件结构



OVF包(在这里我们为了方便,统一使用英文原意,称其为OVF包)结构如下图:

OVF-开放虚拟机格式文件_第1张图片

OVF包结构的组成部分一般包含如下组件:

  • 一个以.ovf 为扩展名的OVF描述文件;

  • 可选的以.mf为扩展名的清单文件;

  • 可选的.cert为扩展名的证书文件;

  • 可选的磁盘镜像文件;

  • 可选的附加的资源文件,例如ISO镜像。

描述文件、清单文件、证书文件应使用.ovf.mf.cert作为文件扩展名。其中,使用VMDK格式和VHDX格式的磁盘文件,后面我们看到,还有省略号,这表示OVF支持多种磁盘格式。OVF包的这些组件出了第一个以.ovf 为扩展名的OVF描述文件外,其余组件都是可选的。因此,OVF包是自由灵活的,其大致上可以组合为两种封装模式:

  1. 单一文件封装;

  2. 一组文件封装。

一个OVF包如果存储在单一文件中,则以TAR格式存储,该文件的扩展名就是.ova(开放虚拟器件或应用)。而如果以一组文件的模式提供,那么就是上述标准的OVF包结构,包含了以.ovf 为扩展名的OVF描述文件、以.mf为扩展名的清单文件以及磁盘镜像文件等组成的文件组。


单一文件封装



单一文件封装的模式下,其就表现为一个.ova为扩展名的文件。该封装模式是将所要的必要的信息都封装到一个文件里面。OVA文件采用.tar文件扩展名,包含了一个OVF 包中所有文件类型。这样OVA单一的文件格式使得它非常便携。

由于OVF包存储为单一文件,OVF描述文件中的所有文件引用应是相对路径引用的并且应指向TAR中包含的文件。压缩包中可以包含相对目录,但是相对路径的引用不应包括“..”。

一般情况下,即使在开始时就已经找到所请求的文件,TAR解压缩工具须扫描整个压缩包,因为TAR中可追加替代文件而不必修改档案的其他部分。对于OVF TAR文件,不允许在档案文件中存有副本,而且档案文件中的文件应按照以下顺序排列:

1)    OVF描述文件

2)    OVF清单文件(可选)

3)    OVF证书文件(可选)

4)    其余文件顺序应和Reference段(References定义了文件引用的规则)所列的顺序相同。需要注意的是国际化的外部字符串资源文件应位于Reference段的最前面。

5)    OVF清单文件(可选)

6)    OVF证书文件(可选)

需要注意的是证书文件是可选的。若未提供证书文件,清单文件也是可选的。若提供了清单文件或证书文件,那么他们都放置在OVF描述文件后面,或者均放置在档案文件的末端。

部署时,文件的顺序约束能确保从OVF TAR文件中抽取OVF描述文件而不必扫描整个档案文件。制作时,文件的顺序约束确保一个OVF TAR文件容易动态生成。该约束不妨碍使用标准的TAR包工具生成OVF TAR文件。


一组文件封装



一组文件存储分发的情况下,其ovf压缩包解压之后,所释放出来的就是一组文件,里面包含了标准OVF包所需要的各个文件:比如描述文件、清单文件、证书文件以及关键的磁盘镜像文件等。

举个例子来说,我下载了Citrix NetScaler VPX 11,那么在我的电脑解压之后,其释放出来的文件就如下图所示:

OVF-开放虚拟机格式文件_第2张图片

我们在导入该OVF包的时候,虚拟机或者说虚拟化层所能够识别的是.ovf文件为扩展名的描述文件。

接下来我们简要来说明OVF包结构的这些组件:


OVF描述文件



所有关于包及其内容的元数据都存储在OVF描述文件中。这是一个用于编码信息的、可扩展的XML文档,例如产品详细信息、虚拟硬件需求和许可信息。OVF描述文件是OVF包的重点核心文件。OVF描述文件在OVF文件格式中起到了举足轻重的作用,他的存在是保证了镜像文件vmdk,资源文件iso与虚拟机domain配置之间的正确对应,作用就如同vmware中的vmx格式、以及Xenkvm中的xml 配置文件。

OVF描述文件里面定义了很多细节,我们会在后面进行详细讲解。

 

清单文件



一个OVF包中的清单文件包含了OVF包中各个文件的SHA-1值(SHA (Secure Hash Algorithm,译作安全散列算法) 是美国国家安全局 (NSA) 设计,美国国家标准与技术研究院(NIST) 发布的一系列密码散列函数。正式名称为 SHA 的家族第一个成员发布于1993年。两年之后,SHA-1SHA 的后续版本诞生)。清单文件以.mf为扩展名,它与.ovf文件同名(只是后缀扩展名不同),并且和.ovf文件是同一子族的文件。若OVF提供了清单文件,OVF包的使用者会通过计算各个文件实际的SHA-1值,并和清单文件所列的值进行比较来校验它们的正确性。

清单文件的格式如下所示:

manifest_file = *( file_digest )

file_digest  = algorithm "(" file_name ")" "=" spdigest nl

algorithm    = "SHA1"

digest        = 40( hex-digit ) ; 160-bit digest in 40-digithexadecimal 

hex-digit    = "0" | "1" | "2" | "3" |"4" | "5" | "6" | "7" | "8" |"9" | "a" | "b" | "c" | "d" |"e" | "f"  

sp           = %x20

nl           = %x0A


下面是一个清单文件的部分内容的示例:

SHA1(package.ovf)= 237de026fb285b85528901da058475e56034da95

SHA1(vmdisk1.vmdk)= 393a66df214e192ffbfedb78528b5be75cc9e1c3 

也就是说,在OVF清单文件中,其存储了OVF包中各个文件的SHA-1值。

证书文件

一个OVF包的签名可以通过对其清单文件签名来实现。清单文件的SHA-1值存储在以.cert为扩展名的证书文件中,该证书文件还包括64位编码的X.509证书。.cert文件应和.ovf文件具有相同的基本文件名,并且作为.ovf文件的同族文件。一个OVF包的使用者应校验签名并验证证书文件。

当清单文件和证书文件存在时,这些文件不会出现在OVF描述文件的Reference部分(后续描述)。这是为了保证OVF描述文件不依赖该OVF包是否有清单文件或者是否被签名。在OVF包中增加清单文件或者证书文件可以在后续阶段决定。

OVF包中的其它文件可以使用文件扩展名.mf.cert,但不能占用同子族的URL或者路径名,否则会被解析为包清单文件或者证书文件。

 

磁盘镜像文件和资源



这两种文件属于同一类,在OVF中都是资源,主要就是具体的镜像资源。不同的区别是vmdk以及vhdx等文件内容主要是用户操作系统OS的内容,而iso是光驱一类的内容。

OVF不绑定任何特定的磁盘格式,只是为OVF提供一个磁盘格式的URI,以此来给出一个明确的用于解析该磁盘格式的规范。OVF格式中的磁盘是静态且唯一,以便软件读取一个OVF包时可将该URI作为关键标识来确定磁盘格式。因此OVF才会被称为通用的开发虚拟化格式被所有的虚拟化所支持。