技术机制是指在IT行业内确立的具有明确定义的IT构件,它通常区别于具体的计算模型或平台。云计算具有以技术为中心的特点,这就需要建立一套正式机制作为探索云技术架构的基础。云基础设施机制是云环境的基础构建块,它是形成基本云技术架构基础的主要构件。
本文涉及的云基础设施机制如下:
逻辑网络边界
虚拟服务器
云存储设备
云使用监控
资源复制
已就绪环境
目录
0.前言
第7章 云基础设施机制
7.1逻辑网络边界
7.2虚拟服务器
7.3云存储设备
7.3.1云存储等级
7.3.2网络存储接口
7.3.3对象存储接口
7.3.4数据库存储接口
7.4云使用监控
7.4.1监控代理
7.4.2资源代理
7.4.3轮询代理
7.5资源复制
7.6已就绪环境
逻辑网络边界(logical network perimeter)定义:将一个网络环境与通信网络的其他部分隔离开来,形成一个虚拟网络边界,包含并隔离了一组关于云的IT资源,这些资源可能是分布式的。
该机制可被用于:将云中的IT资源与非授权用户隔离;
将云中的IT资源与非用户隔离;
将云中的IT资源与云用户隔离;
控制被隔离IT资源的可用带宽。
通常由提供和控制数据中心连接的网络设备来建立,一般是作为虚拟化IT环境进行部署的。其中包括虚拟防火墙virtual firewall(一种IT资源,可以主动过滤被隔离网络的网络流量,并控制其与Internet的交互)、虚拟网络virtual network(一般通过VLAN形成,这种IT资源用来隔离数据中心基础设施内的网络环境);
下图显示了两个逻辑网络边界,一个包含了云用户的企业内部环境,另一个包含了属于云提供者的基于云的环境,这两个边界通过一个相连。由于通常的实现方法是在通信端点之间发送点对点的加密数据包,因此这样可以保护通信。
虚拟防火墙和隔离的虚拟网络共同形成了云用户的逻辑网络边界。
虚拟服务器(virtual server)是一种模拟物理服务器的虚拟化软件。通过向云用户提供独立的虚拟服务器实例,云提供者使多个云用户共享同一个物理服务器。
如上图所示:2个物理服务器控制3个虚拟服务器。
作为一个有价值的机制,虚拟服务器是最基本的云环境构建块。每个虚拟服务器都可以存储大量的IT资源、基于云的解决方案和各种其他的云计算机制。从映像文件进行虚拟服务器的实例化是一个可以快速且按需完成资源分配过程。
如上图所示:云服务用户B正在访问虚拟服务器的云服务,与此同时,云服务用户A为了执行一个管理任务,直接访问了该虚拟服务器。
图7-7显示了运行在物理服务器上的几个虚拟服务器,它们都由中心VIM进行控制。
云存储设备(cloud storage device)机制是指专门为基于云配置所设计的存储设备。
如同物理服务器如何大量产生虚拟服务器映像一样,这些设备的实例可以被虚拟化。在支持按使用计费的机制时,云存储设备通常可以提供固定增幅的容量分配。此外,通过云存储服务,还可以远程访问云存储设备。
(1)一个与云存储相关的主要问题是数据的安全性、完整性和保密性,当数据被委托给外部云提供者和其他第三方时,就更容易出现危害;
(2)此外,数据出现跨地域或国界的迁移时,也会导致法律和监管问题;
(3)另一个问题关于大型数据库性能方面,即LAN提供的本地数据存储在网络可靠性和延迟水平上均优于WAN。
云存储设备机制提供常见的数据存储逻辑单元,例如:
文件(file):数据集合分组存放在文件夹中的文件里。
块(block):存储的最低等级,最接近硬件。是可被独立访问数据的最小单位。
数据集(dataset ): 基于表格的、以分隔符分割的或以记录形式组织的数据集合。
对象(object):将数据及相关的元数据组织为基于Web的资源。
文件存储和块存储通常通过网络存储接口来访问,传统的网络存储大多受到网络存储接口类别的影响,它包括了符合工业标准协议的存储设备,比如用于存储快和服务器消息块(SMB)的SCSI,用于文件与网络存储的通用Internet文件系统(CIFS)和网络文件系统(NFS).
文件存储需要将独立的数据存入不同的文件,这些文件的大小和格式可以不同,并且可以形成文件夹和子文件夹。当数据发生变化时,原来的文件通常要被生成的新文件所替换。
当一种云存储设备机制是基于这种接口时,数据搜索和抽取性能很可能不是最优的。通常,文件分配的存储水平和阈值都是由文件系统本身决定的。
块存储要求数据具有固定格式(称为数据块(data block)),这种格式最接近硬件,摒弃是存储和访问的最小单位。
不论是使用逻辑单元号(LUN)还是虚拟卷,块存储与文件级存储相比,块级存储通常都具有更好的性能。
对象存储:各种类型的数据可以作为Web资源被引用和存储,它可以支持多种数据和媒体类型的技术为基础。实现这种接口的云存储设备机制通常可以通过以HTTP为主要协议的REST或基于Web服务的云服务来访问。
根据存储结构,这种存储接口分为两种主要类型:
(1)关系数据存储:依靠表格,将相似的数据组织为行列的形式,表格之间的关系可以增加数据的结构,保护数据的完整性,避免数据冗余(这里指数据规范化)。
基于云的关系数据库的主要挑战来自于扩展和性能。垂直扩展比水平扩展更加复杂,其投入使用效率也更低。被云服务远程访问时,复杂关系数据库和含有大量数据的数据库可能会出现更高的处理开销和延迟。
(2)非关系数据存储(NoSQL):采用“更加松散的的”结构来存储数据,避免关系数据库带来的可能的复杂性和处理成本,与关系存储相比,可以进行更多的水平扩展。
由于有限的或原始的模式或数据模型,非关系存储需要权衡失去多少原始形式和验证。此外,非关系存储倾向于不支持关系数据库的功能,如事务或连接。
将规范化数据导出到非关系存储库后,数据大小一般会增加。非关系数据存储机制是专有的,严重限制了数据的可移植性。
云使用监控机制是一种轻量级的自治软件程序,用于收集和处理IT资源的使用数据。
监控代理(monitoring agent)是一个中间的事件驱动程序,它作为服务代理驻留在已有通信路径上,对数据流进行透明的监控和分析【图7-12】。通常被用来计量网络流量和消息指标。
资源代理(resource agent)是一种处理模块,通过与专门的资源软件进行事件驱动的交互来收集使用数据【图7-13】。它在资源软件级上,监控预定义的且可观测事件的使用指标,比如启动、暂停、恢复和垂直扩展。
轮询代理(polling agent)是一种处理模块,通过轮询IT资源来收集云服务使用数据。它通常被用于周期性地监控IT资源状态,比如正常运行时间与停机时间。【图7-14】
复制被定义为对同一个IT资源创建多个实例,通常在需要加强IT资源的可用性和性能时执行。使用虚拟化技术来实现资源复制(resource replication)机制可以复制基于云的IT资源,对同一个IT资源创建多个实例。
已就绪环境机制是PaaS云交付模型定义的组件,它代表的是预定义的基于云的平台。该平台由一组已安装的IT资源(如数据库,中间件,开发工具)组成,可以被云用户使用和定制。云用户使用这些环境在云内远程开发和配置自身的服务与应用程序。典型的已就绪环境包括预先安装的IT资源,如数据库、中间件,开发工具和管理工具。
已就绪环境通常配备一套完整的软件开发工具包(SDK),它向云用户提供包括首选编程栈在内的对开发技术的编程访问。中间件用于多租户平台,支持开发和部署Web应用程序。