本文用于收集和整理云计算设计的概念。
现在的云计算有些过热(“人人都在谈论它,但没有人真正知道它”),很多研究都挂上了这个名词来显示其时髦。从某种意义上讲:云计算is nothing new,只是概念的创造。重新整理了网络资源,特别适合与运营商(包括亚马逊)来整理他们的产品和服务。云计算提供了很好的梳理,梳理了信息内容提供和信息获取途径 。而云这个概念sell得好,也是由于需求推动,技术进步以及商业模式发展给的契机,它是技术、也是服务,也是商业模式。
云计算将IT设施成为向水、电一样的公共基础设置,转变IT服务的商务模式,降低客户(用户、消费者、开发者)使用IT服务的门槛(资金、技术、时间、人力等等),并由此激发更为广大的市场空间。信息化成为社会、个人基本属性。运营商和政府喜好云计算可能因为如此。
Apple宣布的iCloud无疑让云计算成为智能的云。移动设备作为云的“端”,为云提供了智能的端,双方互相促进。微软的文档提出:未来的互联网世界将会是“云+端”的组合 ,在这个以“云”为中心的世界里,用户可以便捷地使用各种终端设备访问云中的数据和应用,这些设备可以是电脑和手机,甚至是电视等大家熟悉的各种电子产品,同时用户在使用各种设备访问云中的服务时,得到的是完全相同的无缝体验。 而智能的“云技术能更智能地了解用户的特性,它必须收集新数据、感应新信息、表现真实世界,并不断变得越来越聪明、越来越完美,这样它才能更好地帮助用户学习。云技术必将进一步强化人与人之间的关联,并让不同的社交网络以更紧密的形式联结在一起,让我们以希望的方式生活,以希望的方式与人交流。”但是Google的模式可能是纯云,还没看到和它的Android有什么关联。既有纯云也有“云”+“端”。
定义
wiki中给出NIST对云计算的定义:Cloud computing is a model for enabling convenient, on-demand network access to a shared pool of configurable computing resources (eg, networks, servers, storage, applications, and services) that can be rapidly provisioned and released with minimal management effort or service provider interaction. 云计算是一个便捷的,按需网络访问共享可配计算资源池(例如网络,服务器,存储,应用和服务)的模型,通过很小的管理或者与业务提供商互动就可快速提供和释放。云计算是一种将池化的集群计算能力通过互联网向内外用户提供弹性、按需服务的新业务,新技术。(这个翻译好多了)
百度知道 中的定义:狭义云计算指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关,也可是其他服务。云计算(Cloud Computing)是网格计算(Grid Computing )、分布式计算(DistributedComputing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。
在技术方面,包括虚拟化技术,集群监控和调度,海量存储,分布并行计算的方式,互联网快递技术,WEB技术,集约化数据中心部署技术的成熟。google等公司基于互联网IT服务的成功,以及有移动互联网引领的互联网应用平台能力的开放,培育了新的互联网应用开发生态链。
分层和架构
抽象地,资源从本地计算机扩展到网络,实际上我们可以找到对等的扩展概念。wiki中给出的层次图如左图所示,当时一般云计算只关心中间的三层,它们分别对应Saas,PaaS和IaaS。
Server
是云计算提供的载体服务器,包括计算机硬件和/或软件,可提供云服务。是具体的物理资源。例如数据中心。这也组成了云计算定义中的统一资源池。
IaaS:Infrastructure-as-a-Service 基础设施即服务
基础设施即服务,对应于我们计算机的资源,包括存储,CPU,网络带宽。IaaS指企业或个人可以使用云计算技术来远程访问计算资源,这包括计算、存储以及应用虚拟化技术所提供的相关功能。无论是最终用户、SaaS 提供商还是 PaaS 提供商都可以从基础设施服务中获得应用所需的计算能力,但却无需对支持这一计算能力的基础IT软硬件付出相应的原始投资成本。
网络存储,虚拟系统是其中的典型。例如:Amazon的EC2/S3,微软的SkyDrive,IBM的blue cloud。
其典型技术是虚拟化平台环境(VMware,Xen,Virtual Box, PowerVM, Amazon AMI等)。不用购买服务器、软件、数据中心空间或者网络设备,客户端,而是将这些资源作为一个整体的外包服务。虚拟化将底层物理设备与上层操作系统,软件分离的一种去耦合技术,将逻辑硬件、操作系统和映用程序一同装入一个可迁移的虚拟机档案文件中,原本不相关的各类资源通过虚拟华和管理软件变成池化的,可统一管理的资源。通过虚拟化技术来提高资源的利用率,降低管理和能源成本,虚拟化技术提供:
对于具有IDC机房的运营商,IaaS是一个很好的概念和管理的基础。客户托管的将不再是机器而是服务,资源由运营商管理,而服务由服务提供方管理,实现硬件与应用的解耦。另外,为了摩尔定律,计算机的更新换代很快,但是旧款的技术机不需要淘汰,仍可以充分利用其资源。
要注意IaaS和VPS(虚拟专用服务)的区别,VPS是单机上多个虚拟机,不涉及多机和云的概念。
PaaS:Platform-as-a-Service 平台即服务
平台即服务。对应本地设备,例如手机,就是Android SDK,是系统平台。对于运营商,提供基于web/WAP的平台,开发运营商的网络服务器API。提供计算平台和/或解决方案堆栈作为服务,往往耗费云基础设施资源并维护云应用。用于部署复杂的应用,但无需购买和管理相关的硬件和软件。提供SOA服务集成平台,云计算中间件。
典型提供有Google的App Engine,Salesforce.com的force.com,IBM的blue cloud。
PaaS是指将一个完整的计算机平台,包括应用设计、应用开发、应用测试和应用托管,都作为一种服务提供给客户。在这种服务模式中,客户不需要购买硬件和软件,只需要利用 PaaS 平台,就能够创建、测试和部署应用和服务,与基于数据中心的平台进行软件开发相比,费用要低得多,这是 PaaS 的最大价值所在。
对于电信运营商,可以在此开发其网络API,例如telephony的能力(短信,定位),一些身份认证,用户分类等用户信息服务类(数据挖掘),这是运营商提供其网络功能,向开发商推动其业务的一个重要方面。
对于互联网厂商,提供互联网开放能力,例如搜索、地图、SNS。
要注意PasS的并行计算和网格计算(Grid Computing)的区别,网格计算是科学界向多个组织或者个人借用资源进行复杂科学计算的一个方式,对象不同,非商业,多个机构,使用同一的国际标准OGSA/WSRF。
SaaS:Software-as-a-Service 软件即服务
软件即服务。在PaaS上面,也即我们在系统平台上面开发的应用或者服务,在SOA(Service-Oriented Architechture,面向服务架构)下开发。软件作为一个在互联网上的服务,无需安装以及在客户计算机上运行,简化维护(例如无需下载补丁和升级)
SaaS是指用户获取软件服务的一种新形式。它不需要用户将软件产品安装在自己的电脑或服务器上,而是按某种服务水平协议(SLA)直接通过网络向专门的提供商获取自己所需要的、带有相应软件功能的服务。本质上而言,软件即服务就是软件服务提供商为满足用户某种特定需求而提供其消费的软件的计算能力。
当前,SaaS 有各种典型的应用,如在线邮件服务、网络会议、网络传真、在线杀毒等各种工具型服务,ERP,CRM,OA,行业应用等等,例如在线HR、在线进销存、在线项目管理等各种管理型服务。
Client
是最终用户获取云计算的客户端,包括计算机的硬件和软件。例如PC,手机,OS和浏览器。
例子
在了解上面的概念后,我们可以很容易解读云计算架构,下图是微软云计算架构,云的大框架都是大同小异。
云的分类
常听人说“一朵云”和“多朵云”,实际上单点和多点结构,但是在wiki上并没有这样的分类或者部署。相反地给出了与路由拓扑相类似的机构。一般的划分有公有云、私有云和混合云,在wiki中还增加了社区云和结合云。
公有云:Public Cloud
由提供方运营,为客户提供部署和应用服务。
公有云,是指为外部客户提供服务的云,它所有的服务是供别人使用,而不是自己用。目前,典型的公有云有亚马逊的AWS、Salesforce.com。
对于使用者而言,公有云的最大优点是,其所应用的程序、服务及相关数据都存放在公有云的提供者处,自己无需做相应的投资和建设。目前最大的问题是,由于数据不存储在自己的数据中心,其安全性存在一定风险。同时,公有云的可用性不受使用者控制,这方面也存在一定的不确定性。
私有云:Private Cloud
部署在客户的数据中心内部,基于客户个性化的性能和成本要求、面向服务的内部应用环境。
私有云的部署比较适合于有众多分支机构的大型企业或政府部门。随着这些大型企业数据中心的集中化,私有云将会成为他们部署IT系统的主流模式。
相对于公有云,私有云部署在企业自身内部,因此其数据安全性、系统可用性都可由自己控制。但其缺点是投资较大,尤其是一次性的建设投资较大。
社区云:Community Cloud
社区云有几个组织共同建立的,共享基础设施,其规模比公共云要小。
混合云:Hybrid Cloud
有些IT服务适合从云中获取,如 CRM、网络会议、电子邮件等;但有些系统不适合部署在云中,如自己的核心业务系统、财务系统等。采用“软件+服务”模式,即企业既会从云中获取必需的服务,也会自己部署相关的IT系统。也可以采用“私有云”+“公共云”的混合云模式。
结合云:Combined Cloud.
私有云和公共云合并在一起的,称为结合云(可能也翻译为联合云)。
一些术语和概念
逻辑网络边界(logical network perimeter)通常是由提供和控制数据中心连接的网络设备建立,例如虚拟防火墙,虚拟网络(VLAN、VPN)
虚拟服务器(VM),虚拟基础设施管理器(VIM,虚拟基础设施管理器,用于协调与VM实例创建相关的物理服务器)
云存贮设备:cloud storage device。设备的实例可以被虚拟化。单位为
1、文件;
2、块(NFS、CIFS-Common Internet File System);
3、数据集dataset(例如SQL)
4、对象:各种类型的数据都可以作为web资源被引用和存储,例如利用HTTP的CRUD(create、retrieve、update、delete)操作(如CDMI,Cloud Data Management Interface)
云使用监控用于收集和处理IT资源的使用数据。包括有
1、监控代理(作为服务代理位于通信路径上,对数据流进行透明的监控和分析);
2、资源代理(事件驱动,例如观测启动、暂停、恢复、垂直扩展等事件);
3、轮询代理(polling agent,常被用于周期性地监控IT资源状态,例如正常运行时间和停机时间)
资源复制(resource replication)对同一个IT资源创建多个实例。
已就绪环境机制是PaaS云交付模型的定义组件,基于云平台,已有一组安装好的IT资源,可以被云用户使用和定制。云用户使用这些,远程开发和配置自身的服务和应用程序。例如数据库,中间件,开发工具和管理工具,例如进行开发和部署Web应用程序。
特殊云机制
自动伸缩监听器(automated scaling listener)是代理服务,监听和追踪用户和云服务之间的通信或IT资源的使用情况,通常靠近FW。实际就是监听,如果发现超过阈值(大或者小,例如CPU>70%,用户请求每秒大于10个,并持续10分钟),通知云用户(VIM平台),云用户(VIM平台)可以进行调整。注意,这只是监听器,监听在动伸缩的需求,不是处理自动伸缩。如果扩展需求在同一物理服务器上无法实现,则需要VIM执行虚拟机在线迁移,迁移到满足条件的另一台物理服务器上。
负载均衡器(load balancer),有下面几种方式,都是分布式,而不是主备的方式,因为这是讲balance。可以通过交换机,专门的硬件/软件设备,以及服务代理
1、非对称分配(asymmetric distribution):较大的工作复杂被送到具有较强处理能的IT资源。
2、负载优先级(workload prioritization):复杂根据其优先级别进行调度、排队、丢弃和分配。
3、上下文感知的分配(content-aware distribution):根据请求内容分配到不同的IT资源。
SLA监控器(SLA monitor),例如轮询检测是否在线,检测QoS是否达到SLA的要求。
按使用付费监控器(pay-per-use monitor),按预定的定价参数测量IT资源的使用情况,提供给计费系统。典型的有:请求/响应消息数量,传送的数据量,带宽消耗量。
审计监控器用来收集网络和IT资源的审计记录数据,用以满足管理需要或者合同义务。例如位于认证服务器之前的审计监控器可以截获用户的登录请求,在日志数据库中存贮请求者的安全证书,以及成功和失败的尝试,供以后的审计报告用。
故障转移系统(failover system)通过集群技术提供冗余实现IT资源的可靠性和可用性。有两种基本配置:
1、主动-主动:本例是负荷均衡的,失效的实例从负荷均衡调度器中删除(或置为失效)
2、主动-被动:有活跃实例和待机实例(无负荷,可最小配置),如果如果检测到活跃实例失效是,将被重定向到待机实例,该待机实例就成为了活跃实例。原来的活跃实例如果恢复或者重新建立,可成为新的待机实例。这是冗余机制。
Wei:现在有技术进行在线备份或者迁移的,能够对有上下文要求的,有状态机要求的进行复制,也就是说可以无缝接管,这种属于主导-被动方式。而负载均衡只是对新请求进行保护,对于正在处理的请求(或者请求组)是会丢失的。采用哪种方式,具体业务特性决定。
虚拟机监控器(hypervisor)用来在物理机器上生成虚拟服务器实例,通常限于一台物理服务器内,提供对硬件资源使用的控制、共享和调度。VIM提供了一组特性来管理跨物理服务器的多hypervisor,看进行数据中心的硬件资源调度,例如分配合适hypervision,进行在线迁移到空闲的物理机等。
资源集群(resource cluster)将多个IT资源实例合并成组,使之能像一个IT资源那样进行操作。也就是N in 1。在实例间就工作符合分别,任务调度,数据共享和系统同步等进行通信。集群管理平台作为分布式中间件运行在所有的集群节点上。类型包括:
1、服务器集群:运行在不同物理服务器上的虚拟机监控器可以被配置为共享虚拟服务器执行状态(例如内存页和处理器寄存器状态),以此建立起集群化的虚拟服务器,通常需物理服务器共享存储,这样虚拟服务器可以从一个物理服务器在线迁移到另一个。
2、数据库集群:具有同步的特性,集群中使用的各个存储设备上存储数据一致性,提供冗余能力。
3、大数据集集群(large dataset cluster):实现数据的分区和分布,目标数据集可以有效地话费区域,而不需要破空数据的完整性或计算的准确性。每个节点都可以处理总做负载,而不需要向其他类型那样,与其他节点进行很多的通信。
方式分为两类:1、符合均衡的集群;2、HA集群。
多设备代理帮助运行时数据转换,使得云服务被更广泛的用户程序和设备所用,就是多几个接口,格式适配(例如页面适配)这类,例如XML网络,云存储网格、移动设备网关。
状态管理数据库是一种存储设备,是把状态数据缓存在内存的一种替代方法。软件可以将状态数据放入DB中,用以降低程序占用运行时的内存量。
云管理机制
远程管理系统是必不可少的,通过远程管理系统可以访问资源管理系统、SLA管理系统以及计费管理系统。远程管理系统的有两个入口:使用与管理入口,自服务入口。这个系统也包括API,云用户可以通过这些标准API来构建自己的控制台,云用户可能使用多个云提供者的服务,也可能更换提供者。
资源管理系统帮助协调IT资源,其核心是VIM。
SLA管理系统对相关数据的管理、收集、存贮、报告以及运行时通知,通常会有一个服务资料测量库。
计费管理系统根据计费实践和定价模型出具清单。
云安全机制
加密:对明文(plaintext)进行加密(encryption),通过加密部件(cipher)的标准化算法将明文转换为密文(ciphertext),而密钥(encryption key)扮演关键角色。
一、对称加密(symmetric encryption),例如RC4、Triple-DES,AES。
二、非对称加密(asymmetric encryption)。https就是用SSL/TLS作为http的底层加密协议。
哈希:单向的不可逆的数据保护机制,常用于密码。通过哈希可以获得消息摘要(message digest)
数字签名(digital signature)进行数据真实性和完整性的验证,涉及hash和非对称加密,将一个由私钥加密的消息摘要附加到原始消息中,接收者用公钥来解密这个数字签名,得到消息摘要,然后对比原始消息hash得到的message digest,一致则证明消息的真实性和完整性。
公钥管理设施(PKI,public key infrastructure)是管理非对称加密密钥办法,也就是通过数字证书将公钥告知对方。PKI依赖于数字证书(带数字签名的数据结构,与公钥一起验证证书持有者身份),常由第三方证书颁发机构(CA,Certificate Authority)签发。
身份与访问管理(Identity and Access Manager,IAM)机制具有认证、授权、用户管理、证书管理。IAM中有些目标和PKI相似,但还包括访问控制,策略等内容。
单一登录(Single Sign-On)机制使得一个云服务能被一安全代理认证,这个安全代理建立一个安全的上下文,当该云用户访问其他云服务或资源时,这个上下文会被持久化。类似于统一认证,即跨多个云服务为用户进行AAA,无需在用户的使用过程中,进行多次的认证授权的密码请求。例如安全代理通过安全令牌的方式,在分布式的云服务A、云服务B、云服务C中自动认证该用户。又例如安全代理收到安全证书后传播给不同云中的已就绪环境。
基于云的安全组(cloud-based security group)通过基于云资源的分隔减少或避免不同用户的信任边界重叠,当一个云安全组受到攻击时不会波及到另一个云安全组。例如公开组/私有组,开发组/生产组,在VIM分配云资源时,根据SLA,在相应的云安全组的物理机器上进行资源分配。
强化的(hardening)虚拟服务器映像:强化是将不必要的软件从系统中玻璃出来,限制可能被攻击者利用的潜在漏洞,包括关闭不必要的服务器端口,关闭不必要的服务,关闭不需要的内部根账号,关闭对系统目录的的宾客方位,卸载冗余软件,建立内存限额等。
云架构包括审计监控器、云使用监控器、虚拟机监控器、逻辑网络便捷、按是用那个付费监控器、远程管理系统、资源集群、资源复制。
负载分布架构(workload distribution architecture)依赖于负载均衡器。
资源池架构(resource pooling architecture)以使用一个或者多个资源池为基础,其中相同的IT资源有一个系统进行分组和维护,以自动个确保他们保持同步。例如物理服务器池、虚拟服务器池、存储池、网络池、CPU池、内存池,这是将每种类型的IT资源创建专有池,烨可以将他们集合为更大的池,池里面有子资源池,子资源池可以和大资源池有着相同类型的IT资源,也可以选取某部分IT资源。定义资源池后,可以在每个池中创建实例。
动态可扩展架构(Dynamic Scalability Architecture),触发某些条件或导致资源次动态分配IT资源,或回收不必要的资源。
动态水平扩展:达到阈值时进行资源复制,创建更多的实例。
动态垂直扩展:向上或向下扩展资源实例,例如增加CPU。
动态重定位:将IT资源重新放置在更大容量大主机上。
弹性资源容器架构(Elastic Resource Capacity Architecture)与虚拟服务器的动态供给相关,分配或回收CPU、RAM等资源。和上面的动态垂直扩展差不多,不过前面的是基于某虚拟服务器上,而这个是基于资源池,本质上没什么不同。
服务负载均衡架构是针对云服务的工作负载分布架构。实际就是利用负载分布式架构实现动态水平扩展。
云爆发架构(cloud bursting architecture)当达到阈值是,从企业内部的IT资源扩展(“爆发”)到云中,其基础是自动扩展监听器和资源复制机制(维护内部和韵IT资源之间的状态信息同步)。所谓扩展到云中,也是利用负载均衡的方式,将部分服务请求转移到云。
弹性磁盘供给架构(Elastic Disk Provisioning Architecture)按云用户实际所需进行存储分配和计费。
冗余存储架构通过复制,辅云存储设备与主运存储设备保持数据同步,当主设备故障时,存储设备网关(连接到云存储设备的外部接口)将请求转向辅设备。冗余可以是异地的。
虚拟机监控器集群架构:如果hypervisor失效,则其管理虚机会受到波及。通过心跳消息来进行监控。虚拟机监控器集团架构建立一个跨多个物理服务器的高可用虚拟机监控器集群。虚拟机控制器集群由中心VIM控制,VIM向hypervision发送心跳消息来确认是否正常,如果没有应答,将启动VM在线迁移。使用共享云存储设备实现虚机的在线迁移。
负载均衡的虚拟服务器实例架构:物理服务器之间的负载均衡比较困难,通过容量看门狗(capacity watchdog system),在把处理任务分配到可用的物理服务器主机之前,会动态计算虚拟服务器实例及其相关的工作负载,包括容量看门狗云使用监控器、VM在线迁移程序,以及容量计划器(动态计算和比较物理服务器的能力和虚机的容量要求,进行如何负载均衡的决策)。
不中断服务重定位架构(non-disruptive service relocation architecture)触发云服务实现的运行时复制或迁移,避免中断。通过增加一个复制,暂时转移到另一个承载环境上,而不是利用冗余来实现伸缩。常见的方式是在线迁移。
零宕机架构(zero downtime architecture)是一个非常复杂的故障系统,在虚机所在的物理服务器主机失效时(都失效了,不知道怎么转移,果然非常复杂,所有虚机都存储在共享的介质),允许它们动态地迁移到其他物理服务器主机上。
云负载均衡架构,IT资源可以在多个云之间进行负载均衡。建立在自动伸缩监听器和故障转移系统结合的基础上。
资源预留架构,为给定的云用户预留资源(单个IT资源,一个IT资源的一部分,多个IT资源)。用于处理资源池下属的兄弟资源池之间的资源借用,保证基本资源以及有效资源归还。
动态故障检测与恢复架构(dynamic failure detection and recovery architecture)。通过一个弹性的看门狗系统,通过智能看门狗监控器(一个特殊的云使用监控器),监控预先定义的故障场景、选定事件、进行响应,对于不能解决的,发出通知(报告),进行升级处理。
裸机(bare-metal)供给架构(provision architecture)。大多数的物理服务器在ROM提供了远程安装管理的支持,有些已经集成到芯片中。IaaS平台的IP地址(默认或者DHCP)告知云用户,云用户可以通过远程安装管理来自主完成操作系统的安装。为了减少人为差错,在裸机管理系统提供了发现代理、部署代理(通过远程安装管理将部署代理安装到物理机器的RAM中)、发现区、管理加载器、部署组件,就可以自动部署。
快速供给架构,将大范围的IT资源供给进行自动化。其依赖一个自动供给程序、快速供给引擎,以及按需供给的脚本和模板。
存储负载管理架构(Storage workload management architecture)使得LUN可以均匀分布在看用的云存储设备上,而存储容量系统用来确保运行时工作负载均匀分布在LUN上。通过监控器,查看是否出现超出阈值的情况,如果是,监控器通知存贮容量系统进行LUN迁移。
直接I/O访问架构。虚拟机通过虚拟机监控器老方位物理服务器上的物理I/O,称为I/O虚拟化,而直接I/O访问则允许虚拟服务器绕开hypervision直接访问物理服务器的I/O卡(例如SAN上的LUN),不需要hypervision进行仿真连接。这需要在虚机上安装相应的驱动来支持。
直接LUN访问架构。LUN通常通过主机总线适配器(HBA)映射到hypervision中,但有时虚机需要直接访问基于块的RAW存储设备,例如一个集群中,多台机器共享一个LUN。直接LUN访问架构通过物理HBA卡向虚机提供LUN访问(就是hypervision将LUN直接映射到虚机上),多个虚机可以将LUN作为集群数据库的共享卷来使用。
动态数据规范化架构。用于解决过度冗余的问题,建立一个重复删除系统,通过侦测和消除云存储设备上的冗余数据来方式云用户无意思地保留冗余的数据副本。通常基于块,也可以基于文件。当收到一个数据块时进行比对,如果发现冗余,冗余块由已有的相同块指针来替代。
弹性网络容量架构。动态分配额外的网络带宽,避免出现瓶颈。
跨存储设备垂直分层架构。通过LUN迁移将LUN从某台云存储设备至具有更高I/O性能,如更高数据处理能力,更高带宽的云存储设备上,实现容量不同的存储设备之间的垂直扩展。
存储设备内部垂直数据分层架构。在同一台物理存储设备中,将存储根据性能不同进行分类,监控使用情况,如果超过或者低于某个阈值,则将LUN向上或向下迁移。
负载均衡的虚拟交换机架构。书中提供的示意图有些令人不解,如果我们将之理解为利用linux机器作为路由器连接接收用户信息的网络设备和虚拟交换机之间的设备,可以考虑到网卡的处理能力成为瓶颈,另一方面,一台物理机器可创建多台虚机,相当于有一个虚拟交换机连接多台虚机,其上行就是该物理机的物理网卡。此外,上下行链路可能是不对称的,提供多条上行链路来进行平衡和冗余。但是字面意义上,大致能够理解。
多路径资源访问架构。避免链路失效而无法访问,提供可替代的物理或者虚拟超链接。多路径系统驻留在服务器或者hypervision中。
持续虚拟网络配置架构。当虚机从某个主机迁移到另一个主机时,需要保障其网络配置一致,可通过将网络设置信息保持在某机器上(如集中式交换机)被各主机共享。
虚拟服务器的冗余物理连接架构。一台物理机器可创建多台虚机,相当于有一个虚拟交换机连接多台虚机,其上行就是该物理机的物理网卡,一旦该物理链路或者物理网卡失效,则所有虚机都失效。因此通过多个物理网卡,提供多条上行链路来实现冗余架构,确保网络连接正常。
存储维护窗口架构。由于维护和管理等需要,云存储设备有时需要暂时性得关闭。利用实时存储迁移的技术,将数据暂时迁移到辅助的云存储设备上,并自动且透明地将云服务用户重定向到辅云设备上,用户不会感知主存储停机下线。等主云设备重现上线时在迁移回来。
IaaS从云提供者的角度:虚拟机和云存储是最基本的两类IT资源,相关资源定义有操作系统,主存容量,处理能力,虚拟化的存储容量。利用snapshot(快照)来记录当前的状态、内测和对虚拟化IaaS还记得额配置,用于备份和复制,支持水平和垂直扩容。云提供者可以从分布于不同地理位置的数据中心来提供基于IaaS的IT资源。利用之前学习的架构提供可扩展性和可靠性。IaaS平台通常监控虚拟机生命周期,数据存储,网络流量,失效情况,事件触发器。IaaS提供云安全机制。
从云用户的角度看,用户通过远程终端应用(远程桌面,SSH客户端),看在操作系统层面上访问虚拟服务器。云存储设备可以直接附加到虚拟服务器上,通过虚机进行访问,或者以NFS,SAND(Storage Area Network Divice),基于web的资源(例如Amazon S3)的方式。云用户对IT资源具有相当的控制权,通过使用与管理接口或者使用命令行接口(CLI)进行管理。
PaaS。从云提供者的角度看,需要配备一组选择出来的应用开发和部署平台,已容纳不同的编程模型、语言和框架。平台带有相应的SDK和IDE。监控已就绪环境实例、数据持久化、网络使用、失效情况、时间触发器。其安全由底层的IaaS保障,一般不引入新的云安全机制。
从云用户的角度看,一个典型的PaaS IDE可以提供范围广泛的工具的编程资源(软件库、类库、框架、API,运行能力,模拟基于云的部署环境),允许开发者在云中或本地创建、测试和运行代码。编译后打包上载云中,通过已就绪环境部署。PaaS还运行应用将云存贮作为数据存储系统来使用,例如作为SQL。PaaS的管理控制权少于IaaS。
SaaS。从云提供者的角度看,SaaS通常基于多租户环境,依赖本地动态可扩展和工作负载分布架构提供的特性,并依赖不终端服务重置来保障故障转移不影响可用性。SaaS的功能和使用多样性,协同创作和信息共享(Wikipedia,Blogger),协同管理(Zimbra,Google Apps),即使消息,音频/视频通信的会议服务(Skype,Google Talk),企业管理系统(ERP,CRM,CM),文件共享和内容分布(YouTube,Dropbox),企业相关的软件,消息系统(电子邮件,语音邮箱)、移动应用商城,办公生产软件套装,搜索引擎,社交媒体。这些SaaS实现基本上基于Web的API与云用户接口。指标具有租户订阅周期,应用使用,租户应用功能模块等等。
安全依赖于其部署环境内在的安全控制机制,不同的业务处理逻辑会增加额外的云安全机制或专门的安全技术层次。
从云用户的角度看,SaaS通常是精炼、通用的API,这些服务通常被设计为更大的分布式解决方案的一部分了。例如Google地图,提供API,使得地图信息和影响可以被集成为web或应用中。换而言之,云API的提供实际就是通过SaaS对外提供服务。
商用成本指标包括有:
1、前期成本(up-front cost)
2、持续成本(on-going cost)
3、附加成本:包括资本成本(cost of capital,指筹集所需资金的成本),已支付成本(sunk cost,例如已有的IT资源),集成成本,锁定成本(云环境会限制可移植性,例如移植到另一个云提供者)。
云使用成本指标包括有:
1、网络使用(Network Usage):流入和流出的网络流量,以及云内部的网络流量。为了鼓励用户迁移到云,不少云提供者对流入和云内部流量不收费。
2、服务器使用(Server Usage):虚拟服务器分配(和资源预留)。在IaaS和PaaS中,虚拟服务器分配长用按使用付费,分为按需使用的虚拟机实例分配和预留的虚拟机实例分配两个指标。
3、云存储设备(Cloud Storage Usage):存储容量分配。按使用的容量:时间×空间计算(GB/月),或者按I/O数据传输:例如阿里云(/TB)。
4、云服务(Cloud Service):应用订购时间,制定用户数量,(云服务和基于云的应用的)事务交易数量。
成本管理通常围绕云服务的生命周期进行考虑。云服务的生命周期包括:
1、云服务设计和开发阶段:provider决定定价模型和成本模板。
2、云服务部署阶段:决定并实现使用计量和计费相关数据收集的后台架构,包括按使用付费监控器和计费管理系统机制的定位。
3、云服务合同阶段:提供者和用户进行谈判,根据使用成本指标达成价格共识。
4、云服务提供阶段:通过成本模板以及其他定制选项,对云服务的定价模型进行具体化。
5、云服务供给:云服务使用和实例创建的阈值有云提供者定义或由用户设置。这些阈值对计费产生影响。
6、云服务运行阶段:对云服务的使用产生使用费用指标数据。
7、云服务解除:暂时或永久终止,费用统计数据将存档
定价模型:云提供者使用定价模型由模板定义,根据使用成本指标,规定细粒度资源使用的单位成本。价格模板或价格规范包含了一组标准化的成本与指标,详细说明如何计量和计算云服务费用。一个定价模型可以有多个价格模板,有下列因素决定:成本指标和相关价格,固定费用和浮动费用的定义,使用量折扣,成本与价格定制选项。IaaS通常按照IT资源分配和使用来定价。PaaS和IaaS类似,定义了网络数据传输、虚拟服务器和存储的价格,价格会受到软件配置、开发工具以及许可费用等因素的影响。 SaaS之余应用软件的使用相关,包括订阅的应用莫看书,指定云服务用户数和交易数。
SLA是协商、合同条款、法律责任和 运行时指标与测量的焦点。
服务质量指标。云提供者发布的SLA是人可阅读,描述QoS特性,保障和一个或多个基于云的IT资源的现在。相关可测量的QoS特性包括:
1、可用性(availability,运行时间、故障时间,服务持续时间)
2、可靠性(reliability,故障间最小时间间隔,保证的成功响应率)。平均故障间隔时间(MTBF),可靠性比例(例如调用IT资源的成功率)
3、性能(容量,响应时间和交付时间保证),例如网络容量指标、存储设备容量指标、服务器容量指标、web应用容量指标、实例启动时间指标、响应时间指标、完成同步时间指标。
4、可扩展性(容量波动和响应性保证),存储可扩展性(水平)指标、服务器可扩展性(水平)指标、服务器可扩展性(垂直)指标。
5、弹性(切换和恢复的平均时间)。从运行问题中通常的能力通常是用服务弹性指标来衡量,弹性通常是基于不同物理位置上的冗余实现和资源复制以及各种灾难恢复系统。有设计阶段、运行阶段、恢复阶段。常见的指标是:平均切换时间(MTSO)指标、评价系统恢复时间(MTSR)指标。
SLA指导准则:包括有把业务案例映射到SLA,使用云和企业内部的SLA,理解SLA的范畴,理解SLA监控的范畴,以合适的颗粒度记录保证,定义不能遵守保证条款的处罚,加入不可测量的要求(不容易测量的指标,例如数据安全和隐私),公开遵守性验证和管理(检查过程中使用的工具和实施方法,与法律相关的审计),包括具体的指标计算公式,考虑独立的SLA监控,存档SLA数据(业务期间和之后的对存档数据的处理),公开跨云的依赖关系。
工业标准组织
NIST:美国国家标准与技术研究院:www.nist.gov
CSA:云安全联盟 www.cloudsecurityalliance.org
DMTF:分布式管理任务组 www.dmtf.org
SNIA:存储网络工业协会 www.snia.org
OASIS:结构化信息标准促进组织 www.oasis-open.org
Open Group:开发群组 www.opengroup.org
OCC:开发云联合会 www.opencloudconsortium.org
ETSI:欧洲电信表组合你协会 www.etsi.org
TIA:美国电信工业协会 www.tiaonline.org
自由联盟(liberty alliance,开发了保护身份信息隐私和安全的标准):www.projectliberty.org
OFG:开放网关论坛 www.ofg.org
适应云的风险管理架构
专业出版(SP)500-299“NIST云计算安全参考架构”规范中讨论了云环境管理风险的若干关键问题。
NIST SP 800-37联邦信息系统风险管理框架应用智能,800-144“公共云计算安全与隐私指南”
其他
根据TIA-942给出的冗余性要求,基础设施分为四个层次,基础数据中心(平均可用时间99.671%),带冗余组件的数据中兴(99.741%),并发可维护的数据中心(99.982%),容错的数据中心(99.995%)。所以说业务不要轻易承诺多少个9,底层的IaaS可能都达不到这个级别。
合同中就安全和隐私方面通常有一个专门的章节,通常对提供者有利,限制其所承担的义务和保证。在苹果和协商安全和隐私策略是,需要额外考量的包括:安全衡量、访问控制、漏洞控制、数据传输、数据安全(数据访问、数据封锁条件、数据分类、技术和组织措施)、数据透露、知识产权和保护、数据备份和灾难恢复过程、控制变更。