一、混合云管是大势所趋
(以下部分内容来自twt社区邓毓同学的分享内容,若有侵权,请联系删除)
随着各行业的业务的发展和技术的进步,公有云、私有云、混合云技术的应用也越来越广泛。云计算为企业带来了快速的资源交付能力、敏捷性、扩展性以及规范性。
提到云计算技术,就不得不提云管平台(CMP),CMP不仅仅是一个资源管理平台,也是一个对外的IT服务平台,它将资源抽象化和服务化,极大简化了企业用户的管理和使用。
一个贴切企业实际需求的云管平台,能够强化企业IT资源的管理能力,提升企业IT资源利用率,满足企业对大规模计算能力的需求,从而进一步推动企业业务的发展。
目前,云计算正逐步进入深水区,传统的公有云和私有云已经暴露出一定的局限性,混合云逐渐成为企业用户青睐的对象。
利用混合云,企业不仅可以利用企业内部的私有云,将内部重要数据保存在本地数据中心,同时也可以使用公有云的资源,将非机密功能移动到公有云区域,以更高效快捷地完成工作。
然而,混合云的管理却非常具有挑战性。
二、混合云管平台的类型
到目前为止,非互联网公司的传统企业里的云环境都是私有云+公有云的存在,那么针对性的就会有以下几种类型的云管平台的架构:
商用X86云管
商用X86云主要是VMware技术为主要代表,vCenter虚拟化管理平台相当于资源管理层,Vrealize Automation则为云管理平台层,不仅提供API功能的自服务和统一服务目录,也能支持不同供应商的多套 私有云和公有云,还支持对容器的管理等。
该云管平台的特色是和VMware的底层技术紧密结合,通过抽象化底层实现技术,同时提供可视化服务和可拖放的设计画布,将预构建的组件组合为各种应用。
开源X86云管
开源X86云主要以OpenStack为框架,利用OpenStack的各类组件对接不同的资源,各厂商在公版OpenStack的基础之上,开发各具特色的云管平台,包括统一资源层和服务抽象层。
资源层的实现需要在公版OpenStack各组件上进行改良和优化,而服务抽象层的设计完全就是各组件的API的调用和抽象,将不同的IT服务、编排策略、动态优化策略等翻译成不同组件的API调用组合,另外还需和其他像自动化运维和监控等工具相结合,这就完全考验各厂商或者用户企业的开发实力和对云管平台的理解能力。
Power云管
IBM的 PowerVC为目前的最佳管理PowerVM资源池的选择,PowerVC提供两种版本,一种是PowerVC Standard Edition,提供基本的虚拟化资源管理能力,另一种是Cloud PowerVC Manager。
在Standard Edition之上 还提供了自服务功能和简单流程审批功能,能够定义各类计算模板和存储模板,自动化按照模板进行计算资源和存储资源的编排。
Power 和 X86 共存云管
Power和X86共存的云环境,一般需要云管平台具备统管所有资源,并能抽象成服务,对外提供服务。
三、云管平台的定位和价值
对于一般的传统企业来说需要的都是混合云管,典型的混合云管平台的分层架构如下图所示:
最底层是虚拟化资源层和裸金属层,这一层提供的是虚拟化资源池的能力,包括虚拟计算、虚拟网络、虚拟存储等等。
再往上一层是虚拟化管理层,这一层基本是“各家管各的”。例如Vmware的vRealize套件结合VC等负责管理自己的虚拟化资源。这个层次的管理以同构管理为主。
再往上一层,就到了“云管理平台”。这个层也分为两个小的层次:云管平台资源层和云管平台服务层。云管平台资源层居于 1 层和 2层 之上,负责各类异构虚拟化和云资源的管理,包括各类私有云、公有云、裸金属等,对上屏蔽底层厂商和资源的异构性。
而云服务层,则是在屏蔽底层技术差异的基础上,通过编排管理等,对外提供无差别的、透明的自助和编排服务,对内提供运营和分析服务。
所以,简而言之,混合云管的定位就是对下纳管、驱动各类异构公有云和私有云资源,对上提供目录服务和自助服务,对旁边的运维人提供运营、管理和分析服务。
四、跳出云管看云管:还需要混合云管做什么?
以上是云管平台传统上需要具备的能力,总结起来,混合云管平台传统上需要满足的能力包括:
资源整合、大幅提高资源利用率
为敏捷开发与快速上线提供快速部署的支撑
资源部署策略和手段多样性
资源调配灵活性
可自定义的,灵活的自助服务提供能力
灵活的服务编排和资源管理能力
全面的云资源分析管理能力
……
针对混合云管理的以上能力需求,嘉为蓝鲸推出了自己的CMP解决方案,整体上去实现:跨云集成管理、对外的灵活服务和对内的各种分析等能力。这部分能力,可能每种CMP解决方案都大同小异,我们不必展开。
我们关心的是另一个问题,混合云管平台还需要具备什么能力呢?或者说,放在一个完整的ITOM的环境中,云管平台究竟处于什么位置呢?
从上面这张图可以看到,混合云管理平台在整体ITOM中事实上处于基础架构管理领域中的一个模块,不可避免的,CMP作为运维管理工具中的一种,不能独善其身,需要与外界各类其他工具进行流程、操作和数据的交互和互通有无。
随着企业信息系统的不断壮大,各种应用、数据库、中间件、操作系统等技术组件越来越多,种类和关系也越来越繁杂,因此我们需要一个CMDB来统一管理IT环境中所有的对象、配置信息和关联关系。
同时无论是硬件资源还是软件资源都变得越来越难维护,运维成本不断增大,对信息系统的健康状况的自动感知的要求也越来越高,因此我们需要一个操作编排的流程引擎将所有运维管理工作串联和联动起来的需求也越来越迫切;为了减轻压力,集中的自动化运维、监控和故障自愈管理、ITSM流程自动化管理就变得十分重要。
另外,用相较于生产环境,开发测试环境的自动化运维和监控往往就不大被重视,然而实际问题却是开发测试环境经常莫名奇妙出现各类问题,各个节点检查后才发现是非常简单的原因造成的,这时简单的监控也变得需要。
另外由于开发测试环境节点数规模十分庞大,也不可能指定大量专门的运维团队去维护开发测试环境,所以开发测试环境的自动化运维和监控也变得需要。
最后如何实现开发、测试和生产运维流程一体化也是需要考量点之一,让整个IT流程在各个阶段都运转和串联起来。这个时候需要借助于DevOps解决方案和流水线的能力。
五、结论
基于以上的考虑,云管平台需要合理的集成CMDB、自动化运维、监控和故障管理、ITSM流程、DevOps工具等平台,以对云计算体系内所有软硬件资源进行集中式的管控、资源和服务交付和流程流转。
也就是说,云管平台不能自己成为一个独立的王国,而是ITOM整个王国领域中有机的一环,否则就是在重复造轮子了。
在这种情景下,蓝鲸平台就非常具备吸引力了。蓝鲸平台提供CMDB、监控、自动化、ITSM自动化、CMP、DevOps解决方案等工具生态体系,CMP在其中与其他工具体系天然具备亲和性,并原生集成。
不仅如此,蓝鲸平台具备的API纳管能力,可以持续将现有的“轮子”和“烟囱”工具纳入一体化监控和运维管理的体系中来,不必浪费过往的投资;而蓝鲸具备的工具运维开发能力,又可以保证能够持续满足未来的云管、运维、监控和流程管理能力,也是市面上为数不多的真正基于PaaS平台实现ITOM的解决方案。
蓝鲸简介
蓝鲸智云,简称蓝鲸。它是一套基于 PaaS 的企业研发运营一体化技术解决方案,提供了一个完整的研发、运维、运营的PaaS技术平台。平台提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统;是腾讯游戏运营部沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。
对于蓝鲸不太了解的同学可以移步这里:
http://bk.tencent.com/index/
还有这里:
http://docs.bk.tencent.com/product_white_paper/introduction/。
请相信,你打开的不是两个链接,而是运维的新世界和新天地。
作者:赵海兵