企业上云已经成为大势所趋。随着企业上云的系统越来越多,企业在云上的成本支出越来越大,云上成本浪费也越来越大。据专业咨询机构RightScale的一份调研报告显示,当下的企业级用户在云计算支出一项的浪费高达30%。企业在上云、使用云过程中,如何在保障提升业务效果的前提下,实现云上成本支出的最优化,是一个非常值得分析的现实问题。
云计算发展如火如荼,凭借着自身独有的特色优势,云计算模式获得广大互联网企业和传统企业客户的青睐,国内大量企业纷纷把自己的网络基础设施迁移到云上,期望在云的推动下业务运营发展更加快速稳定。
云计算适合自己的企业吗?到底采用公有云、私有云,还是混合云?上云到底可以给企业带来什么价值?上云到底会增加成本开支,还是会节约成本?这是每一位企业领导都会思考的几个问题。
互联网企业和传统企业由于商业模式、产品形态、领导人思维等诸多方面不同,两者对上云的诉求也有区别。互联网企业以面向C端用户的高并发业务为主,业务迭代快,对企业创新能力要求高,业务上云首要考虑的因素是云的高可用、高弹性、高安全,以及强大的PaaS能力,支撑企业的业务快速创新,同时成本也是重要考量标准。
而传统企业往往有自己的机房,上云首要考虑的是安全与成本,数据放在云上是否安全,以及上云比本地机房节约成本吗?当然,传统企业由于经营压力的日趋残酷,也希望借助云的优势提升企业的业务决策能力。
综合来看,互联网企业和传统企业上云都追求的是业务提升与成本降低的价值双翼,而要实现这个目标,需要云管理服务商的专业服务。
虽然企业都非常关注上云的成本,但由于对云计算缺乏相应的了解,很多企业对上云的成本理解存在一定程度的偏差。比较典型的误解有2方面,一方面认为每年支付的云服务器租赁费比本地机房服务器折旧费贵,所以觉得上云成本比本地机房贵;另一方面,有些企业觉得我的系统上了云了,云上的成本开支肯定会比本地便宜,忽视对云资源的日常运维管理。
第一种误解是对成本的构成缺乏清晰完整的认识,实际上对比企业上云成本时,本地机房要核算总体拥有成本TCO(Total Cost of Ownership),除了服务器折旧,还包括机房、机柜、网络设备、电费、运维人员成本等项目。根据权威机构的测算,上云的TCO比本地TCO会低不少,而且随着云厂商用户基数不断增长,云资源的租赁成本会越来越优惠。
第二种误解与其说是大意,不如说是对云计算缺乏详细的了解,从而导致企业在云上开支远超预算,本文下述章节将对云上成本如何优化进行详细分析,力图为企业上云节约成本带来一些经验指引。
云上产品超过200种,架构变化灵活多样,如何发挥云价值的同时节约成本、不断优化成本,是一个复杂的系统工程。
企业上云伊始,对云资源、云架构的选择,就像盖房子一样,打好基础很重要;特别是架构的规划设计,要充分考虑未来的扩展性,否则不断的修补甚至推倒重建的成本很高。其次,企业上云后,业务可能发生变化,现有的云上架构可能不太适应企业的业务发展;另外,云厂商的产品在不断快速迭代,经常会推出性价比更好的产品或服务。
所以,这些因素决定了企业云上的成本优化是一个从事前规划到事中分析,再到事后评估改善的不断循环的过程,是一个不断完善的闭环体系。
事前规划的目的是打好基础,比如为上云规划标准、设立管控流程,后续云资源的选型、云架构的设计等有据可循,系统非规范操作也可得到有效控制。当然,标准和流程设计的一个关键出发点就是节约成本。
需要建立标准化的事项很多,大致可以从四个方面设定标准:
从运行环境来看,开发测试环境的配置标准可以低于生产环境,比如云资源规格配置,比如可以不用高可用架构等;开发测试环境的网络连接可以选用IPSec VPN,云资源计费可以采用后付费的方式。
从架构的选择方面,使用云原生的高可用、高安全架构,节省备份、安全成本。
从资源的选择角度,避免使用重叠的资源、使用低成本资源、管控后付费资源。
在计费方式选择上也有技巧,临时测试、弹性伸缩使用按量付费方式,长期使用的资源采用预付费,先使用低配再逐渐升配。
流程也非常关键,若是任何人都可以随意购买资源或开启服务,成本的支出就无法得到有效管控,等真正需要用钱买资源的时候,可能会面临账上无钱的尴尬。可以建立资源申请流程、资源变更流程、资源续期流程、资源回收流程,规范资源的申请、审批、分配。同时,通过账号的管理、权限的管理流程,严格控制安全风险与成本风险。不过,这些流程方面的管控可能需要第三方的云管平台工具配合。
减浪费是成本优化的关键一环。专业咨询机构RightScale的一份调研报告显示,当下的企业级用户在云计算支出一项的浪费高达30%。甚至有部分研究人员认为这一数据被低估,因为调查的样本聚焦于中型以上企业,如果考虑到浪费更为严重的小企业,真实的云资源浪费规模可能更高,预计可高至45%。
企业要把云上减浪费作为头等大事重视。可以从云资源、架构优化、计费模式三个层面分析如何减浪费。
从资源层面来看,需要重点审视五个方面:
配多了:是否存在闲置云资源?是否存在极低使用率的云服务器、未挂载的云硬盘、重复购买的WAF、大流量的DDos资源包等?
配重了:比如服务器带公网IP(含带宽)又使用共享带宽或共享流量包,又比如无特殊需求的前提下购买了文件存储和对象存储;
配高了:CPU、内存、磁盘、带宽的配置规格都比峰值高出很多?选择了企业版、旗舰版等高版本资源?磁盘都是配的SSD磁盘?
配贵了:没使用共享带宽或共享流量包,每台云服务器单独配带宽?没有使用SDWAN产品而全部用物理专线?
用超了:后付费资源没有设置峰值,导致费用失控。
从架构优化层面来看,使用对象存储、云平台的备份工具,以及采用动静分离的架构、redis缓存、弹性伸缩等可以节省存储费用、备份费用以及带宽费用、云服务器费用。
从计费模式层面来看,重点考虑下面四个方面:
临时测试、弹性伸缩使用按量付费资源。按量付费资源开启停机不收费以保留数据并能快速启用。如需长期运行,转预付费计费模式。
长期使用的资源,使用预付费资源。预付费资源,可以先使用低配置资源,观察评估运行资源负载后升级配置;可以将使用率低的资源降低配置,或释放。
对于开发、测试所用的按量付费资源,非工作时间自动启停,减少不必要的费用消耗
并非按量付费的年总成本就比预付费要低,比如NAT网关、WAF、ECS挂载的云盘,灵活选择计费模式。
有了事前规划准备与事中分析过程控制,还不够,还需要事后定期的成本统计分析,分析成本明细(按时间段、按产品明细、按计费类型)、成本构成(按产品类别、按子账号、按组织部门、按项目)、成本趋势(趋势是否合理、重要变化项),成本分析的结果作为持续优化的依据。可能存在成本支出明细项都合理但总费用超出部门成本预算的现象,这种情况也属于不合理,也需要在分析原因的基础上进行管控优化。
上述云上成本优化的体系可能偏微观,从宏观的视角来看,如果企业上云后基础架构稳固、业务系统稳定、平台安全、云平台支撑业务快速迭代创新,如果达到了上述目标,也是节约成本的一种体现,节约的是创新试错成本,节约的是被攻击后因业务中断导致的经济损失、企业品牌受损的成本。
为了实现上述目标,企业上云需要采用合理的安全架构,需要善于使用云平台成熟的PaaS能力,比如微服务、中间件、容器、大数据等技术支持企业业务快速创新。所以,不能孤立的将成本等价于资源,而应以全局的视角看待成本优化这件事。
云上成本节约与优化是一个反复迭代的过程,需要定期分析、持续优化,不要指望一步到位;同时需要注意云上成本优化的目标是要在提升业务效果与降低成本间形成一种平衡,在保障业务连续性、安全性、扩展性的前提下,实现云上成本支出的最优化,切不能舍本逐末。
作者:龚华兵
运维思考 | 你知道CMDB与监控是什么关系吗?
【干货】4种Oracle DBaaS部署模式,你在使用哪一种?
如何改善监控问题,试试打造企业统一监控平台体系!
云计算 | 数据在云上安全吗?DDoS攻击怎么办?
如何基于TAPD实践Scrum的敏捷开发?