面对云原生,运维如何实现转型?

【摘要】运维要从过去的被动式运维向主动型运维转变,从操作型向管理型转变,从背锅式运维向价值型运维转变。当企业的规模发展到一定程度后,运维要向运营转型,从技术支撑到价值输出。

前言

近两年,运维人需要面对不断涌现的新兴技术和架构转型的要求,例如企业上云、分布式、容器化、双中心双活等等。随着传统企业把更多的业务向线上化和数字化发展,IT运维也面临着业务模式改变随之而来的更多要求。做好运维,除了学好新技术,更需要从运维理念、运维方式和运维视角转变等方面去适应变化。以下是我个人的一些思考。

一、企业传统IT运维面临的挑战

我们的传统IT运维人员在运维工作上应该能体会到了三个明显的变化。

第一、运维对象越来越多

随着企业推进数字化转型,新增的应用系统越来越多;随着线上业务规模扩大,应用系统不断地进行细化拆分,组件的数量越来越多;随着微服务的推行,节点朝着小而多的方向迅速发展。现在,一套应用系统有几百台服务器,几百个容器已经是常见的事情。

虚拟机和容器的爆炸式扩大增长,已经不是危言耸听,而是实实在在发生的现状。这要求着运维人员投入更多的精力来保障和运维系统。

传统的运维模式,例如操作文档手工运维,脚本方式手工运维,按系统类型分类运维,大量个性化特殊化运维等等,随着规模的扩大,管理的难道呈指数级增加,运维管理能力也会达到极限。

这个时候,运维人员面对各种工单往往应接不暇,焦头烂额,运维没有成就感。然而要投入更多的运维人力,又加大了沟通、培训和协调等的管理成本,堆人的路已经行不通。

第二、运维要求越来越高

IT规模小的时候,传统运维可能还可以停留在几台服务器的搭建,基础软件的安装,日常的变更维护等等,只要保证系统的安全稳定运行即可。

但是,随着企业的规模发展,对运维也会提出更高的要求,例如几百台服务器规模化的部署,几千台大批量的操作,分钟级甚至秒级的敏捷资源供给,自动化的资源扩缩等。

今年疫情期间,企业为了满足线上办公的需求,要求马上提供上百台远程桌面服务器供员工线上办公;企业频繁地开展线上秒杀活动,在活动期间需要批量部署上线大量的应用服务器,活动结束马上回收;近段时间,基金开户和销售火爆,很多基金公司的应用系统几近瘫痪,如何保证及时地提供资源。

在这些场景下,依靠传统的资源管理和人工操作方式已经无法满足业务对运维服务的要求。

第三、运维服务用户越来越多

传统企业环境下,运维仅服务于研发,研发服务于业务部门,服务用户都比较单一。现在很多企业成立了多个研发中心和测试中心,还不断地扩大分支机构,分支机构又有独立的应用系统建设需求,同时也提供IT服务给第三方公司。

在这种情况下,我们的运维人员需要面对各种各样的用户环境和多种多样的用户需求,首先沟通成本会非常高,其次也无法保证能够提供一致的运维服务,第三运维质量也因为人员差异而参差不齐。

以上的三个变化,对于还没准备好的传统运维人员而言,将是巨大的挑战和压力。一方面业务迅猛发展,领导不断下要求给指标;另一方面,运维人手不足,工具跟不上,平台不给力。

除了上面三个因业务发展带来的规模上的变化,我们的运维也面临着如何化解新技术的压力。

例如自动化运维、可视化运维、智能化运维等各种平台和工具的引入,运维人需要选择,

你可能感兴趣的:(运维,云原生,devops)