“想感受996福报,以一天只睡4个小时为指导,向007看齐,身为运维的我可以体验社畜的忙碌和劳累。”一位运维人员自嘲道。
作为技术部门,运维与研发、测试、系统管理同为互联网产品技术支撑的4大部门。也正是因为IT领域工作的特殊性,让同为“程序猿”的运维工作者成为了高智商、高收入以及高发际线的新“三高人群”。
运维的本质是对网络、服务器、服务的生命周期各个阶段的运营与维护,在成本、稳定性、效率上达成一致可接受的状态。也正是因为该行业具有投入不见回报、“出事便背锅”等特性,让运维工作人员成为了行业内“可有可无、费力不讨好”的代名词。
然而,作为前沿AI技术的落地体现,运维产业的超进化:智能运维却价值凸显,成为全球软件市场主要的刚需赛道之一,整体市场规模超过600亿美元,并且仍处于快速上升阶段。
据统计,2021年智能运维行业相关融资事件共24起,融资金额约54.7亿元。例如云智慧、擎创科技、听云等企业先后完成E、D、C轮融资。红杉资本、GGV纪源资本、云晖资本、晨晖资本等知名投资机构的身影不断浮现。
从传统的手动运维,到DevOps的自动化运维,再到AIOps的智能化运维,运维技术在近几年实现了跨越式发展。那么未来,智能运维将走向何方?前沿AI技术,增强现实(AR)的应用是否能助力智能运维取得进一步的发展也成为了当下值得讨论的问题。
在运维发展的过程中,手工运维(系统管理员或网管)最早出现;在大量的自动化脚本产生后,自动化运维应运而生;此后又陆续出现了DevOps(Development Operations)以及当下最为“时髦”的AIOps(智能运维)。
对于智能运维,学术界有着明确的定义。
美国IT研究机构Gartner曾定义:智能运维,又称AIOps,它能够将大数据、AI 机器学习和其他技术相结合,通过主动、个性化和动态的洞察力支持所有主要IT的运营功能。AIOps平台支持同时使用多个数据源、数据收集方法、分析技术(实时和深度)和表示技术(Gartner 2016)。
这个定义乍看复杂,但以现实生活举例并不难理解:
在人类社会中,从马车到汽车是为了提升运输效率;当汽车接近饱和的时候,人类又希望借助自动驾驶把驾驶员从开车这项体力劳动中解放出来,以增加运行效率,同时也降低交通事故率,这就是我们对智能运维的诉求。
因此,将人的知识和运维经验与大数据、机器学习技术相结合,开发成一系列的智能策略,融入到运维系统中代替人力,减轻运维人员的工作负担,便是智能运维的核心思想。
当前,智能运维主要应用在运维监控、报警、故障自愈等方面,通过人工智能算法、运维专家知识库、以及运维数字化技术的结合来实现运维工作的智能化,从而降低运维工作的人力投入。
因此,智能运维的操作场景主要集中在金融、交通、互联网等对IT故障容忍率更低的行业。而各大厂商主要的差异则在于数据治理的能力和经验、产品线的覆盖度(告警、日志、指标等均可进行智能分析)以及智能场景的丰富度。
从智能运维覆盖的行业可以看出,尽管该技术在社会上的“知名度”不高,但它所服务的领域却都是与我们生活息息相关的“要害部门”。
“运维产业看似距离普通人生活很远,却实实在在地影响我们的生活。”云智慧CTO张博对亿欧EqualOcean说道,“IT世界里哪有什么岁月静好,只是有运维技术在负重前行。智能运维的目标恰恰是让用户不受影响,但如果不善于运用,就会出现问题,例如‘健康码’突然打开不了,便是系统运维出现了问题,由此可见运维系统对于社会的重要性。”
以金融行业为例,智能运维能够基于查询账户余额单次请求序列还原问题快照,分析在响应用户请求的执行过程中,调用链路、响应耗时、响应状态、吞吐率、异常信息、缓存及数据库操作等性能指标,逐步分析每个环节对业务系统造成影响的问题瓶颈,实现端到端的应用性能管理。
“在日常消费过程,我们每一笔业务交易的背后都有智能运维在作保障,如果消费者在交易的过程中出现延迟现象,那么到底是网络问题,还是系统故障或是服务器出现了问题,通过智能运维便能很快地排查出来了。”张博说道。
伴随着智能运维的快速发展,眼下,将现实增强技术(AR)融入运维场景正逐渐成为该行业主要发展趋势之一。
增强现实(Augmented Reality,简称AR),是通过计算机系统提供的信息增加用户对现实世界感知的技术,并将计算机生成的虚拟物体、场景或系统提示信息叠加到真实场景中,从而实现对现实的“增强”。
换句话说,借由配有AR技术的智能手机、平板电脑、智能眼镜或其他头戴式显示器,能够将计算机生成的虚拟物体或数据叠加到真实世界的场景之上,实现虚拟世界与现实世界的融合。
目前,增强现实技术已经开始向运维领域渗透,并赚得不错的口碑。
2021年12月,数据分析公司GlobalData发布了最新的主题报告《石油和天然气的增强现实》(Augmented Reality in Oil and Gas)。该报告中,GlobalData表示,在未来三到五年,增强现实技术(AR)有可能颠覆油气行业的传统运营部门。
对此,GlobalData的石油和天然气分析师Ravindra Puranik表示:“在石油和天然气行业中,可穿戴设备、智能手机和平板电脑的使用日益广泛,这有利于在该行业采用AR应用。将AR技术与物联网(IoT),大数据和人工智能(AI)等技术相结合,将有助于为石油天然气行业创建更全面的解决方案。”
此外,法国咨询公司凯捷(Capgemini)发布的报告《运维与操作中的现实增强》(Augmented and Virtual Realityin Operations)也显示,AR技术之所以开始广泛应用在运维领域,其主要原因在于,智能运维场景中AR技术的应用能够大幅提高运维效率。以通用电气为例,在运维人员佩戴AR设备、巡检设备之后,便可以直接在维护说明上签字,而不必再去机房工作,其工作效率相比之前提高了59%。
对此,张博认为,智能运维作为助力企业数字化转型的服务产业,其本质是为服务企业进行全方位数字化保障,从机房、设备等资产管理到APP应用的系统性能维护再到最终的业务数字化赋能。智能运维的主要构成元素包括:数字基础设施运维、数字化应用运维以及数字化业务运维。
而AR技术的出现,能够将上述三个层面的数据串联起来,通过视觉传输的方式展现在运维人员的面前,使运维人员更快速地完成巡检任务,智能运维效率得到明显提升。
现实增强技术虽然能够有效地提升智能运维的工作效率,但现阶段,它也有可能成为运维人手中的双刃剑。
当前,智能运维的理想状态是把运维工作的三大部分:监控、管理和故障定位,利用机器学习算法有机结地合起来。
而在大数据时代,智能运维是基于数据之上。运维想要把监控、管理和故障定位这三部分有效地结合,就不可避免地需要用到智能算法,而体现智能算法的价值,则需要大量的数据以及算力去支撑。
当下在人工智能领域,算力已经成了“稀有资源”。正如此前华为公司轮值董事长徐直军曾表示,“AI研究中遇到的最大困难就是缺少算力,AI本质就是暴力计算”。
从2012年到2019年间,AI算力需求的增长速度,远远超过了我们耳熟能详的摩尔定律,达到每100天翻一倍,七年增长了30多万倍。
由此可见,算力作为网络消耗下的单位总计算能力,难以完全满足人工智能的需求。因此,在智能运维领域,算力不足的问题也依旧存在。
然而,如果要将AR技术融入到运维领域则需要进一步提升智能运维的算力。
以苹果公司的AR设备为例,从零部件装配来看,苹果AR头显将搭载2个索尼提供的4K Micro OLED显示器,以及2个处理器。根据计算,该AR头戴设备至少需6–8个光学模块的持续同时运作,才能为使用者提供图像式穿透(video see-through)的AR服务。
这也就是说,如果AR设备需要正常工作则需要相当庞大的算力进行维持。
因此,如果AR技术应用到智能运维领域,那么运维商在算法领域的技术则需要进一步细致化的打磨,以提高它的实时性。
当下,在国内的智能运维算法场景当中,出现30秒或1分钟的延迟是可以接受的现象,做到10秒至20秒延迟已经是行业领先水平。但是如果搭载AR技术,就需要做到更低的延迟率甚至实时化,这样才能让穿戴AR设备的运维人员提高工作效率,避免出现“人等数据”的情况出现。
因此,尽管AR具备多种优点,但如果运维商在没有提高运维系统算力的前提下,就贸然引入AR技术,更多是得不偿失。
“有无相生,难易相成,长短相形,高下相倾。”此句出自老子《道德经》第二章。该句本意为:事物都有自身的对立面,并以对立面为自身存在的前提。
同样,AR技术作为当下前沿科技之一,将其应用在智能运维领域,能够有效地提升运维行业的工作效率,让运维由繁入简。
但是,在我们追求前沿科学技术的同时,也要注重底层技术是否构建得扎实。如果在算力问题没有解决的前提下,盲目地推进AR技术在智能运维领域的落地,便难以将该技术的优势发挥到最大化。那么,运维人员手中价格昂贵的AR设备就很有可能成鸡肋产品,难以避免被束之高阁的命运。
参考资料:
Augmented Reality in Oil and Gas. (2021, December). Retrieved January 23, 2021, from https://www2.deloitte.com/us/en/pages/consulting/articles/augmented-reality-wearables-digital-oil-gas.html
Cohen, L., Duboé, P., Buvat, J., Meltont, D., Khadikar, A., & Shah, H. (2018). Augmented and Virtual Realityin Operations. Retrieved January 23, 2021, from https://max.book118.com/html/2018/0916/7032132015001150.shtm
陈璨, 袁骏毅, 汤钦华, 马圣群, 岑星星, & 潘常青. (2021, December). 智能运维系统的构建及应用效果评价. Retrieved January 23, 2021, from http://www.haowenxian.com/e/action/ListInfo/?classid=61
Kaur, jagreet. (2021, September 17). AIOps: Artificial Intelligence for IT Operations. Retrieved January 24, 2021, from https://www.xenonstack.com/insights/aiops
王畅. (2019). 基于增强现实的智能运维技术研究与应用. Retrieved January 23, 2021, from https://xueshu.baidu.com/usercenter/paper/show?paperid=5c6d802dfc0e4fe36758759bff297c8a&site=xueshu_se
来源:亿欧;作者:马渭淞