一家半数员工都来自清华大学的团队做智能运维,了解一下?

“我们决定在这十年间登上月球并实现更多梦想,并非它们轻而易举,而正是因为它们困难重重。 因为这个挑战我们乐于接受,因为这个挑战我们不愿推迟,因为这个挑战我们志在必得。
 
这是美国前总统约翰·费茨杰拉德·肯尼迪在1962年的一场演讲中说的话,这次演讲为后来阿波罗登月计划奠定了基调。 1969年7月,人类成功登上了月球。
 
今天,一个以清华高材生为核心的团队同样在做着一件伟大的事情,尽管听起来没有登月那么宏伟,但当其真正实现后,也绝对算是一件壮举,因为这将解决无数企业、无数从业人员的痛点。
 
这件事就是智能运维。 一个当代无数企业都面临的难题,一个短时间内很难有重大突破的领域,一个这几年被各种厂商,包括IBM、BMC、Splunk、Dynatrace、Moogsoft、云智慧等频繁提及的市场。
 
为什么选择这样一个方向? 必示科技CEO刘大鹏的解释是,智能运维是市场刚需,而且很难,他们是一个有点理想主义色彩的团队,想做些有社会价值的事。
 
这一做就是很多年。 别看2016年必示科技(以下简称“必示”)才成立,但其实刘大鹏在这行已经耕耘的近10年,发表过智能运维方向国际会议论文10余篇。 团队成员更是强的令人惊叹,不到百人的团队,50%来自清华大学,拥有10位智能运维方向的博士,10位10年以上的行业资深专家。

一家半数员工都来自清华大学的团队做智能运维,了解一下?_第1张图片
必示科技CEO刘大鹏

这样一支创业团队,不能不让人好奇。 本文就来揭开必示的这一层层神秘面纱,内容包括但不限于必示对智能运维的理解,必示的产品、发展规划,必示的融资情况等。
 
为了更清晰的呈现,接下来采用问答的形式。
 
必示人眼中的智能运维什么样?
 
在回答这个问题之前,有必要先就智能运维的现状做一个简单概括。
 
什么是智能运维? 不同的出发点有不同的理解,进而会产生不同的导向和结果。
 
研究机构的定义是: 把机器学习、深度学习等自动化模型发现算法应用于IT运维工具和业务系统所采集的大型数据集,并尝试模拟人类行为(如发现、判断、响应)的智能化运维管理平台。

如果细数智能运维领域的企业,则可以按照既往优势、切入角度不同,大致可分为三派: 其一是从传统运维监控中走出来的,如APM、日志采集、服务器基础监控、运维大数据厂商; 其二是从智能运维算法切入,逐步将技术产品化的公司; 其三则是传统老牌IT厂商,更多聚焦底层的资源、服务的自动化管理需求。
 
每个企业都会说自己提供的智能运维解决方案,如何选择得看用户本身的痛点和需求。
 
必示属于第二类企业,其对智能运维平台的价值主张,有三个关键词: 垂直、专业、开箱即用。 垂直对应的是场景、行业,必示不会拿一种算法是适配所有场景,而是对应每一个场景有一套最优的算法; 专业更多是必示的定位,立足智能运维行业,将其作为一项为之奋斗的事业; 开箱即用很好理解,部署、使用便捷。
 
智能运维市场有多大?
 
很大。
 
只要有IT就需要运维,未来没有企业离得开IT,智能运维代替运维只是时间和技术的问题,随着技术的成熟,这一天迟早会到来。
 
在此次的发布会上,清华大学计算机系长聘副教授裴丹就给出了自己的观察和预测,2019年将是AIOps快速发展的一年。 同时,他还给出了AIOps的九大趋势预测,分别是行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化和成熟度评估标准化。
 
更直观的数据,根据iResarch2018年的数据显示,未来两年中国第三方IT运维服务市场规模增速都将保持在20%以上,到2020年IT运维市场规模将超过1400亿元。 而Gartner 预测,智能运维逐步取代人力运维是大趋势,到2020年,智能运维全球部署率将达到50%。 相当可观。
 
做智能运维难不难?
 
难。
 
换个角度来解释,智能运维英文单词是AIOps,AI+Ops,AI难,Ops也难,AI+Ops难上加难。 机器学习和运维两个行业都有几十年的历史,而二者结合不过才短短几年时间(AIOps的萌发大概在2016年,也就是必示成立的那一年),谈何容易。
 
就像刘大鹏说的,搞机器学习的人很难迅速了解运维的知识和场景,比如各类监控数据,要梳理很长时间才能理解; 搞运维的人又很难把机器学习吃透。 这两者之间存在一个巨大的鸿沟。

一家半数员工都来自清华大学的团队做智能运维,了解一下?_第2张图片
 
这种难导致的直接结果就是到现在市场上也没有比较完善的解决方案,都还在不断精进中。 当然,换个角度理解,正是因为难,一旦谁先确立了独有的优势,其它企业就很难撼动领头羊的地位了。
 
必示的产品理念是什么?
 
核心是平台化,更精确的说是基于运维知识图谱的平台化。 之所以走这样的路线,一是业界趋势发展,平台化是大势所趋,二则来源于自身的实践。
 
如刘大鹏所说,运维场景很复杂,很少只看一种监控数据,就能发现、定位问题。 随着越来越多的智能算法推出,新的挑战出现了。 比如,数据和算法种类不断增加,扩展是问题,部署是问题,各种算法的配合是问题,算法和数据之间关系复杂也是问题。 唯有平台化才能把所有这些问题归口到一起来解决。
 
于是,有了必示智能运维平台。
 
至于产品优势,其实很多是来源于必示曾经遇到的问题。 比如,扩展能力,支持海量数据的高效处理; 部署问题,告别繁琐调参,只需做简单配置就可投入使用; 复杂场景单一算法失效问题,支持算法灵活编排联动,可分析多样的运维数据。
 
除此之外,还有非常重要的两个关键点: 一、算法是经过打磨的专业、垂直算法,不是简单的开源算法,这也是开篇就强调过的必示对智能运维平台的核心理解; 二、平台蕴含了大量客户实践沉淀,相同的坑不会再踩第二次。 当前,包括交通银行、招商银行、中国民生银行、中国光大银行、广发银行、光大证券、中国南方电网等数十家各行业客户都已经落地了必示的智能运维平台。
 
据悉,当前必示智能运维平台版本中共集成了12个智能运维常见场景的算法,未来还会继续扩展。

一家半数员工都来自清华大学的团队做智能运维,了解一下?_第3张图片

这里有必要就运维知识图谱再多讲一点,毕竟是基于运维知识图谱的平台化,平台的演进很大程度取决于运维知识图谱的进化。 事实上,必示已经就运维知识图谱有一个清晰的规划。
 
其中,第一阶段是必示已经完成的,主要支撑两个功能: 第一是从外部接入数据关系(如CMDB、配置文件等),第二个可以支持多样的算法编排。
 
第二个阶段也就是2.0版本目前完成了70%,主要规划了两个内容: 一个是在图谱上做推理的操作,比如说几百个系统之间有复杂关系,检测到50个系统出现了异常,到底是哪个系统出了问题,其实这是基于图谱的推断和查找。 另外一个功能是外部知识的链接和融合,借助外脑完善产品。
 
第三阶段3.0版本是未来要做的,主要也是两方面,一是在1.0基于已有配置关系建立数据关系的模式变成自动的,包括图谱关系的自动补全等; 二是 “智能排障树”,系统能根据不同的数据和关系,自动推荐算法组合。

一家半数员工都来自清华大学的团队做智能运维,了解一下?_第4张图片

显然,如果真正到了3.0版本,智能运维就真的不远了。
 
必示融资情况如何?
 
受众多一线资本青睐。
 
2016年12月千万元天使轮融资; 今年1月数千万元A轮融资; 今年6月数千万元A+轮融资。 用刘大鹏的话说,必示拥有顶尖的人才、多年的技术储备、头部的客户,在运维这个传统的企业服务赛道中是非常特别、极具竞争力的,自然会吸引不少对行业有洞察的投资机构。
 
必示在业界处于什么位置?
 
快速上升期。
 
如果以时间论,必示绝对算这个市场的后来者。 但如果真正从智能运维的角度思考问题,各个市场玩家其实差距不大,毕竟2016年AIOps这个词才开始广泛被提及,到现在还不到4年时间。 以至于到现在,智能运维市场还没有人敢称老大,说明这个市场还不够成熟,谁都有机会。 就像刘大鹏说的,智能运维这条路还很漫长,必示会努力。
 
在我看来,必示的优势在两方面尤其突出,一是人才,二是这些人才长久以来积累的成果。 随着时间的推演,它们发挥的作用将越来越大。
 
总结全文,运维距离实现智能还有很长的路要走,必示不急功近利,有技术也有情怀。 最后借用刘大鹏的一句话结束本文,“智能化,对于运维这样一个几十年的传统行业来说,同样存在挑战,但也蕴含巨大价值,必示致力于实现这场变革。

一家半数员工都来自清华大学的团队做智能运维,了解一下?_第5张图片

你可能感兴趣的:(一家半数员工都来自清华大学的团队做智能运维,了解一下?)