在数字化转型浪潮下,越来越多的企业选择云原生架构。而云原生的加入,实现了效率提升,也带来了更为复杂的运维挑战。
交付效率要求提高,持续构建与发布、故障时对用户的影响如何评估?系统复杂程度升级,如何快速定位问题、提供链路分析?实例生命周期缩短,故障环境可能被破坏问题如何解决?
这些,都能够通过系统可观测性建设得到答案。
系统可观测性成为必要
了解系统可观测性之前,先来厘清一下“云原生”。
在云原生时代,AI服务的显著特点是高算力和超稳定的架构体系。而这个新架构体系,就是以微服务、容器化、Serverless等技术为支撑的云原生架构。
在这个技术架构中,服务链路错综复杂、微服务与分布式趋势增强、环境容器化等一系列变化,使监控技术也必须改变。此时,传统的监控技术已经很难构建起一套高效的排障体系、满足企业的运维需求。这也正是云原生环境下,可观测性取代传统监控成功上位的原因。
可观测性,一个伴随云原生兴起的概念,在2018年被引入IT领域。
它能够实时地、清晰地挖掘场景化问题,利用灵活调配、协作等打破数据孤岛。从传统的日志方式、监控、APM到链路跟踪、服务QoS度量,系统需要具备这种全方位的可观测性,来及时应对故障错误对业务带来的影响。
Gartner预测,2023年,全球可观测市场规模预计将达到164.94亿美元。到2024年,将有30%的企业会通过可观测技术来提升数字化业务的运行性能。热潮之下,运维监控正以高速姿态迈向数智融合3.0时代。
平台化升级运维体验
在数智融合3.0时代,企业运维需要具备多项能力,如全局数据采集能力、以运维视角重塑产品能力、数据有机关联融合能力等等。从经验的角度来讲,这些不是简单的工具组合能够完成的,建设一体化的智能可观测平台成为必要。
足够优秀的一体化智能可观测平台,应该具备哪些特征?
一是从监控走向可观测,由关注告警和数据,转向对系统运行、问题发生本质的理解。二是从孤立的工具走向统一的能力平台,All in ONE。三是从人工的分析走向智能的见解,利用平台帮助用户思考分析问题、解决方案。
基于这样的认知和行业判断,博睿数据在2021年“服务可达的数据链DNA”模型的基础上,提出“数据链DNA+”,正式推出了一体化智能可观测平台ONE。
“一体化智能可观测平台ONE是业界第一个,将所有运维监控需求‘All in ONE’的统一平台。”博睿数据COO吴静涛表示,平台的建设投入了博睿数据70%的研发资源,从数据分类、采集抓起,再做数据缝合,也就是关联,实现了支撑ITOM统一监控、AIOps智能运维、BizOps业务运营、DevOps效能提升四大运维场景的服务能力。
不同于其他行业运维监控产品,ONE平台帮助客户走出数据中心, 打通云管边端, 通过代码到客户的全数据链DNA采集能力,结合平台本身的大数据及AI能力, 实现传统的产品工具到平台+架构的转型, 构建以用户为中心的新运维体系。
博睿数据COO吴静涛
追求极致的“ONE平台”
“ONE平台是一个集告警收敛、异常检测、根因定位、智能见解,打破运维孤岛、避免重复建设的一体化可观测平台。帮助用户实现从孤立的工具到统一平台的建设要求,打造极致的平台体验。”博睿数据产品高级总监孙丽表示,这些功能的实现并非基于设想,而是与用户交流、讨论中明确的迫切需求。
博睿数据产品高级总监孙丽
立足这些需求出发,ONE平台展现出多项“超能力”,比如All in ONE、关联性、智能见解等。
其中All in ONE,即统一运维监控技术栈和统一运维数据治理体系,实现了“开箱即用”,免去了购买、组装多种工具或重复建设的麻烦。此外,还解决了因竖井式的监控带来的数据割裂、重复建设、可观测性差的问题。
在行业适配性的问题面前,ONE平台也早做了积极的准备。
考虑到不同行业的特点,ONE平台开放了大量的二次建设能力,以此满足不同场景下的用户需求。并且,从用户的时间成本、经济成本角度出发,平台除了实现“一次部署,随处使用”,还做到了最大限度的兼容。
这里的兼容不仅是指运维监控,还不包括管理的自动化。博睿数据CTO孟曦东指出,“用户不同的IT成熟度有不同的建设规划,我们不是必须推翻,其实是更好的包容,用长板弥补之前的短板。”
博睿数据CTO孟曦东
站在需求的角度做产品,必将催生更具想象力的市场前景。未来,数智环境下的可观测建设步伐加快,还会有怎样的新惊喜?需要拭目以待。