优维全面可观测产品能力分解①:架构可观测

图片

2023年,基于客户需求的洞察,历经1年的潜心优化,优维在第四季度推出集大成产品——「全面可观测解决方案」,涵盖架构可观测、故障可观测、变更可观测、用户可观测、应用服可观测、资源可观测、运维状态可观测等不同场景的可观测能力。(点击可回看:优维全面可观测解决方案)

优维全面可观测产品能力分解①:架构可观测_第1张图片

为了用户能直观了解优维可观测产品的全新能力,会以系列性文章的形式详细介绍优维七大可观测能力。本系列第一篇将阐述「架构可观测」

从单体架构到集群架构再到微服务架构,业务越来越庞大,系统也越来越复杂。每一次架构的升级,在提升了业务吞吐量的同时,必然会带来更大的复杂度,系统稳定性的因素也越来越多。随着系统复杂度的提升,“可观测”成为系统架构建设的重要原则。

1

为什么要做架构可观测?

通过对客户需求的持续洞察,我们从系统架构视角、业务视角、视角连接、架构设计等不同维度发现客户在架构的可观测上存在诸多的难点:

  • 系统架构单一平面观测难

    系统架构画像复杂、层次深,难以从单一平面来观测系统架构运行状态。排查具体应用问题时,需要对此应用做立体化检测,如检查机器情况、关联数据库情况、运行容器情况等,当前没有统一视图,导致都是靠人工经验,排查低效。且状态与告警信息散落,难以判别故障异常对上层系统的影响。

  • 缺乏业务视角直观呈现

    通常报障是站在业务视角,而平台缺乏业务视角的监控。现阶段,业务的故障排查依靠人工经验逐点排查业务链路,缺乏业务链路的直观呈现。

  • 缺乏业务与系统的视角连接

    业务异常与系统故障缺乏连接,对业务感知力弱,依赖有经验人员做转换后才能进一步定位技术故障。

  • 架构设计不合理

    如单点、负载不均等的架构设计不合理,导致系统没有足够的容错空间,难以在故障发生前,提前发现问题。

优维架构可观测能力

在此背景下

为了解决客户实际问题

应运而生

优维全面可观测产品能力分解①:架构可观测_第2张图片

2

优维架构可观测能力

优维「架构可观测」致力于系统架构视角、业务视角的整体状态的可视化呈现,以及系统架构视角的立体化剖析,为系统架构的稳定性提供有力的监控数据支撑。

通过构建业务视角和系统、应用视角的运行状态视图,以可视化业务链路的形式进行故障排查。

优维全面可观测产品能力分解①:架构可观测_第3张图片

强调系统架构的立体化呈现,针对系统架构逐层开展故障剖析,帮助企业从运行态的系统架构发现架构不合理的问题。

优维全面可观测产品能力分解①:架构可观测_第4张图片

同时,通过构建业务视角与系统架构视角的连接关系,辅助运维更快定位业务反馈的故障。

3

架构可观测的七大场景价值

  1. 用户侧/业务侧报障时,排查业务故障:当业务故障时,能快速判断影响核心业务的核心应用/服务是哪些,快速定位故障根源。

  2. 查看业务的运行情况:以业务的视角观测服务的运行是否正常和运行性能,提前预知业务故障。

  3. 保障核心业务运行、排查或预知业务异常:能观测业务的运行状态和运行性能,帮助用户更早发现业务的异常。

  4. 观测系统架构运行,排查或预知技术故障:帮助用户了解系统架构整体的运行情况,以便更早发现系统故障。

  5. 系统出现异常时,排查故障根源:对应用系统做立体化检测,包括应用、服务运行情况和资源运行(如检查机器情况、关联数据情况、运行容器情况等)的排查,以便快速定位故障根源。

  6. 定义业务场景链路,配置业务链路的运行状态等数据的上报:根据企业现状定义核心业务链路,不受非核心支路的影响,并且快速接入业务链路的运行数据

  7. 查看不同环境的系统/应用运行情况:可视化展示系统/应用运行性能,即时掌握系统/应用健康,提前预知系统/应用故障。

4

架构可观测的故障定位路径

从技术视角与业务视角构建故障定位的路径:

技术视角:

  1. 通过系统墙查找告警系统

  2. 通过系统墙 进一步下钻应用墙,查找系统下的告警应用

  3. 前往系统资源图谱 查找系统下资源图谱,立体化检测

业务视角:

  1. 通过业务墙查看异常业务

  2. 查看业务步骤,了解业务运行数据和异常业务步骤

  3. 业务步骤详情内 下钻关联的服务的详情,实现业务视角和技术视角的转换,进一步下钻排查问题

5

架构可观测核心功能:三墙一图谱

基于系统架构和业务的视角,在架构可观测能力的设计展现上,采用“墙”的形式可视化展示系统、应用的运行状态,分别设有系统墙、应用墙、业务墙;而在故障排查上,通过提供系统资源图谱的能力,让用户快速清楚了解系统包含哪些资源。

系统墙

在系统墙的能力上,通过立体墙的形式集中展示系统资产,并实时显示告警状态。悬浮显示系统间的逻辑关系,当故障发生时,快速确定系统间的影响关系。单击下钻单个系统,可查看对应系统运行状态的指标数据及相关的告警信息。

优维全面可观测产品能力分解①:架构可观测_第5张图片

应用墙

同系统墙一样,应用墙也是通过立体墙的形式集中显示组成系统的内部应用,包含存储层、中间件层、逻辑层、接入层,并显示应用之间的上下游访问关系及应用的实时告警状态。单击下钻单个应用,可查看对应应用运行状态的指标数据及相关的告警信息。

优维全面可观测产品能力分解①:架构可观测_第6张图片

系统资源图谱

在故障排查的时候,通过提供系统资源图谱展示系统/应用下的全量资源。针对某一类资源,进一步支持资源的下钻查看。通过单类资源的列表,结合资源观测,展示对应资源观测的指标数据,及进一步去下钻、跳转及查看。

优维全面可观测产品能力分解①:架构可观测_第7张图片

系统资源图谱除了支持系统级别,也支持应用级别的资源图谱,通过系统聚焦到单个应用,再下钻单个应用相关的资源情况。

业务墙

从业务视角出发,架构可观测全新推出业务墙的能力,集中展示业务资产,并实时显示异常业务。支持单个业务的下钻查看,通过可视化业务流链路,渲染出业务步骤、运行数据和告警状态。其中,业务步骤可关联系统架构视角的应用系统等。

优维全面可观测产品能力分解①:架构可观测_第8张图片

优维全面可观测产品能力分解①:架构可观测_第9张图片

你可能感兴趣的:(架构,系统架构,可观测性)