如何将图数据库应用于企业智能运维

导读

随着数字化转型的加剧,数据资源的规模及复杂度也呈指数级增长,同时在不断扩大的网络规模和虚拟化趋势的推动下,运维发展也从CMDB的自动化阶段朝着智能运维阶段过渡。智能运维(AIOps)阶段是最理想化、最高效的运维方式,其将大数据、人工智能等技术融入运维领域,实现智能故障预测、故障定位、故障自愈等。

但在实际场景中,AIOps却存在广泛痛点导致目标无法高效实行。例如金融行业,运维系统影响业务系统,造成业务处理周期长,使大量客户流失。解决其落地的关键在于智能运维图谱的建立,智能运维图谱位于运维数据中台内,管理对象层存储有静态数据,各对象调用时产生数据依赖关系、动态数据,各对象数据更新时产生流程数据。系统运行时,图谱将调用下游接口,对数据进行整合和关系提取,从而构建多层次的运维关系网络,并针对不同的服务场景产出不同的关联关系图谱,从而实现对场景中各类服务的能力支持。

基于此背景,运维人员需要将运维对象的动态关系(服务调用关系、设备网络关系、作业依赖关系)和静态运行状态(数据库运行状态、应用运行状态、服务器运行状态)数据关联起来,构建全局视角下的智能运维图谱,从而保障企业服务正常运行。

以Galaxybase图数据库进行运维管理的方法原理图如下。

如何将图数据库应用于企业智能运维_第1张图片

创建模型

构建设备网络之间的关联关系,可以根据运维对象的实际情况展开,将物理实体、虚拟化设备、网络应用设置为点,各实体间调度关系设置为边。接下来使用Galaxybase图数据库来创建数据模型,点类型和点属性如下表所示。

点类型 属性
设备虚拟机 WebVM编号
存储区域网络 SAN编号
站点 站点编号、URL
服务器 服务器编号
数据库虚拟机 DBVM编号
客户管理系统 管理系统编号

边类型、起始点类型、终止点类型如下表所示。

边类型 起始点类型 终止点类型
调度 站点 设备虚拟机
调度 站点 数据库虚拟机
调度 设备虚拟机 服务器
调度 服务器 服务器
调度 服务器 储存区域网络
调度 数据库虚拟机 服务器
调度 客户管理系统 数据库虚拟机

智能运维图谱模型如下图所示。

如何将图数据库应用于企业智能运维_第2张图片

智能运维 - 故障定位

在运维管理中,运维人员发现某个站点无法显示网页信息,需要排查站点背后服务器、数据库等设备间的调度关系,定位故障所在。举例,在上文所建图模型中,我们将寻找“站点02”无法显示的问题可能出现在哪里,查询的流程图如下所示。

如何将图数据库应用于企业智能运维_第3张图片

查询语句

// 以P代指路径,查询站点“URL02”4度网络内所有调度关系
MATCH p = (n:站点{站点编号:'URL02'})-[r*1..4]->(m)
// 返回路径p,在画布查看站点“URL02”4度网络内所有调度关系
RETURN p

查询结果

如下图所示,画布显示站点“URL02”背后所有的设备调度关系,包括数据库虚拟机“DBVM04”、设备虚拟机“WEBVM02”、服务器“SERVER02”及储存区域网络“SAN01”等,在站点“URL02”的故障关系网内,运维人员对可能存在故障的设备进行逐一排查,精确定位故障所在。

如何将图数据库应用于企业智能运维_第4张图片

智能运维 - 影响分析

在运维管理中,设备间的调度关系十分复杂,我们对设备资产进行优化时,需要快速追溯基础架构内所有设备和关系,依此进行影响分析,确定优化方案。举例,在上文所建图模型中,我们将分析服务器“Server05”故障带来的影响范围,查询的流程图如下所示。

如何将图数据库应用于企业智能运维_第5张图片

查询语句

// 以p代指路径,查询依赖于服务器“Server05”的所有设备信息
MATCH p=(n3:存储区域网络)<-[r3]-(n2:服务器{服务器编号:"Server05"})<-[r2]-(n:服务器)<-[r]-(m)<-[r1]-(n1:站点) 
WITH p,m
// 找到设备信息后,查询受影响的数据库虚拟机和客户管理系统
OPTIONAL MATCH q=(m)<-[r4]-(n4:客户管理系统) 
// 返回服务器“Server05”出现故障后,受影响的关系网络
RETURN p,q

查询结果

如下图所示,可以看到和“服务器05”存在调度关系的的所有服务器、设备虚拟机、数据库虚拟机、站点和客户管理系统,如“服务器05”、站点“URL02”、客户管理系统“CRM01”等。当“服务器05”出现故障时,这些服务也可能会受到相应的影响,运维人员应对这些服务进行重点关注。

 如何将图数据库应用于企业智能运维_第6张图片

 结语

以上仅为智能运维图谱的简单展示,通过上述两个例子,可以看到图数据库能够抽取下游数据,将应用服务、基础设施、批次作业等之间的依赖关系以全局统一视角进行整合,打破运维人员之间的信息茧房问题,实现跨应用的精准故障定位和业务影响范围分析,实现智能运维。

后续,我们会在创邻科技微信公众号发布更多图数据库热点应用场景和前沿资讯,欢迎对图数据库感兴趣的同学关注。

你可能感兴趣的:(应用场景简介,图数据库,运维,galaxybase,创邻科技,大数据)