数据血缘是什么?数据血缘都解决哪些问题

数据血缘,即对Sugar BI中各资源涉及的数据流经路径进⾏跟踪,类似于追踪数据的「⾎缘关系」。 其可针对数据向下做影响分析或向上做溯源分析,有助于⽤户管理资源和排查问题。具体为:

  • 影响分析:了解资源(如数据源 / 数据表 / API / 数据模型 / SQL 模型等)被下游的使⽤情况,便于在更改资源时评估影响。
  • 溯源分析:对资源(如图表 / 数据模型)的错误 / 疑问进⾏溯源,查明根因。

您也可以点击下方链接进行免费试用:

Sugar BI

数据血缘

数据血缘支持两种查看方式:

  • 图形模式(通过关系图的形式,用节点与有向连接线的可视化方式,展示当前空间内的数据血缘关系)
  • 列表模式(通过列表的形式,展示当前空间内的数据血缘关系)

图形模式:

数据血缘是什么?数据血缘都解决哪些问题_第1张图片

列表模式:

数据血缘是什么?数据血缘都解决哪些问题_第2张图片

血缘信息同步

Sugar BI提供两种方式来同步系统中的数据血缘关系:

  • 自动同步(由系统自动同步数据,第一次进入空间时触发)
  • 手动同步(由用户手动同步数据,点击「同步血缘」按钮触发)

自动同步

当您首次进入某个原有空间时,并且该空间中存在已有的大屏,报表,数据填报等资源,但此时空间内还没有「数据血缘」资源数据,Sugar BI后台会自动创建同步任务,来同步当前空间内已有的资源数据,待同步任务执行完成,即可在「数据血缘」菜单查看到当前空间内所有资源的数据血缘。

当您新增资源时,例如,新创建一个大屏,在您点击「保存」的时候,Sugar BI后台会自动同步该大屏的资源数据,包括:数据源、数据模型、SQL 模型、API、图表等资源之间的依赖关系。

注意:空间内已有大屏、报表、数据填报的数据血缘自动同步有延时,一般为 1-10 小时后执行,新增大屏,报表,数据填报的数据血缘自动同步一般 1 分钟后执行。

手动同步

Sugar BI还提供了「手动同步」的方式,当您需要立即查看数据血缘或同步最新的资源数据,您可以点击「同步血缘」按钮,快速同步空间内的资源数据,待同步任务执行完成,即可在「数据血缘」菜单查看到当前空间内所有资源的数据血缘。

如下图:

点击「同步血缘」按钮,即可开始同步。

数据血缘是什么?数据血缘都解决哪些问题_第3张图片

数据的同步状态

当您进入「数据血缘」模块,如果有尚未完成的数据血缘同步任务,页面上方会给出提示,如下图:

数据血缘是什么?数据血缘都解决哪些问题_第4张图片

此时,数据可能存在偏差,您可以刷新页面以重新查看数据是否同步完成。

如果全部数据血缘均同步完毕,页面上将不再展示上图中的提示信息,此时,您将查看到当前空间内全部的数据血缘关系。

血缘信息查看

数据血缘概览

当您在空间内的「数据管理」菜单中,进入「数据血缘」,并且当前空间内的数据血缘同步任务已经全部执行完成,您将看到整个空间的数据血缘关系图和列表(默认以整个空间的数据模型为筛选条件),即当前空间内所有的数据模型资源,并以每个数据模型分别向上和向下溯源,展示每个数据模型的上下游数据血缘情况,包括:数据源、数据表、SQL 视图、数据模型、图表、过滤条件、数据填报组件、数据值映射、大屏、报表、三维模型、数据填报、轮播。可以通过关系图和列表查看到这些资源的相互依赖关系。

如下图:

数据血缘是什么?数据血缘都解决哪些问题_第5张图片

资源查询

点击左侧「选择资源」区域,可以设置筛选条件,查询某类或者某个具体资源的数据血缘关系,如下图:查看某个数据模型的数据血缘关系。

数据血缘是什么?数据血缘都解决哪些问题_第6张图片

图表级别节点的显隐

在「图形模式」中,您可以通过点击左侧图例,来筛选需要展示的资源类型。

注意:系统默认不展示图表、过滤条件、数据填报组件三类资源,如您需要查看,可以点击图例展示这三类资源。

数据血缘是什么?数据血缘都解决哪些问题_第7张图片

资源详情

点击数据血缘关系图中某个节点,可以查看该资源的详情信息,包括:名称、类型、路径、引用详情、创建者、创建时间、最近更新时间。

数据血缘是什么?数据血缘都解决哪些问题_第8张图片

对于大屏和报表,您还可以通过详情页面中的链接按钮跳转至浏览状态,方便查看。

数据血缘是什么?数据血缘都解决哪些问题_第9张图片

血缘信息导出

在列表模式下,您可以点击「导出 Excel」将数据血缘列表导出使用。

数据血缘是什么?数据血缘都解决哪些问题_第10张图片

你可能感兴趣的:(数据分析,大数据)