作为数据应用场景基石的数据模型应该如何构建?Smartbi来教你!

当业务体量到了一定程度,业务模型有了一定的稳定度,数据模型的构建就显得尤为重要。数据模型是保证数据口径统一、提升数据质量的核心,是后续快速高效迭代支持更复杂数据应用场景的基石。

那么,应该如何构建数据模型呢?

数据分析

01 确定模型主题

业务由很多场景组合而成,数据模型的构建需根据业务场景进行主题分类,所以如何确定主题分类呢,可参考如下几个原则:

每个主题都是最底层的原始主题,即衍生的指标都是基于这些主题域的数据计算得来的;

企业经营的业务组成模块可作为参考;

主题之间有一定的交叉衔接关联,但是呢,又需各领风骚,各自独立;

主题之间有依附关系,有些主题是基于更基础的主题衍生得来的。

02 基于确定的主题,梳理需求

需求梳理是核心,做好需求的梳理是很关键的,要做到以下几点:

已经发生的数据需求场景需全部囊括,记住是全部哦

未来可能会有哪些场景发生呢,亦需囊括。

那我们如何可以做好呢? 可以参考以下几种做法:

常用报表,整理已经产生过的所有报表需求;

临时数据,整理已经产生过的所有临时需求;

SOP流程,SOP流程是梳理需求的灵魂,掌握这个,是所有工作的核心,但如何把这个利用好呢,有个小技巧,把流程中每个环节可能需要看数据的度量值、维度全都穷举出来。

基于以上三步,整理出全部需要看数据的场景,再进行完整的系统性的梳理。

03 数据计算规则

这个环节是最最最需要细心和耐心的,一旦错误,整个数据模型就大打折扣

要做好,有几个难点需要特别注意:

杂:业务系统复杂多源,比如有营销系统、库存系统、结算系统等等;

多:数据来源表很多很多;

像:同一个指标,如损耗,在A系统和B系统都有,听起来貌似都是我们要的,那我们到底应该用哪个呢?他们有何不同?

04 数据验证

数据质量是数据应用的核心基础,数据验证是非常重要的一环,若质量把控不够严格,后续所有的行为都可能有偏差甚至错误,所以做好数据验证很关键。

上面介绍了数据模型的构建思路,那么我们要怎么落地呢?其实现在有的BI产品就已经可以构建数据模型了,并不需要依赖数据仓库。例如由广州思迈特软件推出的Smartbi V10就集成了数据模型功能,它使分析人员具有数据再加工的能力,自由调配“数据原料”,并由里及外,以点带面,极大提升了数据分析的灵活性,像艺术创作一样自由分析。

你可能感兴趣的:(数据挖掘人工智能)