数仓模型构建流程

数据仓库的发展大致经历了这样的三个过程:

1. 简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所
   需要的汇总数据。大部分表现形式为数据库和前端报表工具。
3. 数据集市阶段:这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,
   能够提供对特定业务指导的数据,并且能够提供特定的领导决策数据。
4. 数据仓库阶段:这个阶段,主要是按照一定的数据模型,对整个企业的数据进行采集,整理,并且能够按照各个业务部门的需要,提供
   跨部门的,完全一致的业务报表数据,能够通过数据仓库生成对对业务具有指导性的数据,同时,为领导决策提供全面的数据支持。

通过数据仓库建设的发展阶段,我们能够看出,数据仓库的建设和数据集市的建设的重要区别就在于数据模型的支持。因此,数据模型的建设,对于我们数据仓库的建设,有着决定性的意义。

一般来说,数据模型的建设主要能够帮助我们解决以下的一些问题:

  • 进行全面的业务梳理,改进业务流程。
    1.在业务模型建设的阶段,能够帮助我们的企业或者是管理机关对本单位的业务进行全面的梳理。
    2.通过业务模型的建设,我们应该能够全面了解该单位的业务架构图和整个业务的运行情况,能够将业务按照特定的规律进行分门别类和程序化。
    3.同时,帮助我们进一步的改进业务的流程,提高业务效率,指导我们的业务部门的生产。
  • 建立全方位的数据视角,消灭信息孤岛和数据差异。
    1.通过数据仓库的模型建设,能够为企业提供一个整体的数据视角,不再是各个部门只是关注自己的数据。
    2.而且通过模型的建设,勾勒出了部门之间内在的联系,帮助消灭各个部门之间的信息孤岛的问题。
    3.更为重要的是,通过数据模型的建设,能够保证整个企业的数据的一致性,各个部门之间数据的差异将会得到有效解决。
  • 解决业务的变动和数据仓库的灵活性。
    通过数据模型的建设,能够很好的分离出底层技术的实现和上层业务的展现。
    当上层业务发生变化时,通过数据模型,底层的技术实现可以非常轻松的完成业务的变动,从而达到整个数据仓库系统的灵活性。
  • 帮助数据仓库系统本身的建设。
    1.通过数据仓库的模型建设,开发人员和业务人员能够很容易的达成系统建设范围的界定,以及长期目标的规划,从而能够使整个项目组明确当前的任务,
    2.加快整个系统建设的速度。

建模大致分为四个阶段:

  • 业务建模,这部分建模工作,主要包含以下几个部分:
    1.划分整个单位的业务,一般按照业务部门的划分,进行各个部分之间业务工作的界定,理清各业务部门之间的关系。
    2.深入了解各个业务部门的内具体业务流程并将其程序化。
    3.提出修改和改进业务部门工作流程的方法并程序化。
    4.数据建模的范围界定,整个数据仓库项目的目标和阶段划分。

  • 领域概念建模,这部分建模工作,主要包含以下几个部分:
    1.抽取关键业务概念,并将之抽象化。
    2.将业务概念分组,按照业务主线聚合类似的分组概念。
    3.细化分组概念,理清分组概念内的业务流程并抽象化。
    4.理清分组概念之间的关联,形成完整的领域概念模型。

    概念模型具体要求如下:
    数仓模型构建流程_第1张图片

  • 逻辑建模,这部分的建模工作,主要包含以下几个部分:
    1.业务概念实体化,并考虑其具体的属性。
    2.事件实体化,也就是所谓的事实,并考虑其属性内容。
    3.说明实体化,也就是所谓的维度,并考虑其属性内容。

    逻辑模型具体要求如下:
    数仓模型构建流程_第2张图片

  • 物理建模,这部分的建模工作,主要包含以下几个部分:
    1.针对特定物理化平台,做出相应的技术调整。
    2.针对模型的性能考虑,对特定平台作出相应的调整。
    3.针对管理的需要,结合特定的平台,做出相应的调整。
    4.生成最后的执行脚本,并完善之。

    物理模型具体要求如下:
    数仓模型构建流程_第3张图片
    其实简单点说,上面的模型设计流程大部分应用于DWD层,也就是事实维度层。通过建模,捋清逻辑,把业务落实到一张张表,并梳理表于表之间的关系。

你可能感兴趣的:(大数据,数据仓库)