1、数仓模型概述

1、问:什么是数据模型?

        数仓领域中的模型指的是数据模型,要和商业分析中的模型不同

        数据模型就是数据组织存储方法,它强调从业务数据存取使用的角度合理的存储数据


2、问:模型和表的区别?

        表是数据物理的载体

        模型在表的基础是赋予了业务含义,对业务过程的抽象,承接了底层业务系统和上层分析需求


3、问:为什么要数据建模?

        数仓的目的是为了整合和管理企业中的数据,建模是整合和管理数据的具体手段

        将数据进行有序有结构分类组织存储

                如果把数据看做 图书馆里书,希望书籍是按类别放置

                                          城市的建筑,希望城市规划更合理

                                          电脑中的文件,希望文件更好的放置


4、问:良好的数据模型 能够给数据仓库带来那些好处?

1、数仓模型概述_第1张图片


5、问:什么是维度模型/维度建模

        维度模型是一种经典的 数据仓库建模方法论,它指导我们应该如何去构建数据模型

                它从 分析决策的需求出发来构建模型,为分析需求服务

                它关注的重点是 用户如何快速的完成分析需求,同时具有较好的大规模复杂查询的响应性能

        它的典型模型有:星型模型、雪花模型


6、如何使用维度模型来构建数据模型?

        1、选择 要分析的 业务过程

        2、选择粒度

        3、选择维度

        4、选择事实

        5、选择要退化的维度


7、什么是`OneData`?

        OneData概念出现在《大数据之路:阿里巴巴大数据实践》中,是阿里提出的一套

        集团数据整合及管理的方法体系(也就OneData),包括三个部分

                一致性的指标体系、模型设计方法体系、配套的工具

你可能感兴趣的:(数据仓库建设与企业案例,spark,大数据,分布式)