数仓知识05:事实表和维度表的概念

数仓中通常有两种表:事实表、维度表,这两种表是什么含义,有哪些区别,今天进行讲解。

  • 事实表

数据仓库架构中的中央表,它包含联系事实与维度表的数字度量值和键。事实数据表包含描述业务(如银行事务或产品销售)内特定事件的数据。

  • 维度表

数据仓库中的表,其条目描述事实数据表中的数据。维度表包含创建维度所基于的数据。

举个实际的例子。银行对存款记账,A表中存放实际数据,包括账号、所属机构号、存款金额等,B表存放机构号和机构名称的对应关系。则A是事实表,B是维表。

其他说明:

每个数据仓库都包含一个或者多个事实数据表。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与维度表中对应项的相关索引字段之外的任何数据。 

一般来说,一个事实数据表都要和一个或多个维度表相关联,用户在利用事实数据表创建多维数据集时,可以使用一个或多个维度表。

维度表是从事实表中抽离出来的分析粒度,在数据建模时,最好是分清事实表和维度表,对于后期的分析思路以及模型理解非常重要,也会降低信息冗余,提升运算速度。

参考资料:

百度百科:事实表

百度百科:维度表

事实表和维度表

你可能感兴趣的:(数据仓库,数据仓库)