拉链表概述

介绍

数据仓库中有一种数据存储模型,用于维护历史状态以及最新状态,反映某一Key的历史变化演进过程,该种模型叫做缓慢变化维,简称SCD(Slowly Changing Dimensions),通常所说的拉链表其实属于缓慢变化维的一种实现方式,拉链表通过增加一列维度信息维护拉链状态,他们之间稍微有所不同,具体区别如下:

相同点:

缓慢变化维度,简称SCD (Slowly Changing Dimensions)和拉链表都是为了存储非静态数据的历史变化状态。

不同点:

拉链表有开链和闭链过程,总一条数据明确表示最新状态(例如常见的 end_date=9999-12-31 00:00:00),针对的大都是事实表。

缓慢变化维,没有开链与闭链过程,只是单纯的记录数据的变化过程,解决的也都是维度表的存储,反映维度的数据历史演进过程。

具体举例如下:

缓慢变化维

套餐类型 通话时间(举例) 创建时间 更新时间
A01 400分钟 2019年12月31日 2019年12月31日
A02 600分钟 2019年12月31日 2019年12月31日
A01 800分钟 2019年12月31日 2019年12月31日

你可能感兴趣的:(数据仓库,大数据企业级实战,大数据,数据仓库,拉链表)