拉链表...

目录

什么是拉链表

拉链表的作用

拉链表的形成


什么是拉链表

一张表存储的每一条信息就是一条记录的一个生命周期,这样的表格即为拉链表。

拉链表的作用

用于记录一些 会发生变化但是变换频率不高的数据。比如某人的某个手机号使用情概况

通过对于日期的筛选可以看到某个日期的全部数据切片

拉链表的形成

1.起始的第一天的全部数据导入到,拉链表中,开始时间为当天日期,结束时间99999代表仍在使用的状态 

拉链表..._第1张图片

2.接着第二天的新增及改变数据全部为,最新状态,结束时间应为99999,起始日期为当天

同时对比前一天的数据,发生改变的数据在今天的数据表中修改,结束时间从99999改为今天。意味着这条记录过期了,使用时间就是起始日期到今天,依次类推

拉链表..._第2张图片

在业务表中的示意图如下

拉链表..._第3张图片 

 最近一直在看表,建表。hive没学只能无脑建表和抄脚本,实在没啥好写的了。就先这样

你可能感兴趣的:(大数据,hdfs)