实时数仓分层介绍

ODS: 原始数据,日志和业务数据。可通过Kafka进行收集。
DWD: 根据数据对象为单位进行分流,比如订单、页面访问等等。可存储在Kafka中。
DIM: 维度数据。可存储在HBase中。
DWM: 对于部分数据对象进行进一步加工,比如独立访问、跳出行为,也可以和维度进行关联,形成宽表,依旧是明细数据。
DWS: 根据某个主题将多个事实数据轻度聚合,形成主题宽表。 可存储在Doris、ClickHouse、Elasticsearch中。
DM/ADS: 把Doris/ClickHouse中的数据根据可视化需进行筛选聚合。 一般不存储,进行MPP计算。

你可能感兴趣的:(大数据,flink,架构,kafka,big,data,分布式,数据仓库)