12. 数据仓库分层

为什么要分层


  1. 把复杂问题简单化。
  2. 减少重复开发。
  3. 隔离原始数据。
作用
ODS层 原始数据层。存放原始数据,不对数据进行任何处理。
DWD层 明细数据层。使得结构和维度与原始数据保持一致。
DWS层 服务数据层。对数据进行轻度汇总。
ADS层 数据应用层。为各种数据提供报表服务。

各层详细说明


  1. ODS层:存放原始数据,直接加载原始日志、数据。
    ods_start_log    ods_event_log

  2. DWD层:对ODS层数据进行清洗(去除空值,脏数据等)。
    dwd_start_log    dwd_base_event_log    dwd_display_log
    dwd_newsdetail_log    dwd_loading_log    dwd_comment_log
    dwd_error_log    dwd_ad_log    dwd_praise_log等等。

  3. DWS层:进行轻度汇总,例如当日用户数、当日设备数等等。
    dws_start_log    dws_display_log    dws_ad_log
    dws_newsdetail_log    dws_error_log等。

  4. ADS层:为报表提供数据。
    ads_uv_detail_day    ads_uv_detail_wk    ads_uv_detail_mn等

你可能感兴趣的:(数据仓库)