面试官:说一下数仓宽表的优缺点吧

​群友爆料,经常面试会遇到面试官问宽表优缺点的问题,问法也是有所不同

 

  • 说一下数仓宽表的优缺点吧?

  • 你们公司宽表用起来感觉怎么样,遇到什么问题吗?

  • 你们为什么要设计成宽表呢?

 

一  什么是宽表

 

  •       宽表,通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。

     

  •       在数据仓库建设中,组织相关和相似数据,采用明细宽表,复用关联计算,减少数据扫描,提高明细数据表的易用性

     

  •        在汇总数据层,加群指标的维度退化,采取更多的宽表化手段构建公共指标数据层,提升公共指标的复用性,减少重复加工。

 

二 优点

 

  • 提高查询性能

  • 快速响应

  • 方便使用,降低使用成本

  • 提高用户满意度

 

 

三 缺点

 

       由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余

 

      另外就是灵活性差,就比如说线上业务表结构变更,宽表模式改造量也比较大

 

       开发宽表为了避免宽表重复迭代,我们应该去了解业务全流程,得需要知道需扩展哪些维度,沉淀哪些指标,这样就流程会比较长,特别是有些业务快速迭代的话,就有点捉襟见肘

 

2020大数据面试题真题总结(附答案)

一文探究数据仓库体系(2.7万字建议收藏)

一文探究Hadoop(3万字长文,建议收藏)

一文带你走进HIVE的世界(1.8W字建议收藏)

一文带你全方位了解Flink(3.2W字建议收藏)

你要悄悄学会HBase,然后惊艳所有人(1.7万字建议收藏)

一文带你深入了解kafka并提供52道企业常见面试题(1.8W字建议收藏)

非常全面的DolphinScheduler(海豚调度)安装使用文档

Hive调优,数据工程师成神之路

数据质量那点事

简述元数据管理

简单聊一聊大数据学习之路

 

 

你可能感兴趣的:(数据仓库,Hive)