数仓沉淀-前言

    入数据仓库的坑也已经有6年了,从最早的ETL,到两个数据相关的应用,到最近的一个集市建设,经历不算丰富,但也有一些可以记下来作为总结的内容,因此这里立一个系列,作为自己几年来的总结。

    抛开具体的项目,我觉得需要总结沉淀的内容包括:

    1.技术类,包括数仓采用的平台,sql技能,分布式计算的调优等。这些是硬功夫,很容易体现表达出来。

    2.数仓建模,范式建模和维度建模,相对于技术类的技能,我认为建模方面很难准确的表达,更难以看几篇文章后上手操作。恐怕更多的是理解和经验吧

    3.数据质量、元数据管理、主数据管理。这几个方面相对于建模还是好理解一些的,也好操作一些。我早具体的集市建设中都有涉及,却是先根据一些平台工具进行实践,再学习具体理论的,顺序搞反了,以至于走了一些弯路,也错过不少自我提升的机会。

     这里大概列出了我认为需要总结的一些内容,而且后续整理时也未必严格按照这个顺序。只能算是一个没有顺序要求的大纲吧。

 

你可能感兴趣的:(数仓沉淀-前言)