数仓搭建第四步——主题域划分

        首先谈一谈什么是主题,顾名思义一篇文章,一个会议,一件事情都是有主题的。用来概括一类事情,让其他人可以快速了解你所想表达事物的整体框架。那么数仓的主题也是这个意思,用来概括公司某一类业务或者是某一种渠道等。

        为什么要给数仓划分主题呢,这要从数仓的整体架构和方法论去谈。人们做一件事一段时间后都会针对某一类事情进行总结。此后会对期产生方法论,然后人可以快速解决这一类问题。

        那么数仓产生的方法论就是将具体问题步骤化,类别化,层次化。

        这其中就涵盖了主题域的划分,划分主题域有利于区分数据在某一种类别或渠道的不同,让整个数仓架构清晰化,便于后期对数据的利用与开发。

        怎样划分主题域,一般会根据公司不同的业务线划分不同的大的主题域,再根据不同业务线的不同渠道或者不同品类在进行细的主题的划分,一般会划分两到三级主题。

        举个例子:

        在线教育公司:

        大的主题可以按业务线划分为:

                大学生教育、职业教育、考公教育、文娱教育、老年教育等

        二级主题可以按业务线的流程来划分:

                投放、订单、支付、售后等等

        当然上述只是主题划分方法的一种,公司之间的业务和流程有很大不同,就算是竟品公司也会有不相同之处,这里只是给予一个大致的思路,具体的划分还需要根据公司现状进行判断。

你可能感兴趣的:(大数据之路,大数据,数据仓库,数据库)