数据仓库建设之主题划分

今天聊一下数仓主题设计,其实不同行业不同领域模型设计的都有些不同,本次主要整理一下工作以来遇到的几种典型案例。

关于主题:

数据仓库中的数据是面向主题组织的,主题是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域。如财务分析就是一个分析领域,因此这个数据仓库应用的主题就为“财务分析”。

关于主题域:

主题域通常是联系较为紧密的数据主题的集合。可以根据业务的关注点,将这些数据主题划分到不同的主题域(也说是对某个主题进行分析后确定的主题的边界。)

关于主题域的划分:

主题域的确定必须由最终用户和数据仓库的设计人员共同完成的, 而在划分主题域时,大家的切入点不同可能会造成一些争论、重构等的现象,考虑的点可能会是下方的某些方面:

1、按照业务或业务过程划分:比如一个靠销售广告位置的门户网站主题域可能会有广告域,客户域等,而广告域可能就会有广告的库存,销售分析、内部投放分析等主题;
2、根据需求方划分:比如需求方为财务部,就可以设定对应的财务主题域,而财务主题域里面可能就会有员工工资分析,投资回报比分析等主题;
3、按照功能或应用划分:比如微信中的朋友圈数据域、群聊数据域等,而朋友圈数据域可能就会有用户动态信息主题、广告主题等;
4、按照部门划分:比如可能会有运营域、技术域等,运营域中可能会有工资支出分析、活动宣传效果分析等主题;

总而言之,切入的出发点逻辑不一样,就可以存在不同的划分逻辑。在建设过程中可采用迭代方式,不纠结于一次完成所有主题的抽象,可先从明确定义的主题开始,后续逐步归纳总结成自身行业的标准模型。

1.数据仓库金融行业数据逻辑模型Teradata FS-LDM

ps:数仓启蒙的经典示例

FS-LDM是一个成熟产品,主要支持保险、银行及证券,包含十大主题:当事人、产品、协议、事件、资产、财务、机构、地域、营销、渠道。


数据仓库建设之主题划分_第1张图片

什么是LDM?
逻辑数据模型LDM是数据仓库的数据建设阶段为解决业务需求而定义的数据仓库模型解决方案,它是指导数据仓库进行数据存放、数据组织、以及如何支持应用的蓝图,定义需要追踪和管理的各种重要实体、属性、关系。

2.IBM BDWM (Banking Date Warehouse Model)
IBM 银行九大主题模型数据仓库建设之主题划分_第2张图片

3.某汽车行业互联网公司
数据仓库建设之主题划分_第3张图片

4.某主机厂
数据仓库建设之主题划分_第4张图片

5.电商
数据仓库建设之主题划分_第5张图片

你可能感兴趣的:(数据仓库,数据仓库,big,data,etl)