阿里数据仓库实践分享

点击查看全文


数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

 

现场分享视频地址:https://v.qq.com/iframe/player.html?vid=v0547ee0whs&width=670&height=376.875&auto=0

基础

搭建数据仓库主要需要建模的能力,还要沉淀一些维度表。除此之外还要不断地挖掘数据,来把模型建得更好。





应该做的几件事

在得到活动数据后,要把这些数据投入到数据仓库中,并且做以下几件事:


用户或者实体的识别需要统一。


PC和无线端的数据打通。


围绕实体和跨业务间的事实数据打通。


重要事实表的维度冗余。


用户画像或客户画像。



有怎样的市场价值



目前我们已经积累了很多用户数据,这些数据都是非常宝贵的资源,我们基于这些数据做了一些开发利用。


搭建了数据仓库就可以把用户分析的数据用来做个性化推荐、定向营销、风控等等。


数据仓库的市场价值在于需求场景驱动的集市层建设,各集市之间垂直构建。


集市层深度挖掘数据价值,并需要能够快速试错。




以阿里金融在后台大数据中的运行过程为例,我们会从关系数据库中把用户相关的所有数据全部导入到MaxCompute中,然后记录用户的一些操作日志,比如登录过哪些网站、浏览过哪些商品,有怎样的喜好。还有一些其它数据,可能是从其它系统过来的。我们把这些数据做一个汇总分析,最终把这些数据导出到业务系统中,也有一个统计服务。这样当用户来进行征信贷款的时候,我们很快就可以定位到这个用户是否符合征信要求,并迅速进行审



点击查看全文

阿里数据仓库实践分享_第1张图片

你可能感兴趣的:(大数据,阿里云)