数据产品设计专题(5)- 分布式数据仓库技术架构

一、分布式数据仓库技术架构

 

二、核心内容解读

 (1)分布式数据仓库存储技术:hive+hdfs;

 (2)事实计算平台技术框架:spark;

 (3)数据挖掘算法技术框架:mllib + sparkR

 

你可能感兴趣的:(数据产品设计专题(5)- 分布式数据仓库技术架构)