尚硅谷线上问诊离线数仓项目

本套项目教程以线上问诊为基础业务,真实还原了线上问诊平台对于用户数据的分析和统计,并以大屏展示的方法呈现数据分析的结果。

项目共分四大部分:数仓建模原理介绍、数仓模型搭建、DolphinScheduler全流程调度、SuperSet可视化大屏展示,以线上问诊采集项目为前置基础,使用线上问诊采集项目的基础架构,将数据导入数仓中,对数据进行系统化的分析计算,最终得到指标需求结果。

尚硅谷线上问诊离线数仓项目_第1张图片

​项目中使用的框架包括:Hadoop、Hive、Spark、Kafka、Flume、Flink-CDC、Datax、DolphinScheduler、SuperSet等。通过本套视频教程的学习,你将彻底了解数仓建模理论体系,深入认识线上问诊平台的业务理论体系!

 

你可能感兴趣的:(大数据,数据仓库,big,data)