课程下载地址:https://pan.baidu.com/s/1LuffQVoVjJjDkN3jT2TfQA 提取码: ytyc

本课程主要讲解Spark MLlib,Spark MLlib是一种高效、快速、可扩展的分布式计算框架;实现了常用的机器学习,如:聚类、分类、回归等算法。本课拒绝枯燥的讲述,将循序渐进从Spark的基础知识、矩阵向量的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark源码实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。

十大案例全方位剖析:
案例1、基于Kaggle的StumbleUpon数据集构建分类系统
案例2、基于BikeSharing数据集构建回归模型
案例3、基于NewsCorpora数据集文本处理新闻分类
案例4、基于KMeans网络流量检测模型
案例5、基于Kaggle Avazu广告数据集构建CRT预测模型
案例6、基于聚类KMeans出租车轨迹分析
案例7、基于决策树预测森林植被
案例8、基于DataFrame API ML预测森林植被
案例9、基于Audioscrobbler数据集的音乐推荐
案例10、基于MovieLens数据集的电影推荐