第一章 spark2.3 mllib机器学习简介

本系列”spark mllib机器学习”,均以最新spark2.3.0版本为蓝本进行编写,参考书籍<< spark mllib机器学习 >>黄美灵版,转载请注明出处
GitHub地址:https://github.com/future-fu/learnsparkmllib

目录

  1. 机器学习介绍
  2. spark介绍
  3. spark mllib介绍

明细

1.机器学习介绍

机器学习框架
第一章 spark2.3 mllib机器学习简介_第1张图片

机器学习分类

第一章 spark2.3 mllib机器学习简介_第2张图片
常见的机器学习算法如下:

  • 分类与回归–线性回归,逻辑回归,贝叶斯分类,决策树分类
  • 聚类–k-means,LDA主题,KNN
  • 关联规则–Apriori,FPGrowth
  • 推荐系统–协同过滤,ALS
  • 神经网络–BP,SVM,RBF
  • 深度神经网络–DNN,CNN

2.Spark介绍

spark简单说明一下,既然学到mllib,想必core ,sql, streaming都比较熟悉了;
mllib是机器学习库,里面提供各种各样的算法,可以用来在集群上针对分类,聚类,协同过滤进行计算;
GraphX是一个图计算库,用来处理图,执行基于图的并行操作,一般用的较少;

3.Spark Mllib介绍

第一章 spark2.3 mllib机器学习简介_第3张图片

☆┈━═┈━═┈━═┈━═┈━═☆因为您的赞赏,您会读到更多优质文章☆┈━═┈━═┈━═┈━═┈━═☆
这里写图片描述

你可能感兴趣的:(spark2,sparkmllib)