[机器学习、Spark]Spark MLlib机器学习

‍‍博主:发量不足

本期更新内容:Spark MLlib机器学习算法库

下篇文章预告:Spark机器学习库MLlib的概述

简介:分享的是一个当代疫情在校封校的大学生学习笔记

目录

初始机器学习

一. 什么是机器学习

二.机器学习的应用


9633f3bb7c3643d0a6989e51c0470ac6.gif#pic_center

 

初始机器学习

一. 什么是机器学习

机器学习是一门多领域的交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能.重新组织已有的知识结构使之不断改善自身的性能。

[机器学习、Spark]Spark MLlib机器学习_第1张图片

机器学习分为2类:

(1)有监督学习

通过已有的训练样本(即已知数据以及其对应的输出)训练得到一个最优模型,再利用这个模型将所有的输人映射为相应的输出,对输出进行简单的判断从而实现分类的目的。如分类、回归和推荐算法都属于有监督学习。

(2)无监督学习

针对类别未知(没有被标记)的训练样本,需要直接对数据进行建模,人们无法知道要预测的答案。如聚类、降维和文本处理的某些特征提取都属于无监督学习。

二.机器学习的应用

机器学习强调3个关键词:算法.经验和性能

机器学习技术和方法已经被成功应用到多个领域,如个性化推荐系统计算机视觉、语音识别.自然语言处理以及智能机器控制等领域。

机器学习应用的常见领域:

1.电子商务 2.医疗3.金融

[机器学习、Spark]Spark MLlib机器学习_第2张图片

 

你可能感兴趣的:(Scala,机器学习,大数据,机器学习,算法,spark)