博主:发量不足
本期更新内容:Spark MLlib机器学习算法库
下篇文章预告:Spark机器学习库MLlib的概述
简介:分享的是一个当代疫情在校封校的大学生学习笔记
目录
初始机器学习
一. 什么是机器学习
二.机器学习的应用
机器学习是一门多领域的交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能.重新组织已有的知识结构使之不断改善自身的性能。
机器学习分为2类:
(1)有监督学习
通过已有的训练样本(即已知数据以及其对应的输出)训练得到一个最优模型,再利用这个模型将所有的输人映射为相应的输出,对输出进行简单的判断从而实现分类的目的。如分类、回归和推荐算法都属于有监督学习。
(2)无监督学习
针对类别未知(没有被标记)的训练样本,需要直接对数据进行建模,人们无法知道要预测的答案。如聚类、降维和文本处理的某些特征提取都属于无监督学习。
机器学习强调3个关键词:算法.经验和性能
机器学习技术和方法已经被成功应用到多个领域,如个性化推荐系统计算机视觉、语音识别.自然语言处理以及智能机器控制等领域。
机器学习应用的常见领域:
1.电子商务 2.医疗3.金融