机器学习(笔记三)

机器学习算法分类

根据数据集组成不同,可以把机器学习算法分成:
(1)监督学习
(2)无监督学习
(3)半监督学习
(4)强化学习

1.监督学习
输入的数据是由输入特征值和目标值所组成
函数输出可以是一个连续的值(称为回归)
函数输出的是个有限个离散值(称作分类)

(1)回归问题
预测房价
机器学习(笔记三)_第1张图片
(2)分类问题、
根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的。
机器学习(笔记三)_第2张图片
2.无监督学习
输入数据是由输入特征值组成

输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类,clustering)试图使类内差距最小化,类间差距最大化。

机器学习(笔记三)_第3张图片

总结

监督学习(supervised learning)(预测)

定义:输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。

In:有标签,Out:有反馈

目的:预测结果

案例:猫狗分类,房价预测

分类 k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络

回归 线性回归、岭回归

无监督学习(unsupervised learning)

定义:输入数据是由输入特征值所组成。

In:无标签,Out:无反馈

目的:发现潜在结构

案例:“物以类聚,人以群分”

聚类 k-means,降维

半监督学习

已知:训练样本Data和待分类的类别

未知:训练样本有无标签均可

应用(案例):训练数据量过多时,

监督学习效果不能满足需求,因此用来增强效果。

强化学习

In:决策流程及激励系统,Out:一系列行动

目的:长期利益最大化,回报函数(只会提示你是否在朝着目标方向前进的延迟反映)

案例:学下棋

算法:马尔科夫决策,动态规划

你可能感兴趣的:(笔记,随记)