机器学习分类及有监督学习相关概念

机器学习的方法

机器学习的方法是基于数据产生的"模型"(model)的算法,也称"学习算法"(learning algorithm)。

机器学习的分类

包括有监督学习(supervised learning)、无监督学习(unsupervised learning)、半监督学习(semi-supervised learning)、强化学习(reinforcement learning)。

有监督学习

指对数据的若干特征与若干标签(类型)之间的关联性进行建模的过程;只要模型被确定,就可以应用到新的未知数据上。这类学习过程可以进一步分
为「分类」(classification)任务和「回归」(regression)任务。在分类任务中,标签都是离散值;而在回归任务中,标签都是连续值。

无监督学习

指对不带任何标签的数据特征进行建模,通常被看成是一种“让数据自己介绍自己” 的过程。这类模型包括「聚类」(clustering)任务和「降维」(dimensionality reduction)任务。聚类算法可以将数据分成不同的组别,而降维算法追求用更简洁的方式表现数据。

半监督学习

半监督学习(semi-supervised learning)方法, 介于有监督学习和无监督学习
之间。通常可以在数据不完整时使用。

强化学习

强化学习不同于监督学习,它将学习看作是试探评价过程,以"试错" 的方式进行学习,并与环境进行交互已获得奖惩指导行为,以其作为评价。此时系统靠自身的状态和动作进行学习,从而改进行动方案以适应环境。

有监督学习相关概念解析

回归问题

在有监督学习过程中,当输出变量均为连续变量时,预测问题称为回归问题;

分类问题

当输出变量为有限个离散变量时,预测问题称为分类问题。

样本

比如:每一杯酒称作一个「样本」,十杯酒组成一个样本集。

特征

酒精浓度、颜色深度等信息称作「特征」。这十杯酒分布在一个多维特征空间中。

「输入」及「输入空间」

进入当前程序的“学习系统”的所有样本称作「输入」,并组成「输入空间」。

「输出」及「输出空间」

在学习过程中,所产生的随机变量的取值,称作「输出」,并组成「输出空间」。

你可能感兴趣的:(Python,机器学习,算法)