Python机器学习——监督学习

机器学习

  • 监督学习
    • 1、分类学习
    • 2、回归分析

监督学习

利用一组带有标签的数据,学习从输入到输出的映射,然后将这种映关系应用到未知数据上,达到分类或回归的目的。

  • 分类:当输出是离散时,学习任务为分类任务。
  • 回归:当输出时连续时,学习任务为回归任务。

1、分类学习

  • 输入:一组有标签的训练数据(也称观察和评估),标签表明了这些数据(观察)的所署类别。
  • 输出:分类模型根据这些训练数据,训练自己的模型参数,学习出一个适合这组数据的分类器,当有新数据(非训练数据)需要进行类别判断,就可以将这组新数据作为输入送给学好的分类器进行判断。
  • 训练集:顾名思义用来训练模型的已标注数据,用来建立模型,发现规律。
  • 测试集:也是已标注数据,通常做法时将标注隐藏,输送给训练好的模型,通过结果与真实标注进行对比,评估模型的学习能力。
  • 精确率:精确率是针对我们预测结果而言的,(以二分类为例)他表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类,另一种就是把负类预测为正类。
  • 召回率:是针对我们原来的样本而言的,它表示的是样本中正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类,另一种就是把原来的正类预测为负类。

2、回归分析

回归:统计学分析数据的方法,目的在于了解两个或多个变数间是否相关、研究其相关方向与强度,并建立数学模型以便观察特定变数来预测研究者感兴趣的变数。回归分析可以帮助人们了解在自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。

你可能感兴趣的:(Python,python)