【机器学习】模型的过拟合,欠拟合以及评估方法

写在前面

最近开始学习机器学习了,选用的参考书是周志华老师的《机器学习》,书的内容由浅入深,我看了书之后才发现原来机器学习就是我一直在找的有意思,上限高的工具,接下来我也将分享我的学习历程。

正文

具体内容在我的古月居博客:
【机器学习】模型的过拟合,欠拟合以及评估方法

经验误差

我将设计出来的机器学习算法称为学习器,将训练集喂给学习器,通过学习器生成的最终输出就是模型。
学习器用我的算法进行不停的优化迭代,从而积累经验,这也可以认为是一个参数整定的过程,但是,如果算法有缺陷或者说训练集包含的情况不够全面的时候,让模型去判断训练集内的样本的时候也有可能出错,这种误差就叫做经验误差

欠拟合与过拟合

接下来我将依托图像识别讲解相关概念

欠拟合

【机器学习】模型的过拟合,欠拟合以及评估方法_第1张图片
模型欠拟合的时候会发生的情况
【机器学习】模型的过拟合,欠拟合以及评估方法_第2张图片

过拟合

正常识别
【机器学习】模型的过拟合,欠拟合以及评估方法_第3张图片
过拟合识别
【机器学习】模型的过拟合,欠拟合以及评估方法_第4张图片
上面的过拟合原因就是因为模型将红牛的形状识别成了红牛的特有特征,所以形状类似的雪花就被识别成了红牛

评估方法

接下来我也将依托图像识别讲解相关概念
假设样本集合为数据集,用来训练学习器的图片集合是训练集,用来测试模型训练情况的图片集合是测试集,训练集和测试集都是从数据集中取出来的
评估方法的目的是为了评价模型的输出结果的,但是这里面可能有些问题需要解决,那就是如何保证训练集和测试集里的图片是相互独立的情况下,他们的分布情况是相同的呢?接下来我来介绍一些方法

留出法

图片描述

【机器学习】模型的过拟合,欠拟合以及评估方法_第5张图片

交叉验证法

图片描述

【机器学习】模型的过拟合,欠拟合以及评估方法_第6张图片

可重复采样

【机器学习】模型的过拟合,欠拟合以及评估方法_第7张图片

正文

具体内容在我的古月居博客:
【机器学习】模型的过拟合,欠拟合以及评估方法


疯狂明示,这次一定

在这里插入图片描述

你可能感兴趣的:(机器学习,机器学习)