机器学习基础之《分类算法(3)—模型选择与调优》

作用是如何选择出最好的K值

一、什么是交叉验证(cross validation)

1、定义
交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成5份,其中一份作为验证集。然后经过5次(组)的测试,每次都更换不同的验证集。即得到5组模型的结果,取平均值作为最终结果。又称5折交叉验证
把训练集本身再分

2、分析
我们之前知道数据分为训练集和测试集,但是为了让从训练得到模型结果更加准确。做以下处理:
(1)训练集:训练集+验证集
(2)测试集:测试集
机器学习基础之《分类算法(3)—模型选择与调优》_第1张图片

你可能感兴趣的:(机器学习,机器学习)