机器学习——鸢尾花分类之网格搜索与交叉验证

(一)  交叉验证:

           交叉验证(Cross-validation)主要用于建模应用中,例如PCR、PLS回归建模中。在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。

机器学习——鸢尾花分类之网格搜索与交叉验证_第1张图片

        其实用小编的大白话来讲就是,将训练集单独拿出,分为n等分,然后拿出其中一份作为验证集,其余的作为训练集,最后我们想要的就是让每份都作为一次验证机,这样我们就会得到n个模型,也就是n个准确率,取平均值,那么这个平均值就是我们认为最可信的准确率。

(二)网格搜索

      (在这里小编就不给大家专业术语的解释了,直接用大白话了)

先介绍超参数,超参数就是我们可以手动更改的参数,k-近邻算法中的k值就是一个超参数。在算法代码中:

     这就是我们要手动调参的k

param = {"n_neighbors" : [3,5,10,7]}

之后我们就要与交叉验证联合使用,通过网格搜索,就会得到最贴切最可靠的k值。

注:网格搜索就是将我们设置的k值和我们得到的准确度一对一结合,得到最理想最精确的k值。

机器学习——鸢尾花分类之网格搜索与交叉验证_第2张图片

机器学习——鸢尾花分类之网格搜索与交叉验证_第3张图片

你可能感兴趣的:(深度学习,机器学习,神经网络)