5、模型的欠拟合和过度拟合

微调您的模型以获得更好的性能。

本课程所需数据集夸克网盘下载链接:https://pan.quark.cn/s/9b4e9a1246b2
提取码:uDzP

文章目录

  • 1、使用不同模型进行实验
  • 2、示例
  • 3、结论

在这一步结束时,您将了解拟合不足和拟合过度的概念,并且您将能够应用这些想法使您的模型更加准确。

1、使用不同模型进行实验

现在你有了一种可靠的方法来测量模型的准确性,你可以尝试其他模型,看看哪种模型能给出最好的预测。但是,你有什么模型的替代品?

您可以在 scikit-learn’s 文档 中看到,决策树模型有很多选项(比您通常想要或需要的选项更多)。 最重要的选项决定了树的深度。回想一下本课程的第一节课,树的深度是在进行预测之前进行多少次拆分的度量。这是一棵相对较浅的树
5、模型的欠拟合和过度拟合_第1张图片

在实践中,一棵树的顶层(所有房屋)和一片叶子之间有10个裂缝并不罕见。随着树越来越深,数据集被切成房屋越来越少的叶子。如果一棵树只有一个分支,它会将数据分为两组。如果每组再分开,我们会得到4组房子。再次将其中的每一个分组将创建8个组。如果我们通过在每个级别添加更多拆分来将组的数量增加一倍,我们将有210个当我们到达第10层时,会有一组房子。这是1024片叶子。

当我们把房子分成许多叶子时,每片叶子上的房子也会更少。房屋很少的树叶会做出与这些房屋的实际值非常接近的预测

你可能感兴趣的:(从零开始的机器学习导论,机器学习)