我对过拟合的理解

1、什么是过拟合

就是训练出来的模型在训练集上表现很好,但是在测试集上表现较差的一种现象,如下图:

我对过拟合的理解_第1张图片

2、发生过拟合的主要原因

(1)数据有噪声

(2)训练数据不足,有限的训练数据

(3)训练模型过度导致模型非常复杂

3、如何防止

(1)获取和使用更多的数据(数据集增强)

(2)采用合适的模

(3)降低特征的数

(4)Dropout是在训练网络时用的一种技巧(trike),相当于在隐藏单元增加了噪声。Dropout 指的是在训练过程中每次按一定的概率(比如50%)随机地“删除”一部分隐藏单元(神经元)。所谓的“删除”不是真正意义上的删除,其实就是将该部分神经元的激活函数设为0(激活函数的输出为0),让这些神经元不计算而已
 

你可能感兴趣的:(机器学习,人工智能)