【机器学习】欠拟合与过拟合

【机器学习】欠拟合与过拟合_第1张图片
过拟合:模型在训练数据上表现良好对不可见数据的泛化能力差。

欠拟合:模型在训练数据和不可见数据上泛化能力都很差。

欠拟合常见解决办法

(1)增加新特征,可以考虑加入特征组合、高次特征,以此增大假设空间。

(2)添加多项式特征,这个在机器学习算法里用得很普遍,例如将线性模型通过添加二次项或者三次项使模型泛化能力更强。

(3)减少正则化参数,正则化的目的是用来防止过拟合,但是模型出现了欠拟合,则需要减少正则化参数。

(4)使用非线性模型,例如支持向量机、决策树、深度学习等模型。

(5)调整模型的容量(Capacity),通俗地讲,模型的容量是指其拟合各种函数的能力。

(6)使用集成学习方法,如使用Bagging,可将多个弱学习器Bagging。

过拟合常见解决办法

(1)使用权值衰减的方法,即每次迭代过程中以某个小因子降低每个权值。

(2)选取合适的停止训练标准,使对机器的训练在合适的程度。

(3)保留验证数据集,对训练成果进行验证。

(4)获取额外数据进行交叉验证

(5)正则化,即在进行目标函数或代价函数优化时,在目标函数或代价函数后面加上一个正则项,一般有L1正则与L2正则等。

你可能感兴趣的:(WEL测试,人工智能,机器学习,人工智能,欠拟合,过拟合)