2020-04-01 二手车交易价格预测 task3 建模与调参总结

总结一:为了得到和SVD一样的投射,需要在PCA中将数据转换成零均值。

总结二:L1范数和L2范数均可以降低过拟合风险;

               L1正则化值是模型中各个参数绝对值之和;

                L2正则化表示各个参数平方和的开方值;

                引入L2范数防止过拟合,被称为岭回归,将L2范数换成L1范数后,称为LASSO;

                L1和L2范数均有助于降低过拟合风险,但L1范数更易获得稀疏解,即具有更少的非零分量。

总结三:过拟合表现为高方差,低偏差;

                欠拟合表现为低方差,高偏差。

总结四:k折交叉验证不是k越大,就越好,大的k值会增加评估时间;

                更大的k值意味着更小的偏差,因为训练集更加接近总数聚集;

                选择k值时,要最小化数据集之间的方差。

总结五:可以有效解决过拟合的方法:增加样本数量;通过特征选择减少特征数量;正则化。

你可能感兴趣的:(2020-04-01 二手车交易价格预测 task3 建模与调参总结)