R语言学习笔记:模型选择(三)LASSO方法

红点代表均方误差和上下一倍标准差,均方误差越小模型越好;上方数量表明模型仍存在的自变量个数(不一定是单调递减)。第一条虚线处表明均方误差最小值;第二个虚线标出最低点的一倍标准差的位置,表示牺牲一倍标准差的情况下可以得到的最简单的模型

查看第一条竖线(MSE最小):lasso1.cv$lambda.min

查看第二条竖线:一倍标准误:lasso1.cv$lambda.1se

coef (lasso1.cv, s = "lambda.1se")


存在一定问题:没有显著性;结果是有偏的。实际操作当中常用的办法是使用lasso找出一组系数不为0的自变量后,再对这些自变量使用多元线性回归,即relaxed lasso。并且很少有人直接使用lasso作为预测模型,主要是通过lasso从自变量中筛选出相对重要的一些自变量

你可能感兴趣的:(R语言学习笔记:模型选择(三)LASSO方法)