线性回归 lasso和ridge的权衡

https://www.analyticsvidhya.com/blog/2017/06/a-comprehensive-guide-for-linear-ridge-and-lasso-regression/

假设目前你有一个大的数据集,有一万个特征,那么,你究竟应该是用lasso还是ridge?


如果用ridge,会保留所有的特征,只是特征的系数变小,模型仍然很复杂,有一万个特征,从而模型效果很差。


如果使用lasso,lasso的主要问题是,当变量之间相关时,它只保留一个变量,然后其他相关的变量为0,这可能会导致信息丢失,从而模型的精确性下降。

 

你可能感兴趣的:(线性回归 lasso和ridge的权衡)