机器学习-特征选择

1  选择出好的特征

1.1 去掉取值变化小的特征

1.2 单变量特征选择

单变量特征选择能够对每一个特征进行测试,衡量该特征和响应变量之间的关系,根据得分扔掉不好的特征,对回归和分类问题可以采用卡方检验等方式对特征进行测试。

1.2.1 Pearson 相关系数:衡量变量之间的线性相关性,理解特征和响应变量之间关系的方法。

1.2.2 距离相关系数:克服Pearson 相关系数的弱点而生的,有可能有非线性相关

1.3 基于学习模型的特征排序

针对每个单独的特征和响应变量预测模型,Pearson 相关系数等价于线性回归里的标准化回归系数,假如某个特征和响应变量之间的关系是非线性的,可以用基于树的方法,或者扩展的线性模型,

 

 

参考 https://www.jianshu.com/p/8043ae630d9c

你可能感兴趣的:(机器学习-特征选择)