RFECV方法实现特征选择

RFECV方法实现特征选择分成两个部分:

  • RFE(Recursive feature elimination):递归特征消除,用来对特征进行重要性评级。
  • CV(Cross Validation):交叉验证,在特征评级后,通过交叉验证,选择最佳数量的特征。

具体过程如下:

  • RFE阶段
    1 初始的特征集为所有可用的特征。
    2 使用当前特征集进行建模,然后计算每个特征的重要性。
    3 删除最不重要的一个(或多个)特征,更新特征集。
    4 跳转到步骤2,直到完成所有特征的重要性评级。
  • CV阶段
    1 根据RFE阶段确定的特征重要性,依次选择不同数量的特征。
    2 对选定的特征集进行交叉验证。
    3 确定平均分最高的特征数量,完成特征选择。

你可能感兴趣的:(统计算法,数据分析,算法,python,数据分析)