随机决策森林中的 “mean decrease accuracy” 和 “mean decrease gini” 都是什么
最近写的系统需要用到随机决策森林,使用了一份网上的随机决策森林的包,这份代码实现的非常棒,速度非常快。但是遇到一个问题,训练好了一个随机决策森林后,我想知道在训练好的模型中,哪些feature是更具有代表性的,所以我统计了每棵树使用feature的频率,但是发现feature的使用频率都差不多。从频率上无法判断那些特征对模型的影响更大。在代码的实现注释中,我发现了这样两种指标:meandecrea