Xgboost需要做one-hot编码吗?

决策树模型 不推荐 对离散特征进行one-hot,本质原因:

  • 特征的预测能力被人为的拆分成多分,每一份与其他特征竞争最优划分节点时都会失败,所以特征的重要性会比实际值低。
  • 如果类别特征比较多的话,可以去使用CatBoost
  • 如果想用one-hot试验的话可以使用类别数量小的。

你可能感兴趣的:(Xgboost需要做one-hot编码吗?)