Xgboost使用问题集锦

Xgboost使用问题集锦

Xgboost是很强大的机器学习工具包,但作者陈天奇并没有太多的时间维护、更新。在使用Xgboost的时候,总会遇到很多玄妙、诡异的问题。本文旨在记录使用Xgboost时遇到的问题。

  • (1)在使用xgboost.DMatrix(data,label)转换数据集时,data应使用list类型,不应使用numpy.array类型。若将data转换为numpy.array类型,可能会有精度误差,对建模有影响,并且建模速度变慢。
  • (2)在将测试集和训练集转换为DMatrix时,如果测试集存在某特征取值全为0的情况,则转换后的测试集会剔除相应特征,从而会导致出现测试集和训练集维度不匹配的问题。
  • 待添加…………

你可能感兴趣的:(机器学习实战)