XGBoost报错feature_names mismatch

我们在训练好XGBoost后实际应用时可能会报下面的错误:

feature_names mismatch: ['sex', 'age', 其他列名作者略去]

通常报这个错误就是因为在训练模型时输入的数据包含列名,那么在模型训练好后实际应用中你输入的待遇测数据也要包含列名,也就是待遇测的数据格式应该和训练数据保持一致,这个一致包括要有列名以及列的顺序

通常我们训练时输入的数据格式是pd.DataFrame类型,在我们用测试数据构建DataFrame类型时可以使用

x_data =[{'sex':1, 'age':23,......}]
x_data = pd.DataFrame(x_data)

此时构建的数据的列名是乱序的,为了保持列名顺序一致可以再做下排序:

即把列的顺序显式指定出来

x_data = x_data[['sex','age',......]]

这样最终得到的x_data数据就是按sex、age等依次排序的。

 

当然还有其他的指定顺序的方法,有兴趣的也可以自己尝试下。

你可能感兴趣的:(Machine,learning)