lightgbm类别预测的一些问题

    lightgbm在作类别预测的时候,有一些不同的使用方法
 

import lightgbm as lgb

#第一种
estimator=lgb.sklearn.LGBMClassifier()
estimator.fit(x_train,y_train)      #x_train和y_train 是numpy或pandas数据类型即可
pre = estimator.predict(x_test)     #返回的是类别

#-----------------------------------------
#第二种
lgtrain = lgb.Dataset(X_train,label = y_train)

lgb.train(lgtrain)                 #此时的训练数据需要为 lgb的数据类型
pre = lgb.predict(x_test)          #此时返回的是对每类的预测概率,需要自行转化为类
                                   #假设训练数据有N个,类别为n个,则pre是一个N*n的np.array
y_test = np.argmax(pre,axis = 1)   #转化为类别

#-------------------------------------
#在lgb.cv()中,得出的结果仍然是概率,但是这时是一个 Nn*1的np.array,此时转化方法如下
#概率转化为类别,num_class 为类别的种类
pre = np.argmax(pre.reshape(num_class, -1),axis=0)    

#因此 如果需要自定义评价函数,也需要先自行转化
def evalerror(preds, lgtrain):
    from sklearn.metrics import f1_score
    import numpy as np

    preds = np.argmax(preds.reshape(num_class, -1),axis=0)
    label = lgtrain.get_label()
    esult = f1_score(preds,label,average = 'macro')
    return 'f1_score',result,True

      

你可能感兴趣的:(学习笔记)