ROC曲线越接近纵轴,模型预测精度越高,能直观地表现模型精度。用sklearn里面的roc_curve()函数,就能一键计算FPR和TPR,快速生成ROC曲线啦。
先复习一下ROC曲线的构成:X轴代表假阳率,Y轴代表真阳率。我们要得到的值就是预测对的TPR、和预测错FPR的两组值。
模型准备:
思路是:先把模型训练好,生成测试集的结果y_test_proba备用。接着用roc_curve(),计算FPR和TPR,以及生成ROC曲线。
import lightgbm as lgb
model_lgb = lgb.LGBMClassifier().fit(X_train, y_train)
y_test_proba = model_lgb.predict_proba(X_test)[:, 1]
ROC曲线的绘制:
import matplotlib.pyplot as plt
from sklearn.metrics import roc_curve
fpr, tpr, thresholds = roc_curve(y_test, y_test_proba)
plt.plot(fpr, tpr)
代码讲解:
matplotlib指绘图的包;
roc_curve是sklearn里面计算ROC曲线的函数,能返回FPR(假阳率)、TPR(真阳率)、和用于确定真正率和假正率的阈值;
fpr, tpr, thresholds 是我们自定义的参数名,分别用来存FPR(假阳率)、TPR(真阳率)、和用于确定真正率和假正率的阈值;
plot()能绘制点线图,把横轴FPR和纵轴TPR填进去就能生成ROC曲线啦。
图形很接近真阳率TPR的纵轴,说明模型结果拟合得还不错。