Python机器学习:roc_curve()生成ROC曲线

ROC曲线越接近纵轴,模型预测精度越高,能直观地表现模型精度。用sklearn里面的roc_curve()函数,就能一键计算FPR和TPR,快速生成ROC曲线啦。

先复习一下ROC曲线的构成:X轴代表假阳率,Y轴代表真阳率。我们要得到的值就是预测对的TPR、和预测错FPR的两组值。

Python机器学习:roc_curve()生成ROC曲线_第1张图片


模型准备:

思路是:先把模型训练好,生成测试集的结果y_test_proba备用。接着用roc_curve(),计算FPR和TPR,以及生成ROC曲线。

import lightgbm as lgb
model_lgb = lgb.LGBMClassifier().fit(X_train, y_train)
y_test_proba =  model_lgb.predict_proba(X_test)[:, 1]

ROC曲线的绘制:

import matplotlib.pyplot as plt
from sklearn.metrics import roc_curve

fpr, tpr, thresholds = roc_curve(y_test, y_test_proba)
plt.plot(fpr, tpr)

代码讲解:

matplotlib指绘图的包;

roc_curve是sklearn里面计算ROC曲线的函数,能返回FPR(假阳率)、TPR(真阳率)、和用于确定真正率和假正率的阈值;

fpr, tpr, thresholds 是我们自定义的参数名,分别用来存FPR(假阳率)、TPR(真阳率)、和用于确定真正率和假正率的阈值;

plot()能绘制点线图,把横轴FPR和纵轴TPR填进去就能生成ROC曲线啦。


运行结果:Python机器学习:roc_curve()生成ROC曲线_第2张图片

 图形很接近真阳率TPR的纵轴,说明模型结果拟合得还不错。

你可能感兴趣的:(Python机器学习,sklearn,python)