使用Python画ROC曲线和PRC曲线

1.受试者工作特征曲线(Receiver operating characteristic curve,ROC)

ROC曲线是衡量二分类模型优劣的一种评价指标,以真阳性率(TPR)为纵坐标,假阳性率(FPR)为横坐标绘制的曲线。ROC曲线下面积在0到1之间,其中TPR和FPR的计算方法为:
使用Python画ROC曲线和PRC曲线_第1张图片
其中TP和TN分别是真阳性、真阴性样本的数量,FP和FN分别是假阳性、假阴性样本的数量。

from sklearn.metrics import roc_curve,auc
FPR,TPR,threshold = roc_curve(test_y,model.predict(test_x),pos_label=1)  
#test_y为测试集标签,model为训练好的模型,可为传统的机器学习模型,也可为深度学习模型。
# AUC值计算
AUC = auc(FPR,TPR)
print(AUC)
# ROC曲线绘制
plt.figure(figsize=(6,6))
plt.title('ROC curves')
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.xlim([-0.05,1.05])
plt.ylim([-0.05,1.05])
plt.plot(FPR,TPR,color='r',label=' (AUC={:.4f})'.format(AUC))
plt.plot([0, 1], [0, 1], color='m', linestyle='--')
plt.legend(loc='lower right')
# 保存图片(常用格式如下)
plt.savefig('ROC curves.jpg',dpi=300) 
plt.savefig('ROC curves.pdf',dpi=300) 
plt.savefig('ROC curves.png',dpi=300) 
plt.show()

结果如下所示:
使用Python画ROC曲线和PRC曲线_第2张图片

2.精确召回曲线(Precision recall curve,PRC)

PRC曲线被用于刻画二分类模型的分辨能力,进而比较不同二分类模型之间的差异。横坐标为查准率(Precision),纵坐标为召回率(Recall),可以反映二者此消彼长的关系。

from sklearn.metrics import precision_recall_curve,average_precision_score
# precision, recall值的计算
precision, recall, _ = precision_recall_curve(test_y,model.predict(test_x))
# average_precision值的计算
PRC = average_precision_score(test_y,model.predict(test_x))
print(PRC)
# PRC曲线绘制
plt.figure(figsize=(6,6))
plt.title('PR curves')
plt.xlabel('Recall')
plt.ylabel('Precision')
plt.xlim([-0.05,1.05])
plt.ylim([-0.05,1.05])
plt.step(recall, precision, color='b', label=' (PRC={:.4f})'.format(PRC))
plt.plot([0, 1], [1, 0], color='m', linestyle='--')
plt.legend(loc='lower right')
# 保存图片(常用格式如下)
plt.savefig('PR curves.jpg',dpi=300) 
plt.savefig('PR curves.pdf',dpi=300) 
plt.savefig('PR curves.png',dpi=300) 
plt.show()

结果如下所示:
使用Python画ROC曲线和PRC曲线_第3张图片

你可能感兴趣的:(Python,笔记,python,机器学习,深度学习,人工智能,性能优化)