机器学习中的常用评价指标汇总

机器学习中的评价指标

简要介绍精度、精确率、召回率、P-R曲线、F1 值、TPR、FPR、ROC、AUC等指标,还有在生物领域常用的敏感性、特异性指标。

基础

在分类任务中,各指标的计算基础都来自于对正负样本的分类结果,用混淆矩阵表示为:


混淆矩阵.png
精度
  • Accuracy

定义:(TP+TN)/(TP+FN+FP+TN)
即所有分类正确的样本占全部样本的比例

精确率
  • Precision、查准率

定义:(TP)/(TP+FP)
即预测是正例的结果中,确实是正例的比例

召回率
  • Recall、查全率

定义:(TP)/(TP+FN)
即所有正例的样本中,被找出的比例

P-R曲线
  • PRC

定义:根据预测结果将预测样本排序,最有可能为正样本的在前,最不可能的在后,依次将样本预测为正样本,分别计算当前的精确率和召回率,绘制P-R曲线。


PR曲线.png
F1 值

定义:(2 * P * R)/(P + R)

TPR
  • 真正例率,与召回率相同

定义:(TP)/(TP+FN)

FPR
  • 假正例率

定义:(FP)/(TN+FP)

ROC
  • 受试者工作特征

定义:根据预测结果将预测样本排序,最有可能为正样本的在前,最不可能的在后,依次将样本预测为正样本,分别计算当前的TPR和FPR,绘制ROC曲线。


ROC.png
AUC
  • Area Under ROC Curve
    定义:ROC曲线下的面积
敏感性
  • sensitivity

定义:TP / (TP + FN)
即有病(阳性)人群中,检测出阳性的几率。(检测出确实有病的能力)

特异性
  • specificity

定义:TN / (TN + FP)
即无病(阴性)人群中,检测出阴性的几率。(检测出确实没病的能力)

参考资料

https://blog.csdn.net/b876144622/article/details/80009867
https://www.cnblogs.com/leezx/p/6105212.html

你可能感兴趣的:(机器学习中的常用评价指标汇总)