理解ROC与AUC

基础知识

学习的ROC和AUC介绍以及如何计算AUC这篇博客,讲的很清晰,推荐给大家。

个人理解

  1. precision recall F1适用于预测结果是确定的情况,auc适用于预测结果是有概率的;
  2. 要画roc,首先得把 将所有样本预测为正例的概率值 排序,依次从小到大选取概率值作为正例阈值,然后计算FPR、TPR作为横纵坐标描点,进而将点连接起来画出roc曲线;
  3. 之所以要画roc或者说需要roc,是因为概率阈值取的不同会得到很多组TP和FP,所以auc是把很多组 [tpr fpr] 综合起来用一个指标评价分类效果,而f1只是综合一组pr;
  4. 测试集需要既有正例也有反例,否则auc为零;
  5. TPR的分子是预测为正例的样本中预测正确的个数,可以理解为预测为正例的样本中预测正确的比例,FPR的分子为预测为正例的样本中预测错误的个数,可以理解为预测为正例的样本中预测错误的比例;所以TPR越大FPR越小越好,进而是auc越大越好,可以结合下图理解。
    理解ROC与AUC_第1张图片

你可能感兴趣的:(ML)