AUC原理计算

面试的时候回答的不清楚,学习&总结如下。
参考link

1.ROC曲线

对于二值分类器,评价指标主要有precision,recall,F-score(综合考虑precision和recall的调和值)

ROC曲线上的每个点反映着对同一信号刺激的感受性。横坐标FPR越大,预测正类中实际上负类越多。纵坐标TPR越大,预测正类中实际正类越多。所以最好的情况是(0,1)时。

【其他知识点】
混淆矩阵

2.如何画roc曲线

对一个特定的分类器和测试数据集,只能得到一个分类结果。需要一组FPR和TPR的值。


简单来说就是,每个样本根据预测值排好序,然后依次将每个值当做阈值,计算该阈值下的FPR和TPR。

3.AUC的计算

AUC(area under curve)即ROC曲线下的面积。(随机给定一个正样本和一个负样本,分类器输出该正样本为正的那个概率值 比 分类器输出该负样本为正的那个概率值 要大的可能性)

你可能感兴趣的:(AUC原理计算)