分类

混淆矩阵1

  • True Positive(真正, TP):将正类预测为正类数.
  • True Negative(真负 , TN):将负类预测为负类数.
  • False Positive(假正, FP):将负类预测为正类数   误报 (Type I error).
  • False Negative(假负 , FN):将正类预测为负类数   漏报 (Type II error).

精确率(precision)定义为:

P=TPTP+FP(1) (1) P = T P T P + F P

需要注意的是精确率(precision)和准确率(accuracy)是不一样的,

ACC=TP+TNTP+TN+FP+FN A C C = T P + T N T P + T N + F P + F N

在正负样本不平衡的情况下,准确率这个评价指标有很大的缺陷。比如在互联网广告里面,点击的数量是很少的,一般只有千分之几,如果用acc,即使全部预测成负类(不点击)acc 也有 99% 以上,没有意义。

召回率(recall,sensitivity,true positive rate)定义为:

R=TPTP+FN(2) (2) R = T P T P + F N

此外,还有  F1 F 1  值,是精确率和召回率的调和均值

2F1F1=1P+1R=2TP2TP+FP+FN(3) 2 F 1 = 1 P + 1 R (3) F 1 = 2 T P 2 T P + F P + F N

精确率和准确率都高的情况下, F1 F 1  值也会高。


通俗版本

刚开始接触这两个概念的时候总搞混,时间一长就记不清了。

实际上非常简单,精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是对的。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP)。

召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。


在信息检索领域,精确率和召回率又被称为查准率查全率

查准率 = 检索出的相关信息量 检索出的信息总量 查全率 检索出的相关信息量 系统中的相关信息总量
举个栗子

假设我们手上有60个正样本,40个负样本,我们要找出所有的正样本,系统查找出50个,其中只有40个是真正的正样本,
计算上述各指标。
  • TP: 将正类预测为正类数 40
  • FN: 将正类预测为负类数 20
  • FP: 将负类预测为正类数 10
  • TN: 将负类预测为负类数 30
准确率 (accuracy) = 预测对的/所有 = (TP+TN)/(TP+FN+FP+TN) = 70%
精确率 (precision) = TP/(TP+FP) = 80%
召回率 (recall) = TP/(TP+FN) = 2/3