分类算法评估指标

引入

医学图像识别二分类问题
针对一个二分类问题,我们将实例分成正类(positive)和负类(negative)两种。
例如:在肺结节计算机辅助识别这一问题上,一幅肺部CT图像中有肺结节被认为是阳性(positive),没有肺结节被认为是阴性(negative)。对于部分有肺结节的示意图如下:
分类算法评估指标_第1张图片
所以在实际检测时,就会有如下四种情况:
(1) 真阳性(True Positive,TP):检测有结节,且实际有结节;正确肯定的匹配数目;
(2) 假阳性(False Positive,FP):检测有结节,但实际无结节;误报,给出的匹配是不正确的;
(3) 真阴性(True Negative,TN):检测无结节,且实际无结节;正确拒绝的非匹配数目;
(4) 假阴性(False Negative,FN):检测无结节,但实际有结节;漏报,没有正确找到的匹配的数目。

详细图解 如下:
分类算法评估指标_第2张图片
上图中涉及到很多相关概念及参数,详细请见Wiki上的定义及其混淆矩阵,这里整理肺结节识别中的几个主要参数指标如下:

  • 精确率(Precision):
    在这里插入图片描述
  • 真阳性率(True Positive Rate,TPR),灵敏度(Sensitivity),召回率(Recall):
    在这里插入图片描述
  • 真阴性率(True Negative Rate,TNR),特异度(Specificity):
    在这里插入图片描述
  • 假阴性率(False Negatice Rate,FNR),漏诊率( = 1 - 灵敏度):
    在这里插入图片描述
  • 假阳性率(False Positice Rate,FPR),误诊率( = 1 - 特异度):
    在这里插入图片描述
  • 阳性似然比 = 真阳性率 / 假阳性率 = 灵敏度 / (1 - 特异度)
  • 阴性似然比 = 假阴性率 / 真阴性率 = (1 - 灵敏度) / 特异度
  • Youden指数 = 灵敏度 + 特异度 - 1 = 真阳性率 - 假阳性率

分类算法评估指标_第3张图片
二元分类问题可以获得 True Positive(TP,真阳性)、False Positive(FP,假阳性)、 False Negative(FN,假阴性) 和 True Negative(TN,真阴性)。这四个值分别对应二元分类问题的混淆矩阵的四个位置。

小技巧:上面的这四个概念经常会被搞混淆(难道混淆矩阵的名称就是这么来的?),这里有个小方法帮你记住它。在医学上,一般认为阳性是患病,阴性是正常。所以只要出现“阳性”关键字就表示结果为患病,此外,阳性也分为真阳性和假阳性,从名称就可以看出:真阳性表示确确实实的阳性,也就是说实际为阳性(患病),预测也为阳性(患病);假阳性表示不真实的阳性,也就是说实际为阴性(正常),预测为阳性(患病)。真阴性和假阴性也可以按照上面的方式来简单理解。
很明显,这里的 TP=5,FP=2,FN=4,TN=4。
分类算法评估指标_第4张图片

你可能感兴趣的:(机器学习)