真正例、假正例、真负例、假负例、精确度、召回率快速理解

什么是“正例”?比如说,医学中癌症的良、恶性分类,“正例”是指“良性”还是“恶性”?看你自己的目标是什么,你想找恶性的就定义恶性为正例,反之就定义良性为正例,全看自己的定义。

真正例、假正例、真负例、假负例、精确度、召回率快速理解_第1张图片

真正例、假正例、真负例、假负例、精确度、召回率快速理解_第2张图片

其中精度又称为查准率:预测为正例的预测集内,正例预测正确的比率             例,在所有我们预测有恶性肿瘤的病人中,实际上有恶性肿瘤的病人的百分比,越高越好。

       召回率,又可称为查全率:整个正类样本中,预测正确的样本所占的比率     例,在所有实际上有恶性肿瘤的病人中,成功预测有恶性肿瘤的病人的百分比,越高越好。

      

       Precision是测量预测为阳性样本的样本中有多少是真实的阳性样本(True positive),而recall测量在所有阳性样本中有多少真实阳性样本被正确检测到。

精度通常与另一个指标一起使用,这个指标就是召回率(recall),也称为灵敏度(sensitivity)或者真正类率(TPR):它是分类器正确检测到的正类实例的比率.

     你不能同时增加精度并减少召回率,反之亦然。这称为精度/召回率权衡。

       因此我们可以很方便地将精度和召回率组合成一个单一的指标,称为F1 分数。当你需要一个简单的方法来比较两种分类器时。F1 分数是精度和召回率的谐波平均值。谐波平均值会给予较低的值更高的权重。因此,只有当召回率和精度都很高时,分类器才能得到较高的F1 分数。

          真正例、假正例、真负例、假负例、精确度、召回率快速理解_第3张图片

真正例、假正例、真负例、假负例、精确度、召回率快速理解_第4张图片

单一的用recall或者precision来评价分类器也是不合理的,譬如文章开头说到的那个简单的classifier

我们通过公式可以惊奇的发现在两个样本集上的recall都是100%,这是因为所有的iphone6样本,分类器都可以把它预测对,但是准确率就大不相同了;在第一个数据集上的准确率precision为0.6,但是第二个样本集上的准确率只有可怜的0.05;对于第二个样本集的结果,我可以说classifier很好,因为recall很高,也可以说classifier不好,因为precision很低。不过很明显,这些说法都是不合理的;综合考虑两种指标才是直观的比较可靠的指标

微平均Micro-average=(TP + FP) / (TP + TN + FP + FN),分母就是输入分类器的预测样本个数,分子就是预测正确的样本个数(无论类别)

真正例、假正例、真负例、假负例、精确度、召回率快速理解_第5张图片

宏平均比微平均更合理,但也不是说微平均一无是处,具体使用哪种评测机制,还是要取决于数据集中样本分布

你可能感兴趣的:(机器学习,机器学习)