机器学习评价指标ROC中 macro,micro 的区别

macro:每种类别下,都可以得到m个测试样本为该类别的概率(矩阵P中的列)。所以,根据概率矩阵P和标签矩阵L中对应的每一列,可以计算出各个阈值下的假正例率(FPR)和真正例率(TPR),从而绘制出一条ROC曲线。这样总共可以绘制出n条ROC曲线。最后对n条ROC曲线取平均,即可得到最终的ROC曲线。

micro:首先,对于一个测试样本:1)标签只由0和1组成,1的位置表明了它的类别(可对应二分类问题中的‘’正’’),0就表示其他类别(‘’负‘’);2)要是分类器对该测试样本分类正确,则该样本标签中1对应的位置在概率矩阵P中的值是大于0对应的位置的概率值的。基于这两点,将标签矩阵L和概率矩阵P分别按行展开,转置后形成两列,这就得到了一个二分类的结果。所以,此方法经过计算后可以直接得到最终的ROC曲线

macro:宏平均(Macro-averaging)
把每个类别都当成二分类,分别计算出各个类别 对应的precision,recall, f1 , 然后求所有类别的precision,recall,f1的平均值,得到最终的precision recall f1. 这里假设所有分类都是一样的重要,所以 整体结果受小类别(数量比较少的target)的影响比较大。

micro:微平均(Micro-averaging)
把各个类别当成二分类,统计各自的混淆矩阵,然后统计加和 比例 得到一个最终的 混淆矩阵,再计算precision,recall,f1.

参考:macro,micro的区别

你可能感兴趣的:(机器学习)