1、语义分割(semantic segmentation):标注方法通常是给每个像素加上标签;常用来识别天空、草地、道路等没有固定形状的不可数事物(stuff)。
2、实例分割(instance segmentation):标注方法通常是用包围盒(bbox?)或分割掩码标记目标物体;常用来识别人、动物或工具等可数的、独立的明显物体(things)。
3、全景分割(Panoptic Segmentation):结合前面两者,生成统一的、全局的分割图像,既识别事物,也识别物体。
1、IoU: 交并比,两个区域重叠的部分除以两个区域的集合部分, IOU算出的值score > 0.5 就可以被认为一个不错的结果了
2、mIoU(mean IoU):均交并比,识别或者分割图像一般都有好几个类别,把每个分类得出的分数进行平均一下就可以得到mean IoU,也就是mIoU。
3、Precision:精确率,混淆矩阵计算得出,P = TP/(TP+FP)
4、Recall:召回率,R = TP/(TP+FN)
5、Accuracy:准确率,accuracy = (TP+TN)/(TP+TN+FP+FN)
即PA(Pixel Accuracy,像素精度?标记正确的像素占总像素的比例):表示检测物体的准确度,重点判断标准为是否检测到了物体
IoU只是用于评价一幅图的标准,如果我们要评价一套算法,并不能只从一张图片的标准中得出结论。一般对于一个数据集、或者一个模型来说。评价的标准通常来说遍历所有图像中各种类型、各种大小(size)还有标准中设定阈值.论文中得出的结论数据,就是从这些规则中得出的。
6、AP(Average Precision):平均精度,每个类别的精确率求平均
7、AR(Average Recall):平均召回率,每个类别的召回率求平均
8、MPA(mean pixel accuracy):平均像素准确率,MPA是对PA的改进,它是先对每个类计算PA,然后再对所有类的PA求平均。
9、Pixel Precision:代表检测到所有的物体中覆盖的精确度,重点判断mask是否精确地覆盖到了该物体,而像素精度则是在已经检测到的基础上(不论检测是否失误)进行评测的标准:
10、RQ(recognition quality)识别质量
SQ(segmentation quality)分割质量
PQ(Panoptic Quality)全景质量:进一步评估分割和识别环节的表现
人类全景分割的表现(PQ,SQ,RQ)
IoU(p,g)是预测的分割p和GroundTruth g的交并比, TP是指IoU>0.5的分割结果,FP (False Positives),和FN (False Negatives)如下图所示:
评价分割系统的标准:执行时间(硬件的大致描述),内存占用(极值和均值),精确度(如下)
Mean Intersection over Union(MIoU,均交并比):为语义分割的标准度量。其计算两个集合的交集和并集之比,在语义分割的问题中,这两个集合为真实值(ground truth)和预测值(predicted segmentation)。这个比例可以变形为正真数(intersection)比上真正、假负、假正(并集)之和。在每个类上计算IoU,之后平均。
Frequency Weighted Intersection over Union(FWIoU,频权交并比):为MIoU的一种提升,这种方法根据每个类出现的频率为其设置权重。
参考文章:https://blog.csdn.net/qq_40234695/article/details/88633094
https://blog.csdn.net/qq_37274615/article/details/78957962
https://www.zhihu.com/question/265189982/answer/462858401