YOLO系列/20230903

深度学习经典检测方法 

1. two-stage(分两阶段):Faster-Rcnn和Mask-Rcnn系列 -------检测过程中加了预选框步骤
  • 速度通常较慢(5FPS),但是效果通常不错
  • 非常实用的通用框架Mask-Rcnn,需要了解
2. one-stage(单阶段):YOLO系列  ------当我们想做检测任务,一个cnn网络直接做一个回归                                                                  任务就可以,中间不需要加额外的补充
  • 最核心的优势:速度非常快,适合做实时检测任务
  • 但是缺点是效果通常情况下不会太好!

YOLO系列/20230903_第1张图片  

A图(即one-stage):  输入一张图,输出狗和猫的坐标,即一个框(做一个检测任务,得到四个值,即框的x_1,y_1, 还有x_2, y_2,即得到了四个预测结果)-------回归任务

B图(即two-stage):输入一张图,最终结果检测狗和猫的位置,但是在检测过程中多加了一个RPN(区域建议网络),即多了一个预选框(类似于后续的结果是由一些候选人得到的),通过预选的结果再得到最终的结果。

3. 指标分析

  • map指标:综合衡量检测效果;单看精度和recall不行吗?

YOLO系列/20230903_第2张图片

  • IOU:(Intersection over Union)  -----交集/并集(可以当作真实值和预测值的比值)

YOLO系列/20230903_第3张图片

  • 检测任务中的精度和召回率分别代表什么?

           精度:检测的绿色框和蓝色的真实框越接近越好

           召回率:下图的图B:漏检问题

           基于置信度下图中,检测的是人脸的可能性有多大)阈值来计算,例如分别计算0.9;0.8;0.7

           0.9时:TP+FP=1, TP=1;  FN = 2; Precision = 1/1;  Recall = 1/3 (B和C的绿色框都被过滤掉了,都小于阈值0.9)

YOLO系列/20230903_第4张图片

  • 如何计算AP呢?需要把所有阈值都考虑进来;MAP就是所有类别的平均

YOLO系列/20230903_第5张图片

你可能感兴趣的:(YOLO)