目标检测算法对比, rcnn, fast-rcnn, faster-rcnn, yolo2, yolo3


RCNN
  1. 在图像中确定约1000-2000个候选框 (使用选择性搜索,selective search等)
  2. 每个候选框内图像块缩放至相同大小,并输入到CNN内进行特征提取 
  3. 对候选框中提取出的特征,使用分类器判别是否属于一个特定类 
  4. 对于属于某一特征的候选框,用回归器进一步调整其位置

Fast RCNN
  1. 在图像中确定约1000-2000个候选框 (使用选择性搜索,selective search等)
  2. 对整张图片输进CNN,得到feature map
  3. 找到每个候选框在feature map上的映射patch,将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层
  4. 对候选框中提取出的特征,使用分类器判别是否属于一个特定类 
  5. 对于属于某一特征的候选框,用回归器进一步调整其位置

Faster RCNN
  1. 对整张图片输进CNN,得到feature map
  2. 卷积特征输入到RPN,得到候选框的特征信息
  3. 对候选框中提取出的特征,使用分类器判别是否属于一个特定类 
  4. 对于属于某一特征的候选框,用回归器进一步调整其位置

yolo1:
    1、把图片分成SxS个网格(grid cell)
    2、每个网格负责检测“一个”框和类别
    3、经过概率(softmax)和NMS过滤,得到最终结果

目标检测算法对比, rcnn, fast-rcnn, faster-rcnn, yolo2, yolo3_第1张图片

yolo2:
    1)增加Batch Normalization层 (mAP+2%)
    2)使用高分辨率的分类器(mAP+4%)
    3)使用Anchor的思想 (mAP-0.3%),Recall从81%增加到88%,重点
    4)K-means聚类获取Anchor框 +直接预测位置 (mAP+5%),重点
    5)细粒度的特征(mAP+1%),重点
    6)多尺度训练(mAP+1%)

目标检测算法对比, rcnn, fast-rcnn, faster-rcnn, yolo2, yolo3_第2张图片

 

yolo3~=yolo2+darknet53+fpn+sigmoid_class_prediction
 

参考:

论文:Fast R-CNN

论文:Faster R-CNN- Towards Real-Time Object Detection with Region Proposal Networks

论文:You Only Look Once- Unified, Real-Time Object Detection

https://towardsdatascience.com/training-object-detection-yolov2-from-scratch-using-cyclic-learning-rates-b3364f7e4755

论文:YOLOv3: An Incremental Improvement

你可能感兴趣的:(计算机视觉,深度学习,计算机视觉)