多尺度(multi-scale)目标检测方法

文章目录

  • 1、多尺度图像预测
  • 2、金字塔特征预测
    • 2.1 FPN
    • 2.2 SSD
  • 3、bounding box设计

1、多尺度图像预测

将图片进行不同尺度的缩放,得到图像金字塔,然后对每层图片提取不同尺度的特征,得到特征图。最后对每个尺度的特征都进行单独的预测
特点:不同尺度的特征都可以包含很丰富的语义信息,精度高 ,但 速度慢

2、金字塔特征预测

将输入图片转变成feature map,在feature map层面上来进行尺度变化,采用不同 的方法进行不同尺度 特征的融合,以实现多尺度检测。

2.1 FPN

特征金字塔网络:将低层的特征高层的特征融合起来,在不同的特征层都单独进行预测。

2.2 SSD

从网络不同层抽取不同尺度的特征,然后在这不同尺度的特征上分别进行预测。低层的特征对于小物体检测比较有效。

3、bounding box设计

利用RPN网络生成不同尺度的anchor,实现 多尺度目标检测。faster RCNN 和 SSD都用到了这方法。
faster rcnn中 RPN 从单个feature map上面预测,是二分类(是|不是目标);SSD中 RPN从多个特征图上面预测,是(N+1)分类(N个类别+1个背景)。
多尺度(multi-scale)目标检测方法_第1张图片
(b) 对应 Faster R-CNN, (c ) 对应 SSD, (d) 对应 FPN

参考:https://www.zhihu.com/question/309488424
https://www.zhihu.com/question/309488424

你可能感兴趣的:(深度学习笔记)