锚框(anchor box)/先验框(prior bounding box)概念以及yolov3中的使用

1.概念

关于先验框,有的paper(如Faster RCNN)中称之为anchor(锚点),有的paper(如SSD)称之为prior bounding box(先验框),实际上是一个概念。

  • 先验框最早提出于Faster RCNN,初衷是为了代替selective search算法。
  • 先验框是根据特征图生成的,即,特征图上每个位置都有一定数目不同比例的先验框。而大小是相对于原图的,也就是特征图上每个点可以映射到原图中某个特定区域(感受野大小)。
  • 在训练的时候往往是把先验框缩放到相对于特征图的大小,在推理时会把特征图上调整后的先验框,即预测框,放大到原图大小。

2. 锚框/先验框的作用

对于目标检测任务,有这样一种经典解决方案:遍历输入图像上所有可能的像素框,然后选出正确的目标框,并对位置和大小进行调整就可以完成目标检测任务。这些进行预测的像素框就叫锚框。这些锚框通常都是方形的。同时,为了增加任务成功的几率,通常会在同一位置设置不同宽高比的锚框。

3.yolov3中的先验框

 锚框(anchor box)/先验框(prior bounding box)概念以及yolov3中的使用_第1张图片锚框(anchor box)/先验框(prior bounding box)概念以及yolov3中的使用_第2张图片

上图为 Anchor box 与 bounding box 转换示意图,其中蓝色的是要预测的bounding box,黑色虚线框是Anchor box。

tx​、ty​、tw​、th为特征网络的输出值,Cx​,Cy​为中心点所在网格左上角的坐标,Pw,Ph为给定先验框的宽高

你可能感兴趣的:(目标检测,深度学习,人工智能,计算机视觉)