目标检测中的Anchor

前言:

在计算机视觉四大基本任务(检测、分类、定位、分割)中,图像的目标检测受到的了研究者们越来越多的关注。今天我们就来聊一聊在目标检测中一项重要的机制——Anchor。Anchor机制在凯明大神提出的Faster-RCNN(2015年提出)时兴起。下面将从三方面来叙述Anchor.

目录

1.什么是Anchor

2.Anchor的机制

3.Anchor的优缺点

1.什么是Anchor

在目标检测任务中,输入图像经过骨干网络提取得到特征图,该图上的每个像素点,即为anchor锚点;或者说在feature map使用滑动窗口的操作方式,当前滑窗的中心在原像素空间的映射点就称为Anchor;简单来说RPN(Reg ion Proposal Network)依靠一个在共享特征图上滑动的窗口,为每个位置(即:Anchor)生成9种预先设置好长宽比与面积的目标框。这9种初始anchor包含三种面积(128×128,256×256,512×512),每种面积又包含三种长宽比(1:1,1:2,2:1),即 Anchor boxes。示意图如下所示:
目标检测中的Anchor_第1张图片

2.Anchor的机制

以每个anchor为中心点,人为设置不同的尺度(scale)和长宽比(aspect ratio),即可得到基于anchor的多个anchor box,用以框定图像中的目标,这就是所谓的anchor 机制。如下图所示,左侧显示了基于一个anchor点生成的9个anchor boxes(红、绿、蓝三种颜色),右侧显示了该特征图上密集分布的所有anchor boxes。
目标检测中的Anchor_第2张图片

3.Anchor的优缺点

在知道了Anchor的原理和机制之后,下面我们就来讲讲Anchor的优缺点了:
 3.1 Anchor的优点:

 ① 使用anchor机制产生密集的anchor boxes,使得网络可直接在此基础上进行目标分类及边界框坐标回归;
 ② 密集的anchor boxes可有效提高网络目标召回能力,对于小目标检测来说提升非常明显。

 3.2 Anchor的缺点:

 ① anchor机制中,需要设定的超参:尺度(scale)和长宽比( aspect ratio)是比较难设计的。这需要较强的先验知识。
 ②冗余框非常之多:一张图像内的目标毕竟是有限的,基于每个anchor设定大量anchor boxes会产生大量的easy-sample,即完全不包含目标的背景框。这会造成正负样本严重不平衡问题,也是one-stage算法难以赶超two-stage算法的原因之一。
 ③网络实质上是看不见anchor boxes的,在anchor boxes的基础上进行边界回归更像是一种在范围比较小时候的强行记忆。

你可能感兴趣的:(目标检测,计算机视觉,深度学习,人工智能)