SSD与Faster RCNN中的RPN生成anchor的不同之处

SSD是在多个不同尺度/分辨率的特征图上生成anchor,故而在每一个尺度的特征图上生成anchor时,并没有引入multi-scale,而是给同一个尺度分辨率特征图上的每个像素点设定一个面积值,在该像素点上产生 len(aspect_ratios)个anchor boxes,即产生不同宽高比的anchor boxes,这些不同宽高比的anchor boxes在同一个分辨率的特征图上具有相同的面积,故而SSD anchor的多尺度完全由为每个不同尺度的特征图上的像素点指定anchor 的面积而引入。就是说,如果 aspect_ratio=[0.5,1,2],则在某一个尺度的特征图上每个位置的像素点处,只会产生3 个面积相等(面积的具体数值见SSD论文中的计算公式)的anchor boxes。

而对于Faster RCNN中的RPN模型,由于没有引入FPN特征金字塔网络,故而只在一个尺度的特征图上生成anchor,anchor的多尺度完全由对于anchor的设计决定,比如在特征图上设置3种不同面积的anchor boxes,aspect_ratio=[0.5,1,2],则在特征图上每个位置的像素点处,会有9个anchor boxes,其中每三个宽高比不同的anchor boxes具有相同的面积。这里的面积指的是在输入图像空间分辨率上的面积值。

想到解释这个问题主要是因为看到了 引入FPN的cascaded RCNN代码中 

cfg.ANCHOR_SCALES

参数并没有参与到anchor的生成代码段中。

你可能感兴趣的:(object,detection)