FPN 检测网络解析

论文题目:Feature Pyramid Networks for Objection Detection

代码: GitHub 可搜

    作者在文中指出了一种基于特征金字塔结构的目标检测算法,但是骨干网络结构还是基于faster-rcnn。

FPN 检测网络解析_第1张图片

上图便是作者在文中指出的特征金字塔的bottom-up,top-down结构。将bottom-up中涉及到的feature map

依据先后顺序依次命名为[C2, C3, C4,C5],top-down部分涉及的依次命名为[P2, P3, P4, P5]。

    当通过RPN时,各层的特征可通过一个共享权重的RPN网络后者,各自独有的RPN网络,这里便涉及到

一个问题,那就是在训练RCNN时如何通过proposal 找到对应的feature map。文中给出了一个解决方案,

具体计算公式如下:

代码:

 levels = tf.round(4. + tf.log(tf.sqrt(w*h + 1e-8)/224.0) / tf.log(2.)) 
 levels = tf.maximum(levels, tf.ones_like(levels) * 
                (np.float32(self.min_level)))  # level minimum is 2
 levels = tf.minimum(levels, tf.ones_like(levels) * 
                (np.float32(self.max_level)))

代码中的4是针对ResNet网络结构的参数,224是输入图片的尺寸。

后面便是对RCNN网络的具体训练了,值得注意的是:这一部分的训练参数是在RPN中的所有

proposal中根据一定的batch size和正负样本的比例以及IOU值进行采样的。详细部分可参照faster

-rcnn部分。

想要知道更多关于CV的知识可以关注公众号:

FPN 检测网络解析_第2张图片

你可能感兴趣的:(ML,AI)