RetinaNet网络解析

       RetinaNet是何凯明大神提出的一种网络,该网络结构采用FPN网络的结构(请参考博客FPN网络原理解析),其主要创新点在于提出了一个新的损失函数Focal Loss(请参考博客Focal Loss损失函数详解),主要用于解决one-stage目标检测中正负样本极不平衡的问题。关于FPN网络、损失函数Focal Loss的原理上面两篇博客已经写的很详细了,我这里主要说一下以下几点:

  • 特征金字塔构建

       在ResNet结构上构建FPN,在P3~P7层上构建特征金字塔

  • anchor设计

       从P3到P7层的anchors的面积从32*32依次增加到512*512,每一层的anchors有三种长宽比{1:2,1:1, 2:1};为了更加密集的覆盖在每层增加三种size,一共9种anchor

  • 网络的检测层

       网络的检测层分为分类子网络和回归子网络,详细介绍可以参考SSD网络结构(SSD网络解析)

  • Focal Loss的超参数

       实验发现γ = 2效果最好,鲁棒区间是γ ∈ [0.5, 5];权重参数α也有一个稳定的区间,但是与γ值互相影响,通常α随着γ的增大而轻微减少(γ = 2, α = 0.25效果最好)

你可能感兴趣的:(目标检测)