PSP(多感受野的金字塔结构PSPNet)

      上下文信息与多尺度融合对于提高精度是十分有效的。

       具有合适全局场景级先验的深层网络可以大大提高场景解析的性能。

        在一个深层的神经网络中,感受野的大小可以粗略地表明我们使用上下文信息的程度。
为了解决实际感受野比理论感受野往往更小,不能够充分利用全局先验信息的问题,这使得许多网络无法充分融合先前的全局信息。 论文通过提出有效的全局先验表示方式来解决这个问题

PSP(多感受野的金字塔结构PSPNet)_第1张图片

        全局平均池化是获取全局上下文先验信息的良好方式,但是却不足覆盖所有的必要信息。

       为了进一步减少不同子区域之间的上下文信息丢失,提出了一个分层的全局先验信息生成架构,其中包含具有不同尺度且在不同子区域之间的信息。 如上图的虚线框内的PPM块所示。

       金字塔池化模块PPM融合了四个不同金字塔比例下的要素。 用红色突出显示的最粗糙的级别是全局池,以生成单个bin输出。 接下来的金字塔等级将特征图分为不同的子区域,并形成了不同位置的集合表示。 为了保持全局特征的权重,如果金字塔的级别大小为N,则在每个金字塔级别之后使用1×1卷积层将上下文表示的维数减小为原始视图的1 / N。然后,直接对低维特征图进行上采样,以通过双线性插值获得与原始特征图相同的尺寸特征。 最后,将不同级别的要素合并为最终的金字塔池全局特征输出。上述的四个池化kernel size分别为1×1,2×2,4×4,6×6。
 

你可能感兴趣的:(人工智能)