cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing

0. 写作目的

    好记性不如烂笔头。

1. 问题

目前的 spatial pooling 都是 N*N的,这会限制他们捕捉特征。如分布狭长的

 

2. 解决方法


   使用1*k 和 k * 1的pooling。

   同时结合来PSPNet 中的 Pyramid Pooling。

2.1   SPM (Strip Pooling Module):来提高感受野。

 

cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing_第1张图片

2.2  MPM(Mixed Pooling Module): 来进一步对long-range 依赖进行建模

cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing_第2张图片

3. 实验

  3.1 SPM的使用的位置

    实验结果: 使用在最后一个stage的所有的block,以及每一个stage的最后一个block

cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing_第3张图片

3.2 MPM的个数实验

    最终实验结果:使用2个MPM,使用的方式是stack。

cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing_第4张图片

3.3 实验结果

  从实验的结果来看,提升幅度较小,没有达到1%mIoU. 

cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing_第5张图片

 

cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing_第6张图片

cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing_第7张图片

There may be some mistakes in this blog. So, any suggestions and comments are welcome!

注: 文中的图来源于paper。

 

[Reference]

   parper: https://arxiv.org/abs/2003.13328

   code:  https://github.com/Andrew-Qibin/SPNet

   

你可能感兴趣的:(Semantic,Segmentation,paper,reading)