Residual Attention Network for Image Classification, cvpr17

人至懒则无敌。

cvpr17的论文,很有意思,值得一读和复现。(笔者懒,还是坐等开源吧)

Residual Attention Network for Image Classification. In CVPR 2017.

该模型的结构参考了: Stacked hourglass networks for human pose estimation. In arXiv 2016. (笔者强烈推荐)

yangshuo的page: http://personal.ie.cuhk.edu.hk/~ys014/


还是老样子,看图说话,具体细节,请看论文。

Residual Attention Network for Image Classification, cvpr17_第1张图片

图1说明了越high-level的part feature及其mask越会focus在object或者parts of object上。而且通过mask,可以diminish不相关的区域,如背景。


Residual Attention Network for Image Classification, cvpr17_第2张图片

图2是网络架构,其关键点在于hourglass的attention map以及attention和trunck branches的residual connection。具体的细节和公式请看论文,容易理解。下面的图3比较详细地说明了soft mask branch和trunk branch是怎样的子结构。

Residual Attention Network for Image Classification, cvpr17_第3张图片

至于效果嘛,看下面的tab 7

Residual Attention Network for Image Classification, cvpr17_第4张图片

笔者简单套用了下residual这个方式,即(1+M(X))*T(X)到笔者的一个task上,发现是有1%的提升的。


=====
如果这篇博文对你有帮助,可否赏笔者喝杯奶茶?



你可能感兴趣的:(cvpr,Deep,Learning)