关于GP Global Pooling

hi,dear 

have seen many Global Pooling?why is the gap ,gmp, gsp? Will talk in detail

GAP,here is Global average pooling,Not mentioned in NeXtVLAD Global average precision

全局平均池化,这是在图像处理中的最后面的层,为了降维用,一般的池化都有它的size,比如2*2或者3*3等,但GAP不需要,直接一个feature map来一个全局的平均值,over,就是这么简单,每个feature map得到一个值,然后接FC,参数会少很多。不然至少需要一层dense来降维,而dense是占参数最多的,这样GAP既减少计算量,也防止了过拟合。具体讲就是一个卷积后的输出为n*H*W*C(这里H,W仅代表feature map的长宽,不是帧的大小),GAP后直接就是n*C,6不6,下面看下具体的实现方法:

只要将ksize设定的大小与HW维度相同即可,strides设置为1,padding用VALID,用tf.nn.avg_pool2d来实现,然后用reduce来降维,reduce_*都行,如果用keras则直接GlobalAvgPool2D即可解决。针对图像分类的东西目前都是2D pooling,不管是max ,std,还是average都是HW的操作,很容易理解,也不再赘述了,

std是标准差,对HW维度求std,max是求最大值,容易理解,不再细说。

但为何取avg比max常见??avg有特殊功能???按常规理解不应该max吗??

因此也有人说avg更多的是平均信息(也就是图像的背景信息),max则是局部信息(纹理信息)

至于std操作为何,静待大佬的回复吧,毕竟小明哥也不是啥都知道。

 

20200409后记:

大佬骂了我一顿,paper写的清清楚楚你咋不看,我。。我。。。就是想你直接告诉我

无论你怎么说我以后还是这样,你说一次我就记忆深刻了,你虽然也对我印象差了,但总比没有任何印象好。

大佬的做法是将Gsp和gap一起拼接起来然后进入FC,在这里。

找到了作者的另外一篇文字,matlab写的
Dingquan Li, Tingting Jiang, Weisi Lin, and Ming Jiang. 2019. Which Has Better Visual Quality: The Clear Blue Sky or a Blurry Animal

北大的大佬就是厉害。

关于GP Global Pooling_第1张图片

欲知更多直接查看56~58,先这样吧,没时间了。

 

另外有相关问题可以加入QQ群讨论,不设微信群

QQ群:868373192 

语音图像视频深度-学习群

你可能感兴趣的:(imagednn,Global,Pooling,gap,gmp,avg,std)