CV中的注意力机制_1

注意力机制的基本思想就是让网络学会关注重要的信息而忽略无关的信息。

1. 注意力机制的分类

(1)软注意力:软注意力更加关注区域或者通道,可微,可以通过网络的前向传播以及后向传播学习得到。
(2)强注意力:强注意力更加关注点,图像中的每一个点都可以延伸出注意力,强注意力是不可微的注意力,训练过程往往通过增强学习完成。

2. 软注意力的使用

软注意力一般通过相关特征学习权重分布,再利用学习得到的权重施加在特征上进一步提取相关知识。
加权可以在原图上,通道(channel尺度),空间,时空上。

3. 注意力相关的一些论文

3.1 《 On the Relationship between Self-Attention and Convolutional Layers》

目的:从理论和实验验证self-attention是否可以替代卷积网络进行类似卷积的操作。
结论:
在理论层面,self-attention可以替代任何卷积层
在实际层面,论文通过构造multi-head self-attention layer进行实验,证明attention架构的前几层确实学习到了query pixel附近的g网格区域特征

3.2 SENet:Sequeeze and Excitation Block

CV中的注意力机制_1_第1张图片

3.3 SKNet:Selective Kernel Convolution

CV中的注意力机制_1_第2张图片
启发自皮质神经元根据不同的刺激可以动态调节其自身的receptive field,基本思想:用multiple scale feature汇总的information来channel-wise地指导如何分配侧重使用哪个kernel的表征

3.4 Cross Attention Network for Few-shot Classification

CV中的注意力机制_1_第3张图片
CV中的注意力机制_1_第4张图片

3.5 其他参考

attention

你可能感兴趣的:(attention,attention,深度学习)