Attentional Feature Fusion 特征融合方法

今天看到一篇很新颖的文章,这篇文章主要是进行特征融合操作的。我们一开始我们在做多尺度的特征融合,大多都是直接将他们相加或者拼接起来。这些方法一般都是比较简单的操作。

这里作者使用了注意力的方法进行了特征融合,在这里作者主要参考的是使用SENet网络的结构。这是因为SENet计算attention的方式就是把每个通道的像素值做一个平均之后,然后经过一系列操作后,用sigmoid函数归一化。这样的操作对于大尺度的目标还是有效果的,但是对于小目标效果就不太好,所以的话本文就提出了多尺度的方法来计算。其实我个人也进行了一些注意力的特征融合操作。其实效果还是不错的。
Attentional Feature Fusion 特征融合方法_第1张图片

上述的图就是这篇文章的主要思想,其核心想法和SeNet类似。当然作者也加了很多其他的东西。

给定两个特征X,Y进行特征融合(Y代表感受野更大的特征)

Attentional Feature Fusion(AFF)的计算方法如下:

其中,M代表的是MS-CAM。

其实这里的话就相当于对两个特征attenton完了之后,用attention的结果,在对原来的X进行attention。

Attentional Feature Fusion 特征融合方法_第2张图片

这种结构作者也在不同的深度学习任务中进行了验证效果都是不错的。大家有空可以试试这种方式的特征融合。

你可能感兴趣的:(论文推荐,深度学习)