CVPR 2021 | 即插即用! CA:新注意力机制,助力分类/检测/分割涨点!

摘要

最近关于移动网络设计的研究已经证明了通道注意(例如,挤压和激发注意)对于提升模型性能的显著效果,但是它们通常忽略位置信息,而位置信息对于生成空间选择性注意图是重要的。本文提出了一种新的移动网络注意机制,将位置信息嵌入到信道注意中,我们称之为“协同注意”。与通过2D全局汇集将特征张量转换为单个特征向量的通道注意力不同,坐标注意力将通道注意力分解为两个1D特征编码过程,这两个过程分别沿两个空间方向聚集特征。以这种方式,可以沿着一个空间方向捕获长程相关性,同时可以沿着另一个空间方向保留精确的位置信息。然后,所得到的特征图被分别编码成一对方向感知和位置敏感的注意力图,该注意力图可以互补地应用于输入特征图,以增强感兴趣对象的表示。我们的协同注意很简单,可以灵活地插入到经典的移动网络中,如MobiLe v2、MobileNeXt和Factory Net,几乎没有计算开销。大量实验表明,我们的协同注意不仅有利于图像网的分类,更有趣的是,在下游任务中表现更好,如对象检测和语义分割。

 

工作介绍

考虑到移动网络有限的计算能力,迄今为止,移动网络最流行的注意力机制仍然是挤压和激发(SE)注意力[18]。它在2D全局池的帮助下计算通道关注度,并以相当低的计算成本提供显著的性能提升。然而,SE的注意力只考虑通道间信息的编码,而忽略了位置信息的重要性,这对于在视觉任务中捕捉对象结构至关重要[42]。后来的工作,如BAM [30]和CBAM [44],试图通过减少输入张量的通道维数来利用位置信息&#x

你可能感兴趣的:(文献解析paper,python,机器学习,人工智能,深度学习,计算机视觉)