CVPR 2021 Involution: Inverting the Inherence of Convolution for Visual Recognition
动机卷积操作具有两个显著特性,即spatial-agnostic和channel-specific。spatial-agnostic:图像所有位置都使用同一个卷积核,实现了平移不变性。但它剥夺了卷积核在不同空间位置采用不同视觉模式的能力,从而限制了卷积核提取特征的的能力。此外,它还限制了卷积的感受野,对识别小目标或者模糊图像构成了挑战。channel-specific:每个channel都提取不同