华为诺亚联合发布业界首个视觉Transformer综述论文

论文名称:A Survey on Visual Transformer

论文链接: https://www.aminer.cn/pub/5fe4332c9e795e14f30f4fe8

推荐理由:本文是华为诺亚联合发布的业界首个视觉变换器(Transformer)调研。Transformer是一种主要基于自注意力机制的深度神经网络,最初应用于自然语言处理领域。受Transformer强大的表征能力的启发,研究人员提出将Transformer扩展到计算机视觉任务中。与卷积网络和循环网络等其他网络类型相比,基于Transformer的模型在各种视觉基准上都具有竞争力,甚至表现出了更好的性能。在本文中,作者对这些视觉变换器模型进行了文献综述,将它们按照不同的任务进行分类,并分析了这些方法的优缺点。具体来说,主要包括基础图像分类(basic image classification)、高级视觉(high-level vision)、低级视觉(low-level vision)和视频处理(video processing)。由于自注意力(self-attention)是变换器中的基础部件,作者简要重新审视了自注意力在计算机视觉中的位置。为变换器推向实际应用,本文包含了高效的变换器方法。
最后,作者给出了视觉变换器的未来研究方向。

订阅了解更多论文信息,定制您的个人科研动态信息流:https://www.aminer.cn/user/notification

#论文# #AMiner#

华为诺亚联合发布业界首个视觉Transformer综述论文_第1张图片
华为诺亚联合发布业界首个视觉Transformer综述论文_第2张图片

你可能感兴趣的:(AMiner论文推荐,人工智能,深度学习,机器学习,神经网络,计算机视觉)