【读点论文】A Survey on Vision Transformer,2022年华为诺亚最新综述研究,从发展到任务,整体到局部。ViT有研究价值在于有很多问题还没有解决,真理是阶段性的产物
ASurveyonVisionTransformerAbstracttransformer最早应用于自然语言处理领域,是一种主要基于自注意机制的深度神经网络。由于其强大的表示能力,研究人员正在寻找将transformer应用于计算机视觉任务的方法。在各种可视化基准测试中,基于transformer的模型的性能类似于或优于其他类型的网络,如卷积和循环神经网络。由于transformer具有较高的性能