单目标追踪——【Transformer】Autoregressive Visual Tracking
目录文章侧重点网络结构Encoder(特征提取与融合得到VisionFeatures)Decoder(VisionFeature+MotionFeature特征融合与输出)运动特征生成特征融合与输出消融实验N与VocabularyBins论文链接:https://paperswithcode.com/paper/autoregressive-visual-tracking代码链接:https://