DETR:End-to-End Object Detection with Transformers
特点:self-attentionlayers,end-to-endsetpredictions,bipartitematchinglossTheDETRmodel有两个重要部分:1)保证真实值与预测值之间唯一匹配的集合预测损失。2)一个可以预测(一次性)目标集合和对他们关系建模的架构。3)由于是加了自注意力机制,而且在学习的过程中,观众的注意力训练的很好,每个人的关注点都不一样,所以分割效果很好