#今日论文推荐# ICLR2022 ViDT | 检测超越YOLOS,实例分割超越SOLOv2,同时达到实时.

#今日论文推荐# ICLR2022 ViDT | 检测超越YOLOS,实例分割超越SOLOv2,同时达到实时!!!

Transformers被广泛应用于许多视觉问题,特别是视觉识别和检测。Detection Transformers是第一个完全端到端的目标检测学习系统,而Vision Transformers是第一个完全基于Transformer的图像分类体系结构。
在本文中,整合VisionDetection Transformers(ViDT)来构造一个有效且高效的目标检测器。ViDT引入了一个重新设计的注意力模块,将最近的Swin Transformer扩展为一个独立的目标检测器,然后是一个计算高效的Transformer解码器,利用多尺度特征和辅助技术,在不增加太多计算负载的情况下提高检测性能。

论文:An Extendable, Efficient and Effective Transformer-based Object Detector
全文解读:https://www.aminer.cn/research_report/6260c6257cb68b460fa4cae7?download=false?f=cshttps://www.aminer.cn/research_report/6260c6257cb68b460fa4cae7?f=cs

AMiner链接:https://www.aminer.cn/?f=cs

你可能感兴趣的:(算法,数据结构,数据库架构)