#今日论文推荐#霸榜COCO,DINO: 让目标检测拥抱Transformer

#今日论文推荐#霸榜COCO,DINO: 让目标检测拥抱Transformer

PR 一下我们最近刷榜 COCO 的目标检测模型,DINO(DETR withImproved deNoising anchOr boxes),从三月初霸榜至今(7 月),该模型第一次让 DETR (DEtection TRansformer)类型的检测器取得了目标检测的 SOTA 性能,在 COCO 上取得了 63.3 AP 的性能,相比之前的 SOTA 检测器将模型参数和训练数据减少了十倍以上!

主要特性

  1. SOTA 性能:在大模型上以相对较小的数据和模型(~1/10 相比之前 SwinV2)取得了最好的检测结果。在 ResNet-50 的标准 setting 下取得了 51.3 AP。
  2. End2end(端到端可学习):DINO 属于 DETR 类型的检测器,是端到端可学习的,避免了传统检测器许多需要手工设计的模块(如 NMS)。
  3. Fast converging(收敛快):在标准的 ResNet-50 setting 下,使用 5 个尺度特征(5-scale)的 DINO 在 12 个 epoch 中达到 49.4 AP,在 24 个 epoch 中达到 51.3 AP。使用 4 个尺度特征(4-scale)的 DINO 达到了了类似的性能并可以以 23 FPS 运行。

论文题目:DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection
详细解读:https://www.aminer.cn/research_report/62de12b27cb68b460ff370f1icon-default.png?t=M666https://www.aminer.cn/research_report/62de12b27cb68b460ff370f1
AMiner链接:https://www.aminer.cn/?f=cs

你可能感兴趣的:(深度学习,深度学习,计算机视觉,人工智能)