经典/最新计算机视觉论文及代码推荐

今日推荐几篇最新计算机视觉方向的论文,全部都是基于最近很火的transformer框架来进行目标检测或跟踪,把这几篇论文和代码研究透,基本就对基于transformer的框架有个大概了解,具体内容详见论文原文和代码,。

transformer端到端检测

经典/最新计算机视觉论文及代码推荐_第1张图片

  • 论文题目:End-to-End Object Detection with Transformers

  • 论文链接:https://arxiv.org/pdf/2005.12872v3.pdf

  • 代码链接:https://github.com/facebookresearch/detr

作者提出了一种目标检测的新方法,将物体检测视为一个直接的集合预测问题,是第一个将 transformer 成功整合为检测 pipeline 中心构建块的目标检测框架。基于Transformers的端到端目标检测,没有NMS后处理步骤、真正的没有anchor,且对标超越Faster RCNN。

经典/最新计算机视觉论文及代码推荐_第2张图片


这篇论文是transformer框架目标检测的开山之作,真正使transformer从自然语言处理杀入到目标检测领域。

基于transformer的3D目标检测

  • 论文题目:An End-to-End Transformer Model for 3D Object Detection

  • 论文链接:https://arxiv.org/pdf/2109.08141v1.pdf

  • 代码链接:https://github.com/facebookresearch/3detr

经典/最新计算机视觉论文及代码推荐_第3张图片

作者提出了3DETR,一个基于Transformer的端到端三维点云物体检测模型。与现有的检测方法相比,3DETR需要对普通的Transformer块进行最小的修改,这些方法采用了一些特定的3D感应偏置。具体来说,作者发现,具有非参数查询和傅里叶位置嵌入的标准转化器与采用具有手工调整的超参数的三维特定运算器库的专门架构相比,具有优势。

经典/最新计算机视觉论文及代码推荐_第4张图片

用HOI变换器进行端到端的人与物互动检测

  • 论文题目:End-to-End Human Object Interaction Detection with HOI Transformer

  • 论文链接:https://arxiv.org/pdf/2103.04503v1.pdf

  • 代码链接:https://github.com/bbepoch/HoiTransformer

经典/最新计算机视觉论文及代码推荐_第5张图片

作者提出了HOI Transformer,以端到端的方式解决人与物体交互(HOI)检测问题。目前的方法要么将HOI任务解耦为物体检测和交互分类的独立阶段,要么引入代用的交互问题。相比之下,作者提出的HOI Transformer,通过消除对许多手工设计的组件的需要,简化了HOI管道。HOI Transformer从全局图像背景中推理出物体和人类的关系,并直接并行地预测HOI实例。

经典/最新计算机视觉论文及代码推荐_第6张图片

后续

下一期最新/经典视觉论文敬请期待!

你可能感兴趣的:(计算机视觉论文及代码推荐,transformer,深度学习,计算机视觉)