【点云】M3DeTR: Multi-representation, Multi-scale, Mutual-relation 3D Object Detection with Transformers

【WACV 2022】M3DeTR: Multi-representation, Multi-scale, Mutual-relation 3D Object Detection with Transformers

  • 论文简介:
  • 基本思路:
  • 具体实现:
  • 实验结果:

论文简介:

本文提出了一种新的三维目标检测架构,M3DETR,它将不同的点云表示(原始、体素、鸟瞰图)与基于多尺度特征金字塔的不同特征尺度相结合。M3DETR 是第一种使用 Transformer 同时统一多个点云表示、特征尺度以及建模点云之间的相互关系的方法。

作者进行了广泛的消融实验,强调融合不同表示和尺度的好处,并建模的关系。该方法在 KITTI 三维目标检测数据集和 Waymo 开放数据集上取得了最先进的性能。结果表明,M3DETR 显著为 Waymo 开放数据集上所有类的基线提高了 1.48% 的 mAP,并在汽车和自行车类的 KITTI 3D 检测基准上排名第一,在具有单帧点云输入的 Waymo 开放数据集上排名第一。

基本思路:

基于不同网络的三维目标检测方法有两个关键的限制:

  • 无效的点云表示:用于处理点云的三种主要技术分别是基于体素、原始点云和鸟瞰图。每种表示都有一个独特的优势,并且已经表明,结合这些表示可以提高检测精度。然而,融合这些表示并不简单。首先,三类神经网络对应的结构是不同的。此外,在应

你可能感兴趣的:(▶,深度学习-计算机视觉,目标检测,3d,计算机视觉,深度学习,人工智能)