ImVoxelNet论文解读

1. 文章和代码链接

《ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection》

paper:

https://arxiv.org/abs/2106.01178

code:

https://github.com/saic-vul/imvoxelnet

paperwithcode:

ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection | Papers With Code

team:莫斯科三星AI中心

2. 摘要

ImVoxelNet论文解读_第1张图片

摘要有如下3个关键点:

1)端到端的基于单帧或者多帧(每个场景帧数可以不一样)RGB图像的3D目标检测

2)能够兼容室内和室外(主要针对自动驾驶)的场景

3)能够兼容单目相机和多目相机(自动驾驶不同传感器配置组合)的目标检测

 3. 模型结构

ImVoxelNet论文解读_第2张图片

你可能感兴趣的:(自动驾驶,计算机视觉,人工智能)