BEVDet: High-Performance Multi-Camera 3D Object Detection in Bird-Eye-View
背景在自动驾驶场景下,以往工作是目标检测任务用图像视角做,语义分割用BEV视角做。本文提出了BEVDet,实现了一个统一的框架,它模块化设计分为图像编码器,视角转换器,BEV编码器以及BEV空间的3D检测头。然而框架定下来不代表性能好了,BEVDet在BEV空间上过拟合了,这需要在图像空间增加数据增强,但只有在没有BEVEncoder时才会有正效果。此外,由于图像空间到BEV空间是像素级联系的,图