21、LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding
简介官网 将原始LiDAR数据作为输入,利用LLMs卓越的推理能力,来获得对室外3D场景的全面了解,将3D户外场景认知重构为语言建模问题,如3Dcaptioning,3Dgrounding,3Dquestionanswering。实现流程 给定LiDAR输入L∈Rn×3L\in\R^{n\times3}L∈Rn×3,n是点的数量,使用VoxelNet获取LiDARFeature,考虑到计算成本,沿