人工智能 - SpatialLM:三维空间理解的开源大语言模型

项目概述

SpatialLM 是由杭州群核科技(“杭州六小龙”之一)于 GTC 2025 大会上开源的三维空间理解大语言模型。该项目旨在通过多模态数据处理能力,将非结构化的三维几何数据(如点云、视频)转化为机器可读的结构化场景描述,为机器人导航、建筑设计、AR/VR 等领域提供高层次的语义理解支持。

项目官网:SpatialLMhttps://manycore-research.github.io/SpatialLM/
GitHub 仓库:

你可能感兴趣的:(人工智能,#,VLA,具身智能,语言模型,人工智能,自然语言处理)