3D视觉基本概念

近年来,三维传感器例如激光雷达、三维扫描仪、深度相机等的发展,使三维数据的获取越来越容易,这促进了3D视觉技术的飞速发展。3D视觉技术的应用领域包括:

  • 智能无人系统(机器人、无人车、无人机等):感知、理解周围环境、实时定位、创建地图、躲避障碍等;

  • AR&VR:感知相机位姿与现实世界交互、感知物体位姿与物体交互;构建场景地图实现高度、遮挡等交互效果等;

  • 遥感制图:大场景三维重建;

  • 娱乐和多媒体等方面:人脸3D重建、人体3D重建、人脸表情估计、人体姿态识别等;

那什么是3D视觉呢?陈宝权教授总结出,3D视觉是一个多学科的交叉融合,可以说:计算图形学+计算视觉+人工智能=3D视觉。具体来讲,3D视觉包含以下任务:

  • 3D重建:3D场景的深度估计或者对物体表面的数字化采样,以及对3D数据的处理及展示;涉及任务:单目重建、双目重建、基于结构光的重建、基于激光的重建;大场景三维重建、移动端三维重建;

  • 位姿感知:对相机或物体在三维物理空间中的位置和朝向的计算、以及实时跟踪;

  • 3D理解:物体的检测、识别、检索,以及对场景或者物体的分割和语义标记等。

可以说,3D视觉涵盖了多个学科的内容。无论你是做视觉、图形学、机器人、自动化、机器学习等方向的,都可以算作3D视觉的范畴。

从学术界角度来讲:3D视觉领域是研究热点,每年的顶会有CVPR,ICCV,ECCV,3DV;顶刊有TPAMI,TOG,IJCV,TVCG等;

从工业界角度来讲:有视觉公司:商汤、旷视;有无人驾驶公司:百度、阿里、Momenta;有机器人公司:地平线、达闼科技;有AR公司:亮风台、EasyAR等;

To sum up, 3D vision is a promising area for both academic and industrial community.

你可能感兴趣的:(3D视觉)