近年来,在AR/VR以及自动驾驶、无人机、机器人等人工智能领域,对深度视觉的需求十分突出。目前的深度视觉产品主要是深度摄像头。深度摄像头除了能够获取平面图像以外,还可以获得拍摄对象的深度信息,也就是三维的位置和尺寸信息,使得整个计算系统获得环境和对象的三维立体数据。
按技术分类,深度摄像头可分为以下三类主流技术:结构光、双目视觉和TOF飞行时间法。
结构光
结构光是目前最主流、应用最广泛的深度感知方案,其基本原理是由结构光投射器向被测物体表面投射可控制的光点、光条或光面结构,并由图像传感器获得图像,通过系统几何关系,利用三角原理计算得到物体的三维坐标。
结构光法测量原理
应用:目前是业界比较成熟的深度检测方案,很多的激光雷达和3D扫描技术都采用结构光方案。结构光的代表产品有微软的Kinect一代。
优势:结构光方案优势在于技术成熟,识别距离远,深度图像分辨率可以做得比较高,但容易受光照影响。
缺点:由于以折射光的落点位移来计算位置,这种技术不能计算出精确的深度信息,对识别的距离也有严格的要求。而且容易受到环境光线的干扰,强光下不适合,响应也比较慢。
双目视觉
此类方案是指安装两个摄像头,利用双目立体视觉成像原理,通过两个摄像机来提取包括三维位置在内的信息进行深度感知。
双摄像头模拟双目视觉成像
应用:目前应用在智能安防监控、机器人视觉、物流检测等领域。市场上的典型的产品有LeapMotion,大疆无人机等。
优势:双目视觉的方案不容易受到环境光线的干扰,适合室外环境,满足7*24小时的长时间工作要求,不易损坏。而且,由于不涉及光学系统,因此双目视觉的成本是三种深度感知方案中最低的。
缺点:不足的是,这种技术需要庞大的程序计算量,对硬件设备有一定配置要求,同时受外界环境影响大,比如环境光线昏暗、背景杂乱、有遮挡物等情况下不适用。
TOF飞行时间法
TOF是飞行时间(Time of Flight)技术的缩写,基本原理是传感器发出经调制的近红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄景物的距离,以产生深度信息,此外再结合传统的相机拍摄,就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。
TOF原理
应用:可用于机器人、制造、医疗技术以及数码摄影等领域的设备控制。市场上的典型产品有Kinect2代。
优点:TOF其实是相对结构光和双目视觉来说受环境影响最小的技术,响应速度快、深度信息精度高。
缺点:由于传感器芯片并不成熟,成本很高,所以实现量产困难。另一方面,TOF分辨率不高,因此不适合精度要求高的场景。
深度摄像头的应用范围非常广泛:工业领域、智能监控、物流领域、AR/VR等等,随着技术的发展,整个行业将为深度感知寻找更加丰富的应用场景