点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
本文转载自:新机器视觉
苹果公司近期正式推出了新款iPad Pro,吸引了不少人的关注。在官方的宣传标语中,有一句话尤其引人关注,“它的Pro级摄像头打通了真实和虚拟的交界”。
新款iPad Pro搭载的Pro级摄像头不仅包含了全新的超广角摄像头,还包含了一款激光雷达扫描仪。该扫描仪利用dToF技术,结合运动传感器和iPadOS内的架构,可以进行深度测量,为增强现实及更广泛的领域开启无尽可能。
那么dToF是什么呢,它和我们之前市面上已有的iToF又有什么不同呢?
本文将会介绍dToF和iToF的成像原理,对比分析dToF和iToF两者的差异性,带领大家了解一下ToF领域。
一、ToF是什么?
首先,让我们先来了解一下ToF的基本概念。
Time-of-Flight(ToF),顾名思义,是一种利用光飞行时间的技术。接触过3D视觉的读者应该知道,ToF和结构光、双目立体视觉是近年来三种主流的3D成像方式。ToF向场景中发射近红外光,利用光的飞行时间信息,测量场景中物体的距离。ToF相比较另外两种3D成像方式,深度信息计算量小,抗干扰性强,测量范围远。种种优势推动了ToF在机器人、交互以及其他工业领域中的应用。尤其是在移动端,已有多品牌手机,比如华为、OPPO、苹果,将其用于手机后置摄像。
二、dToF和iToF
了解了ToF的概念之后,让我们再来深入了解一下两类ToF的基本成像原理,也就是文章标题中提到的iToF和dToF。
dToF,全称是direct Time-of-Flight。顾名思义,dToF直接测量飞行时间。dToF核心组件包含VCSEL、单光子雪崩二极管SPAD和时间数字转换器TDC。Single Photon Avalanche Diode(SPAD)是一种具有单光子探测能力的光电探测雪崩二极管,只要有微弱的光信号就能产生电流。dToF模组的VCSEL向场景中发射脉冲波,SPAD接收从目标物体反射回来的脉冲波。Time Digital Converter(TDC)能够记录每次接收到的光信号的飞行时间,也就是发射脉冲和接收脉冲之间的时间间隔。dToF会在单帧测量时间内发射和接收N次光信号,然后对记录的N次飞行时间做直方图统计,其中出现频率最高的飞行时间t用来计算待测物体的深度, 。图1是dToF单个像素点记录的光飞行时间直方图,其中,高度最高的柱对应的时间就是该像素点的最终光飞行时间。
图1. 单像素记录的光飞行时间直方图示意图
dToF的原理看起来虽然很简单,但是实际能达到较高的精度很困难。除了对时钟同步有非常高的精度要求以外,还对脉冲信号的精度有很高的要求。普通的光电二极管难以满足这样的需求。而dToF中的核心组件SPAD由于制作工艺复杂,能胜任生产任务的厂家并不多,并且集成困难。所以目前研究dToF的厂家并不多,更多的是在研究和推动iToF。
iToF的概念和dToF相对应,全称是indirect Time-of-Flight,直译就是间接光飞行时间。所谓间接,就是指iToF是通过测量相位偏移来间接测量光的飞行时间,而不是直接测量光飞行时间。
iToF向场景中发射调制后的红外光信号,再由传感器接收场景中待测物体反射回来的光信号,根据曝光(积分)时间内的累计电荷计算发射信号和接收信号之间的相位差,从而获取目标物体的深度。如图2所示。
图2. iToF成像原理示意图[1]
iToF模组的核心组件包含VCSEL和图像传感器。VCSEL发射特定频率的调制红外光。图像传感器在曝光(积分)时间内接收反射光并进行光电转换。曝光(积分)结束后将数据读出,经过一个模拟数字转换器再传给计算单元,最终由计算单元计算每个像素的相位偏移。iToF计算深度的方式通常是采用4-sampling-bucket算法,利用4个相位延迟为0°,90°,180°和270°的采样信号计算深度。如图3所示
图3. 连续波调制方式测相位偏移原理示意图[2]
根据上述原理图,可以得到相位偏移的计算公式, 。然后,再根据相位偏移计算深度, 。其中, 是调制信号的频率, 是光速。
三、性能对比
dToF和iToF虽然都是利用光飞行时间技术,但是两者在测距原理和硬件实现上都有差异。软硬件的差异会导致这两类ToF在各方面的性能表现上各有千秋。
衡量ToF的性能指标,需要考虑几个方面。因为ToF是一个可以测距的相机,作为一个测距设备,基本的评价指标有测距精度和有效探测距离。其次,作为相机而言,图像分辨率也是一个重要的评价指标。此外,由于ToF本身只能提供3D信息,它将来更多的发展是集成到3D相关的应用,比如3D建模、AR以及移动平台。在集成到其他3D相关的应用时,尤其是移动端和机器人平台,必须要考虑它的能耗和成本,以及在各种复杂场景下的抗干扰能力。以上的这些特性,决定了dToF和iToF有着各自适用的应用场景。
接下来,本文会从精度、有效探测距离、图像分辨率、能耗、成本、抗干扰等7个方面,对比iToF和dToF的优劣。
精度
精度指真实深度值和相机的测量值之间的差,是衡量一个测量设备的基本指标。
对于dToF,由于它采用单光子雪崩二极管(SPAD),能够在很短的时间间隔内测量吸收的光子数,最小能够在 级的时间内产生响应电流。TDC的时间分辨率也高于 ,所以它的理论精度可以达到 。但是,由于雪崩过程存在量子噪声和放大器噪声,以及dToF中TDC模块存在的固有噪声,导致目前dToF的实际精度只能达到cm级,和iToF相近。但是,理论上dToF的测量误差不会随着测量距离的增加而增大。
iToF的测量精度和几个因素有关,分别是调制光的频率,光照功率以及积分时间。前文已经提到了iToF的深度计算公式 。由此,可以推出深度噪声(精度) 。由于c对应光速,是一个固定值,所以深度精度和调制光的频率、相位信噪比(phase SNR)有关。当相位信噪比一定时,频率越高,深度噪声越小,也意味着深度精度越高。
iToF的相位信噪比和传感器接收到的光电流有关系。
其中, 代表调制信号生成的电子, 代表调制光和环境光生成的电子总和, 代表电容的固有噪声, 是调制对比度,描述传感器分离和收集光电子的质量。所以, 调制光信号生成的电子数越多,相位信噪比越大,进而推出深度精度越高。增大 有两种方式,一种是增大光照功率,另外一种就是延长曝光时间,也就是前文提到的积分时间。
总的来说,目前的iToF深度精度在 级,并且随着测量距离的增大,反射光的强度减小,相位测量的信噪比减小,绝对误差也会随之增大。
有效探测距离
有效探测距离指相机能够输出可靠深度的距离范围,可靠深度意味着该深度值和真实值的误差小于一定阈值。举个简单的例子,假设测量误差在2cm以内时,我们视作该深度值是可靠的。如果一个ToF模组测量5米的物体时,测量值是5.02米,误差刚好达到了预先定义的极限。当物体位于5.01米时,测量值是5.22米,误差超出了2cm。我们就可以说该ToF模组的有效探测距离是5米。
当然,限制ToF的有效探测距离的主要因素之一是相位模糊现象。
对于dToF而言,当测量距离较远时,光飞行一个来回的时间超过了两次连续发射脉冲的间隔,传感器在发射第二个测量信号后,才接收到第一个测量信号的反射波,就会把该反射波错认为是第二个测量信号的近距离反射波,这时就会出现相位模糊现象。如图4所示。图4中case1表示的是近距离场景下dToF的测距原理图,case2表示的是远距离场景下,发生相位模糊现象的测距原理图。
图4. dToF脉冲测距原理示意图[3]
对于iToF而言,深度是通过相位偏移计算得到的,而相位偏移是通过一个反正切函数得到的 。反正切函数的返回值只会落在 ,所以测量深度的返回值也只会落在 。换言之,即使实际距离超出了 ,最终iToF的输出深度也会落在 。这是由于三角函数的周期性带来的相位模糊。
dToF会受到测量频率(相邻两次测量的间隔时间)限制,iToF的有效探测距离会受到调制光的频率限制。dToF在测量远距离物体时,可以适当增加两次测量之间的间隔,减少测量次数。但是,减少测量次数会同时降低测量精度,相当于是用精度换取有效探测距离。而iToF也可以通过降低调制光的频率,从而牺牲一定的测量精度以获得更远的有效探测距离。
对于iToF而言,可以利用双频解决相位模糊现象。利用两个不同频率的测量数据去求解相位模糊度,从而恢复正确深度值。借助双频测量可以同时实现高精度测量和高有效探测距离。
图像分辨率
dToF的图像分辨率受到SPAD的限制,分辨率一般小于QVGA(320*240像素),新款iPad Pro的dToF分辨率有所提升,但是具体大小还未可知。
iToF技术发展相对成熟,图像的分辨率大多都达到了QVGA(320*240像素),上海数迹的TC-S系列相机的分辨率可以达到VGA(640*480像素)。微软最新的Kinect有多个图像分辨率,最高可以达到1024*1024像素。
能耗
从发射信号来看, dToF则采用 级的脉冲激光,iToF目前大多采用连续波调制。相比较而言,脉冲波能够达到超低占空比,所以功耗也较低。
从光照模式来看,由于dToF的测量精度不会随着测量距离的增大而降低,所以功耗也会相对较低。反之,iToF目前采用的大多是面光发射方式。并且,随着测量距离的增大,iToF需要提高光照功率或者延长曝光时间来获取更高的精度,所需的功耗也会大幅增加。
成本
dToF采用的是数字电路架构,不需要模数转换。iToF采用的是模拟电路结构,需要模数转换芯片。
对于整体的硬件架构而言,dToF的核心组件SPAD的制作工艺复杂,现有的资源少。iToF没有这方面的顾虑。
在系统集成方面, dToF还需要额外的时间处理电路,系统集成难度较高。iToF的系统集成容易,不需要额外的测量电路。
抗环境干扰
环境干扰包括场景中环境光干扰、多路径反射光干扰以及不同表面灰度等影响。这一类环境干扰发生在外界,和ToF本身的关系不大,环境干扰的差异主要是由不同ToF的测距原理引起的。
dToF单帧深度图获取时,会经历多次重复测量,并且采用时间直方图统计的方式计算飞行时间,比较容易区分信号中的干扰成分。抗环境干扰能力更强。
iToF在曝光阶段,部分环境光混杂在调制光中被传感器接收,然后计算相位偏移。无法从单次测量的结果中区分出环境光引起的干扰。环境光越强,相应的,引起的深度误差也越大。
应用场景
dToF功耗低,并且体积小巧,更加适合工业机器人等需快速进行测距避障检测的应用,以及其他在空间受限的紧凑型设计中。
dToF抗环境干扰表现比较好,目前在户外场景下的测距精度比iToF更加高,在户外应用场景中也比较占优。
dToF的时间分辨率高,测量距离增大时精度不会大幅衰减,能耗也不会大幅提升,在AR应用中的优势也比较显著。
iToF的图像分辨率较高,在物体识别,3D重建以及行为分析等应用场景中能够重现场景中更多的细节信息,在机器人、新零售等应用领域占优。
四、3D ISP
dToF和iToF两者的目标都是输出一幅高质量的深度图像,所以两者都需要深度数据层面的滤波和噪声修正,比如空域滤波、点云域的噪声滤波以及非一致性像素校准等。此外,两者都拥有透镜成像系统,所以无论是dToF还是iToF,都需要透镜失真补偿。硬件的温度变化带来的噪声也同时存在于两种ToF中,所以温度补偿也是两者所必需的。
dToF是发射脉冲波,而不是特定频率的调制波,所以dToF不需要做和调制光的频率相关的处理,包括频率校准、自动频率选择、高动态范围(HDR)。但是dToF的发射脉冲也有一定的频率,即相邻两个发射脉冲之间的时间间隔,dToF的频率校准和发射脉冲的频率相关。dToF仅仅输出深度图,而iToF同时输出深度图和幅值图,所以dToF不需要做幅值校准。
此外,由场景干扰引起的多径、相位模糊、运动模糊、内反射等都是两者所共有的问题,虽然dToF因为成像原理的特性具有更好的抗环境干扰能力,但是还是会受到这一类场景干扰的影响。不过不同的是,因为dToF和iToF的成像原理不同,两者所需要的深度修正方式也会有所差异。
五、总结
dToF和iToF两者因为测距原理和硬件架构的不同,各方面的性能互有优劣,适用场景也不尽相同。两者均面临场景的适应性,如何在任意场景下获取可靠和准确的深度数据是非常大的技术挑战,是ToF技术普及的关键。ToF应用技术的普及有赖于3D ISP增强引擎来消除干扰,降低功耗,提高实时性能;需要面向3D行业的ISP IP及中间件,有力支撑上层应用。所以说3D ISP是3D成像市场爆发的必要条件。数迹智能团队正在研发3D ToF ISP Smart3D-ISP,以ISP技术为核心系统性地提升无论是dToF还是iToF的性能并降低功耗和成本是多年来的研发目标,将我们的3D ToF技术植入每部手机、每辆汽车、每个机器人、每台家电,从而改变机器对世界的“看法”,实现深度的智能。
来源:3D感知与智能
好消息!
小白学视觉知识星球
开始面向外开放啦
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。
下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~