受访者 | 孔博
记者 | 夕颜
图源 | 视觉中国
出品 | AI科技大本营(ID:rgznai100)
提到AI 3D传感技术,也许很少有人脑中有概念。但是以下图iPhone手机最早推出的3D虚拟表情生成为例,大概就会知道这项技术可以用来做什么了。
2017年苹果推出的iPhone X中的虚拟表情带火了背后涉及的3D传感技术。当时这项技术还曾引发“3D传感技术是否会在智能手机中流行”等话题,虽然这些问题的答案在今天已经显而易见了。
什么是AI 3D技术?
3D传感技术其实并不算是个新鲜词汇,本身也并没有多神秘。通俗地来讲,3D传感技术是利用3D视觉传感器通过向目标投射特殊波段的主动式光源,并对反射回的光信号进行计算,最终实现对物体的三维深度信息采集,为后期的图像分析提供了关键特征。由于3D传感技术可获取物体的深度信息,搭载3D视觉传感器的智能设备就能够据根据3D传感复原现实三维世界,并实现后续的智能交互,因此3D视觉传感器也将成为AIoT设备智能交互的核心部件。
而AI 3D顾名思义,就是3D传感技术与AI技术的结合,比如兼备3D量测和3D机器人引导的智能传感器不仅能实现机器操作的可视化,还可以通过信息处理进行控制决策,成为如今最热门的机器视觉技术。AI 3D预计将成为下一代消费电子图像传感、AR 定位的底层技术。
如果把计算机视觉应用比作人的“眼睛”,3D传感技术就相当于人眼的成像层,只有底层的“成像”做得好,才能确保“大脑”能基于“眼睛”获取的图像进行更好的决策。
AI 3D传感技术在计算机视觉技术领域中是最为核心的底层技术之一,技术门槛高、长期被国外占据、市场相对来说也比较“小众”,但正因如此,对于国内企业来说,掌握自主可控的核心技术就显得尤为重要。
在这批掌握了AI 3D传感技术核心技术的企业中,来自深圳的奥比中光就是其中的典型代表。这家公司2015年推出了国内首颗3D视觉成像芯片,还是亚洲第一家、全球第四家量产自主知识产权消费级3D视觉传感器厂商,包括OPPO Find X的3D结构光模组,蚂蚁集团支付宝人脸支付的3D摄像头在内的产品,背后的供应商就是这家公司。
在今年第十届“吴文俊人工智能科学技术奖十周年颁奖盛典上”,奥比中光的“微型3D智能传感器关键技术及应用”获得了“吴文俊人工智能科技进步奖(企业技术创新工程项目)”奖项,肯定了这家公司在3D视觉感知芯片及传感器等核心技术上的创新。
微型3D智能传感器关键技术及应用
此次获奖的“微型3D智能传感器关键技术及应用”方案具体是怎样的?AI科技大本营与奥比中光科技集团股份有限公司副总裁孔博进一步沟通,了解了这项技术的更多细节。
孔博解释,“微型3D智能传感器关键技术及应用”涵盖自研高分辨率3D视觉芯片传感系统、深度算法以及SDK等全栈式技术。在技术攻关中,奥比中光主要解决了以下几个关键技术问题:
① 解决了测量距离与测量精度难以并存的难题。
一般情况下,测量范围越大,其测量精度就越低。本项目中要实现的测量距离为0.5~8米,而测量精度需要达到2mm,因此需要研究高精度的三维成像算法,保证单个视角的高精度成像质量。为了实现大范围的测量,在光学系统端设计低温漂投射与采集模组,在算法方面不断优化算法并将算法芯片化,同时开发多层次高精度标定算法,最终保证在大测量范围的前提下实现高精度测量。
② 设计能满足人工智能行业3D传感系统的苛刻需求的光学测量方案。
奥比中光设计了低功耗、高精度、小体积的散斑投影系统和抗环境干扰的高性价比成像系统;设计机械件参数、控制机械件公差以达到核心算法计算量最小、精度最高、鲁棒性最好的目的;通过调制控制激光及同步控制CMOS传感器以达到噪音最低;通过TEC温控系统控制激光温度以达到系统稳定精确的目的。在光学方案的制定上,主要进行红外投影激光的波长选择与吸收性测试,经过多次实践得出的较为理想的波长约850nm,保证成像质量和较高的动态范围,同时保证投影图像可以适应多种吸收表面。
③ 核心算法的固化及FPGA、ASIC芯片设计和流片。
智能终端,比如机器人本身的处理器需要承担诸如机械控制、定位、建图、导航等大量的数据计算,因而一直存在一些性能和功耗问题,采用嵌入式的RGB-D图像专用SoC芯片(System on Chip,系统单晶片),可以达到实时处理快速响应的要求并缩小体积及成本,另外还可以降低功耗。
3D传感器市场竞争白热化,
中国掌握自主可控核心技术时不我待
3D传感器市场虽然是计算机视觉中的核心部件,技术门槛高,市场也相对“小众”,但市场规模却一点也不小。
根据孔博的观察,3D传感器市场的整体竞争如今已经进入白热化阶段。他分析道,国际科技巨头如苹果、微软、英特尔、Facebook等已经开始在3D传感器市场“重兵布局”,抢占赛道,争夺如芯片、传感器等位于价值链“金字塔”的底层核心技术领域。根据Yole的预测数据,2023年3D视觉感知的全球市场规模约可达到184亿美元,其中消费电子与汽车将成为最大增长引擎。
”面对地位重要、商机巨大的3D视觉感知市场,中国掌握自主可控的3D视觉感知核心技术时不我待,”孔博有了这样的预感。
实际上,目前世界上仅有少数公司能够做到独立掌握3D传感器领域全部相关核心技术,奥比中关可以算是这少数其中的一个,而此次获奖的3D视觉芯片方案,研究领域跨度大,涉及光学系统设计、算法、芯片设计及流片以及人工智能识别技术,对于促进我国自主核心算法芯片国产化具有重要的意义。
奥比中光的自强路径
为什么奥比中光能够在3D传感器领域实现国产化突围?我们其实可以从这家公司的8年的创业创新路径上总结出不少可以借鉴的经验。
孔博认为,奥比中光能够做到自主创新,关键要素就在于其坚持系统级自主研发、全栈式技术布局。而其中,系统级自主研发、掌握核心技术是最根本的一步。
孔博说到,可能与其他公司不同,奥比中光在成立之初就付出巨大成本,坚持自主设计研发关键的一“芯”一“线”:“芯”是3D视觉感知深度算法的核心芯片,“线”则是3D传感摄像头模组的生产线,啃下难啃的“硬骨头”,从而抢占3D视觉感知行业高地。
如今,坚持自主创新的奥比中光已经拥有了从3D传感技术,到芯片、算法,到系统、框架、上层应用支持的全栈技术。
在最核心的芯片层,奥比中光目前已经研发并量产了四款3D视觉感知芯片,包括MX400、MX6000、MX6300、MX6600。虽然目前奥比中光没有对外单独发售芯片,而是集成在奥比中光的产品、模组中发售,但与市面上同类芯片相比,奥比中光芯片的优势主要在于功能满足奥比在3D测量领域的需求,同时性能、功耗和成本平衡得比较好。
而在系统和算法层面,这家公司也在不断寻求创新。
在系统层,以奥比中光在手机领域推出的iTOF系统方案为例,该创新性方案克服了传统iTOF方案的数据精度受环境影响的不足,对硬件和算法都做了创新式提升,测量精度和分辨率都显著提高。
在算法方面,奥比中光推出定制化的行业应用算法。以智能门锁领域为例,奥比中光开发了3D结构光人脸辨识算法、多模态人脸识别算法,使得门锁安全防伪能力可以有效抵御照片、面具以及头模等多种手段的攻击,其基于3D结构光的人脸辨识算法和人脸活体检测技术也通过银行卡检测中心(BCTC)的双重认证,达到国家金融支付增强级安全标准。
而从应用层面来说,奥比中光在AIoT芯片这个潜力巨大的市场中同样早已开始布局。AIoT现在最棘手的问题之一,就是现阶段商未来发出能够跨设备形态存在的通用芯片,一般来说AIoT都是走定制化芯片的路线。孔博透露,奥比中光正在研发中的一款边缘端计算AIoT芯片,也是采取定制化芯片架构的路线,以针对广泛的应用场景进行性能、功耗的优化。未来这将是一款怎样的AIoT芯片,我们可以期待一下。
3D计算机视觉会带来一个怎样的未来世界?
最后,孔博还分享了他对于3D计算机视觉对我们未来生活影响的畅想。在他看来,3D视觉感知技术可以对空间、人体、物体的三维扫描和建模,实现Vslam视觉导航、动作行为识别、人机交互等功能。
”当前,全球出现了过去十年来最大的信息化、智能化升级和变革浪潮,未来十年,如果要让机器人、汽车、手机实现高度智能化,必须配备3D视觉感知技术能力。这意味着,手机/平板需要结构光和ToF解锁、拍照、开发AR功能,机器人需要结构光避障、提升人机交互体验,汽车需要激光雷达实现主动安全,AR/VR需要dToF打造Cyberverse,”孔博预测。
此外,他还看到随着AIoT的不断发展与5G的普及,3D视觉感知将被越来越多地运用于消费电子、智能家居、交通出行以及工业制造等领域。未来,3D视觉感知技术还将广泛应用于AI私教、个性化服装定制、自动驾驶、AR/VR等场景。
嘉宾简介:孔博,奥比中光科技集团股份有限公司 副总裁,兼任深圳市人工智能产业协会 副会长,深圳市南山区青年企业家协会 副会长,汕头大学MBA企业家导师
更多精彩推荐 还在担心无代码是否威胁程序员饭碗?
从程序媛到启明星辰集团云安全总经理,郭春梅博士揭秘云时代安全攻防之道微软每年豪砸安全研发 10 亿美元,聊聊背后的技术密码除了 k8s,留给 k 和 s 中间的数字不多了再见 Nacos,我要玩 Service Mesh 了!点分享点收藏点点赞点在看