目前,计算视觉技术发展到三维图像动态识别阶段。相比较二维识别,三维识别增加了一个Z轴的信息,这是现在乃至未来的主要发展方向。不过这种包含一定深度信息的识别,需要特别的硬件来实现。目前,很多世界主流厂商已经在三维视觉领域有了深入的布局,无疑,这就是未来的科技,想不想提前知道?
苹果
整合行业先驱PrimeSense,发力3D手势与人脸识别
2013年11月,苹果收购以色列3D传感器生产商PrimeSense,微软的Xbox 360所用的Kinect感应器就采用了PrimeSense的专利技术,能够让玩家们通过手和身体的姿势来控制他们的游戏机。PrimeSense还推出了当时世界上体积最小的3D传感器Capri,它的分辨率是前代产品的3倍,而体型是前代的十分之一,环境光的检测性能是前代的50倍。自2013年收购PrimeSense之后,苹果推动PrimeSense的3D体感控制器向小型化发展,希望可以将其装配到电视、PC上,最终可以用在未来的iPhone上。
2015年,苹果获得了一项专利,这项专利涉及到基于机器习得的人手和手指姿态推算技术,利用这种技术,光学3D绘图系统可以通过专业化的习得算法更精确地识别用户的手势。
2016年7月,苹果再次公布新型3D手势控制专利,是一个图形投影仪,内嵌在一个诸如如iPhone手机这样的iOS设备上,可以识别出用户的手势操作,由此可以作为把手势作为游戏的控制杆或者控制器。
2017年1月15日,美国权威咨询机构Cowen and Company发布报告称,苹果的下一代iPhone可能会包含某种面部识别或手势识别功能,由安装在前置摄像头附近的一款新的激光发射器和红外感应器支持,新款iPhone可能会配备一种新的深度感应器,可以为未来的iPhone增添手势识别、人脸识别,甚至增强现实AR功能。
英特尔
持续强化升级RealSense,“结构光+双目立体光”
早在2012年左右,英特尔便着重研发实感技术,当时叫Perceptual Computing,即感知计算,并开放英特尔感知计算软件开发套件2013 版。2013年1月,英特尔联合Nuance等多家公司推出了“实感计算”,即RealSense,类似于微软的Kinect,借助这个技术可以在三维中进行扫描、改进、打印和分享,还可以使用手势和手指动作感应技术操控扫描的三维物体并与之进行互动。
英特尔的3D摄像头分为两种:一种是用于近距离,精度较高的前置3D摄像头;另一种是可用于较远距离,精度稍低的后置3D摄像头。
经过多年的努力,英特尔目前可以提供包括SR300独立摄像头、R200远距离后置摄像头(3-4米,室内室外使用,640*480分辨率)、F200近距离前置摄像头(0.2-1.2米,室内使用,640*480分辨率)等硬件产品。
ivvi
率先推出技术成熟的裸眼3D手机
拥有裸眼3D专利技术的超多维控股手机新锐企业ivvi公司,强强联合全力挺进3D市场,标志着裸眼3D已经进入市场全面爆发期,一场人类视觉的革命即将到来。
下图为ivvi与超多维合作的新产品SuperD D1以及3D BOX等产品。
要想在家里就能欣赏到阿凡达、功夫熊猫等的精彩演出,一台支持裸眼的3D手机必不可少,ivvi公司的D1手机,其可以在2D、3D和VR三者之间切换,这也就意味着只要一部手机就能有三种不同的视觉体验,最为黑科技的当属裸眼3D了。为了实现这一功能, D1加入了双芯、三摄设计,双芯就是在CPU之外,还有一个独立的VR视觉运动芯片,提升3D/VR渲染速度。三摄即在常规摄像头之外,前置双摄像头,其中一颗用于人眼追踪摄像头,根据用户的眼部位置、瞳距,定制并实时生成相匹配人眼位置的合理视角图象。与之前的技术相比,ivvi的D1解决了卡顿,晕眩,内容过少等硬伤,内置平台含有近千部3D电影和数百款3D精品游戏。
微软
从Kinect到Handpose,3D识别精度大幅提升
微软是最早涉足3D视觉的公司之一,公司在游戏领域推出XBOX游戏机,志在与索尼和任天堂的游戏机一较高下,为了形成自己的竞争优势,微软在2010年与PrimeSense合作,推出了XBOX360体感周边外设——Kinect1代。但是,当时采用结构光原理的Kinect1代的游戏体验并不好,产品的准确度、图像的分辨率和响应速度一直不理想。
2012年微软先后收购了TOF(时间光)相机公司canesta和3dv,2013年微软终止与PrimeSense的合作,自行开发了Kinect2代(成为Kinect one),采用的是TOF(时间光)原理,无论精度、分辨率还是响应时间都得到了很大的提升。TOF原理发射一个强度随时间周期变化的正弦信号,通过获得发射、接受信号的相位差来计算深度,精度高很多。
谷歌
Tango项目野心勃勃,提前布局移动端3D视觉
Project Tango是谷歌公司的明星研究项目,由谷歌先进技术与项目部门和部分研究人员,以及硅谷Movidius(已被英特尔收购)合作研发,后者提供的芯片技术可以分析和表达来自传感器和摄像头的数据。Project Tango项目的目标是希望将人类的视觉带入移动设备,为移动设备加入类似人类对空间和运动的感知能力。
Project Tango包含三块技术:运动追踪(Motion Tracking),深度感知(Depth Perception)和区域学习(Area Learning)。首先是运动追踪,设备可以通过内置的姿态传感器(加速度计和陀螺仪等)来感知当前的位置;接下来是更深入的3D识别,可以检查出周围世界环境的形状,类似于英特尔的RealSense 3D摄像技术,可以获得更准确的姿态控制以及3D对象渲染;最后就是对周围的环境和区域绘制地图。
索尼
收购明星企业SoftKinetic,弥补短板
2015年10月,SONY 宣布收购比利时传感器技术提供商SoftKinetic。SoftKinetic是一家专门从事深度传感摄像头技术的电脑视觉初创型企业,成立于2007年,专注研发体感技术,其传感器技术能够追踪诸如手势等相关的图像。SoftKinetic技术能够部署到安装在AR和VR硬件上的摄像头之中,从而增加手势与面部追踪的能力。SoftKinetic公司的摄像机采用TOF方案。
三星
手势识别助力凌空操作Gear VR
科技公司Gestigon和Pmd在2016年6月宣布在三星GearVR上合作研发手势识别,结合Pmd的CamBoard pico flexx深度传感器和Gestigon的Carnival AR/VR Interaction Suite(增强/虚拟现实互动套件),在现有的VR设备上进行无触摸手势交互。比如,使用手势识别从多项选择菜单中进行选择,或者跟虚拟对象互动。
Carnival SDK需要Pmd的pico flexx传感器提供的深度信息,该传感器就安装在GearVR头戴设备的前面,并且跟智能手机的USB接口连接。Pmd CamBoard pico flexx的简化型要素和低功耗说明它现在可以将深度传感器植入移动设备。再加上为近距离无接触互动进行的高帧率深度测量,该传感器还能实现远距离环境扫描和识别。Pmd目前正在研究OEM,目的是将其深度传感器植入众多下一代消费者版本的设备当中,包括智能手机、平板电脑、头戴设备和物联网家电。
相信,随着巨头们对3D技术的进一步研究与应用,消费者在不久的将来会领略到更加震撼和酷炫的3D技术,未来离我们已经不远!