雷锋网(公众号:雷锋网)按:本文是《VR实现空间定位的7种利器》的续集。 作者为VR行业资深从业者王锐。
正如前文所述,现在VR体验馆的构建却还缺少最重要的一环,就是廉价而灵活准确的定位方案。
谈及VR空间定位的利器,除了体感定位、光学定位与图像识别、空间雷达、HTC Vive的Light House,本文将继续谈谈余下的2种利器,并对已有的空间定位方案的优劣进行总结,欢迎探讨。
实时差分GPS技术至少有两个部分组成:在基站上安置接收机,对所有可见的GPS卫星进行连续观测,并将观测数据通过传输设备(比如数传电台,WIFI,以及公用3G/4G通信网等等),实时地发送给用户观测站(流动站);而在用户观测站上,同样通过GPS接收机接收GPS卫星信号,同时还通过无线电接收设备,接收基站传输的观测数据,然后通过相对定位实时地解算用户的三维坐标,其动态定位精度可达1cm-2cm。
这一技术不仅可以用作测绘,也可以用于军事用途。它的高精度特性可以用于联合收割机等大型农用机械的精确导航,从而在大机械生产和精耕细作之间达到完美结合;而在国内,一个相当广泛的民用场景则是驾校考杆……
在RTKGPS出现之前,测绘行业为了获得一个精确到厘米的坐标,需要用普通GPS设备接收数据然后进行大量的离线计算。而RTKGPS的出现大大发展了许多新的应用场景,例如无人机。RTKGPS原本属于专业领域,使用者寥寥且售价也非常高,不过近些年来已经有越来越多的从业者将这项技术变得更加亲民,例如下图这块开源RTKGPS套件:
(Via www.swiftnav.com)
不过,RTKGPS毕竟是GPS,必须在户外才能够使用。这对于通常计划设置在室内或者大商场中心的VR体验馆来说,无疑是一大不利的消息。不过室外的极重度VR体验也绝非没有先例,例如下文链接中的视频曾一度红遍各大媒体和朋友圈(但是真的是高度危险,绝不要自行尝试)——《戴上VR头盔开赛车,炫酷到没朋友》。
这原本是某汽车大厂牌和某润滑油一起搞的一次公关活动,赛手带上OculusVR头盔,同时车上装载了高性能电脑,从而完全体验到在虚拟空间当中漂移的乐趣。而这个冒险活动之所以能够成功,其中一大原因就是采用了RTKGPS来完成定位,这样才能比较精确的知道车与驾驶员的位置,并且安排对应的虚拟内容呈现(以及避免车手乐极生悲跌出场外)。
UWB定位技术属于无线定位技术的一种,这一技术(Ultra Wide band)也被称为“超宽带”定位,它是一种利用脉冲信号进行高速无线数据传输的短程通信技术,而非一般无线通信系统所广泛采用的载波方式。
UWB定位的原理其实也很简单,就是利用信标发出的脉冲到达基站的飞行时间来解算位置,没错,还是我们所熟悉的名字,TOF(Time of Flight)。
不要忘了无线电也是基于光速传播的,因此它的探测精度从理论上可以做到很高。
UWB最初的定义是来自于60年代兴起的脉冲通信技术。UWB技术的脉冲长度通常在亚纳秒量级,而信号带宽可以达到数千兆赫兹(UWB限制在3.1 - 10.6 GHz),这项技术在1989年被美国国防部命名为超宽带技术。其特点是大带宽,无载波,低功率。
(Via 36kr.com)
正因为带宽超大,因此UWB技术的穿透性比较好。而相比WIFI等技术来说,无线电的多径效应(因为高频信号都是直线传播的,所以会因为建筑的遮挡等来回弹跳分成几路,难以判断)要弱的多,所以这一定位方案的精度往往要比传统的基于WIFI的Room-Level方案(即判断用户在室内的哪个房间)高出不少。现在成熟的UWB定位方案系统甚至可以做到几十厘米,也有个别方案商号称能有2-5厘米的精度级别,但是实际在各种不同空间的建筑物室内场合部署的时候,基本上还是达不到这个精度。毕竟不可能所有的场地都是一个空旷且没有任何遮挡,也没有更多人参与的大屋子。而且不要忘记这项技术本身的核心还是通信链路,因此各种设备的通信干扰同时也产生了。
毕竟UWB本身还是一种无线电技术,它所覆盖的频段内所有的无线通信都会对它有所干扰,并且它的穿墙性能尽管比别的无线技术更好,但是仍然会有较大衰减。而且UWB的标准是限制发射功率的,所以现在绝大多数方案都是在10米左右有效,如果是室内较大场馆的话,可能还要布设大量的通讯基站。
所以,目前如果采用UWB独立定位的方案,恐怕还是达不到重度VR体验所需要的定位精度和定位距离,不过如果可以与其他方式进行数据融合的话,也许有希望解决这一问题。
比如德国著名的Fraunhofer研究中心,早就有一种”黑科技”产品叫做RedFir:
(Via is.fraunhofer.de)
在球员双脚的球鞋中安装设备,以及球内放置好设备,同时在整个场地里布设大量的采集基站之后,整个球场就变成了一个高科技虚拟演播室,可以在进行比赛转播的过程中随时进行数据采集和分析,可视化的工作。这样的好事当然也有希望用到VR体验当中,只是为了无线传输本身的那些关键问题,恐怕依然要开发者们付出不小的代价。
SLAM的英文全称是:Simultaneous Localization and Mapping,即时定位与地图构建。
简而言之,对于空间内的一个机器人(或者无人机),如果它处在一个完全未知的环境里(比如古墓探险),那么它就可以一面沿着墓道往里走,一面用摄像头或者激光雷达来创建了这个墓道的数字信息拷贝(也就是构建地图),这样然后过一会就可以使用刚才创建的地图数据给自己导航使用了。
哦,一些非常高档的扫地机器人,也号称用到了这项技术。
在电影《普罗米修斯》中有这样一个场景,一个拥有激光探测信息能力的无人机(球)被扔出去之后,它就开始自主获取空间信息。这就是一个典型的SLAM应用场景:
实际上,从学术定义上来说,机器人在完全未知的环境中从一个未知位置开始移动,然后在移动过程中根据位置估算和自身传感器的数据进行不断的定位和修正,同时建造增量式的地图,这就是SLAM方法的基本过程了。
当然,这种方法不一定只服务于机器人,如果是人自己背负了便携的计算设备(或者就是手机),那么通过SLAM同样能在未知环境里创造地图并给自己定位,这就是我们在VR场景中所迫切需要的功能了。
SLAM算法的数据源是多种多样的,比如用激光雷达扫描的点云数据,也有双目摄像头利用RGB图像和立体视觉来生成,或者就是直接使用Kinect这样的RGBD(可见光+深度)方案;而实验室级别中甚至也可以见到基于单摄像头和RGB彩色图像或者灰度图像来做SLAM的算法论文。
从另一个角度来说,如果期望实现基于三维空间的识别技术(而不是传统的二维码或者图片),那么就意味着必须更好更快地应用SLAM类的方法,而也是各大AR软件和算法开发者(例如Metaio,不过已经被苹果收购)一直在努力实现的目标。因为SLAM一方面能够给出一个比较精准的空间位置,同时还能做为环境三维特征获取和三维重建的必要手段,进而解决了显示设备里实际场景和虚拟画面叠加时,相互遮挡关系的问题,这样的AR场景在将来也许是广泛应用的,也是随身可穿戴的一种刚性需求。
如今,SLAM已经被广泛的应用在了VR/AR的设备上了,比如微软的HoloLens就是典型的RGBD SLAM方案。而Google的Project Tange手机,以及Intel的 RealSense都属于RGB-D SLAM的设备范畴。即使是一直没有多少人见过实物的“黑科技”公司Magic Leap,恐怕也不可能不采用SLAM来做为空间定位和虚实遮挡关系判断的基石。
而SLAM在高端商用市场上,其实早就有很成熟的案例。例如虚拟演播室摄像机系统NCAM,它无需传统的电控云台,可以直接架在斯坦尼康稳定器上到处拍摄。得到的相机位置和姿态结果则会实时地反映到内容制作工具当中,从而实现一部动画片或者特效大片当中重要的摄像机走位环节。
当然了,SLAM技术绝不是没缺点。
首先它依然是基于视觉的识别,信号的采集/传输/处理过程相对其他技术手段来看,目前的延时情况往往还是难以忽略的,而这恰恰是VR体验里最不能接受的一点。另外,SLAM对现阶段的移动设备来说,计算压力仍然太大,Project Tango手机和HoloLens眼镜为此增加了一块或者多块协处理器,这样自然又带来了电源管理和过热等各种问题,传闻中卡马克也在为未来的OculusVR和GearVR头盔寻求基于SLAM的定位方案,它是否能成为未来VR世界主流定位方式,也许目前还是个未知数而已。
以上所有的空间定位方案,都是基于同一个大前提,即玩家可以按照自己的意志在场地中自由行走,其行走范围受到场地本身的限制。如果我们的体验目标是一款在仓库密室里大战僵尸,或者在街口构筑工事迎击强敌的VR游戏,那么这样的方案显然总有用武之地;但是如果我们是以一款《GTA5》一样的超级大作为目标,或者是可以无限和探索下去的沙盒游戏,那么再大的场地恐怕也不够玩家折腾……而且场地越庞大,结构和形状越复杂,对应的定位设施安装和维护成本就越高,要保持一个稳定的定位算法和精度也就越困难。
幸好,总有人能够另辟蹊径,比如在人们每天健身常用的跑步机当中,加入除了速度控制之外的方向控制因素,就成了所谓的全向跑步机(Omni-directional treadmill):
(Via think-about.pl)
不过设计一款全向跑步机可不是去淘宝选一款带触摸屏和MP3功能的跑步机那么简单的事情,这里有两个巨大的问题需要开发者们去思考解决:
一、如何识别玩家在跑步机上运动的速度和方向;
二、如何把跑动的玩家限制在设备的中心,或者在他无察觉的前提下把他“拽回”设备中心?
上图的Omnideck就是一套比较早推出的解决方案,它采用了一组以玩家为重心的径向运动的传送带。当玩家走到任意一条传送带上面时,传感器就会感知到玩家的运动方向和速度,然后带动皮带将玩家送回到中心。
(Via walkmouse.com)
不难想象,图中设备的精度主要取决于这些径向传送带的数量。而一旦增加传送带的数量,则会带来更为沉重的维护成本,传感器精度问题,以及自身重量。况且在如此巨大的空间内只能容纳一个人游戏,这从营收角度上来看可能也是入不敷出的。因此,很多专注于VR行走体验的公司随即推出了一个看起来更为合理的方案,例如下图中的Virtuix Omni:
Omni跑步机本身可以看作是一个炒菜用的不粘锅锅底(事实上它的材质确实也就是不粘锅的材质),它的底盘被设计成一个表面凹陷的圆形曲面,并且由很多细小凹槽的光滑径向跑道组成,上方是一个可调节支架,起到保护玩家和识别下蹲/跳起动作的功能,总重量约为50公斤,并且用户需要穿上特制的鞋子才能够在Omni的跑道上运动——更准确地说,是在跑道上滑动。这一设计能够比前者更为轻巧和灵便,其关键就在于这种“脚部在锅底滑动而无法离开中心”的特点,而凹槽中遍布的传感器系统则会负责随时测量用户运动的方向和速率,从而模拟出玩家在虚拟空间的行进过程。
这一方案从原理上看起来无懈可击,只是穿戴起来比较繁琐,推向家用市场恐怕还有距离。然而,从实际使用者的反馈来看,“脚底滑步”的运动方式显然不会让他们感到舒适。甚至可能是一首儿歌中的感觉:
小老鼠,
上灯台;
偷油吃——
那么有没有那种不那么笨重,灵敏而准确,跑起来又不会让玩家感到不适的方案呢?也许会有:
(Via mobilemag.com)
Infinadeck全向跑步机自诞生之日起就吸引了诸多媒体和行业人士的关注,它的基本构想其实并没有非常复杂的地方:采用电机带动皮带轮的方式,使用一整条沿Y轴运动的大皮带轮,带动多条沿X轴运动的小皮带轮,这样玩家在两个轴向上的运动都可以被识别和记录下来。而玩家一旦离开了跑步机的中心位置,系统就会通过视觉识别或者其它的识别方式发觉玩家的偏移方向和距离,并且启动电机将玩家送回原处。
当然,这样的设计同样存在两个不小的难关要闯。首先是负重问题,如此多的电机和皮带轮被安置在一台设备之上,自身的承重压力恐怕是相当不小,整个非机械结构也不得不用足原料,打造钢铁之躯;总体估算下来,这样的设备难免有上吨的重量,真的搬到家里恐怕只会让楼下的邻居如坐针毡。其次是玩家的运动感受与设备尺寸的关系,如果设备本身过小,皮带轮的周长也就很小,产生的摩擦力也就不同——由此很容易带给玩家一种明显的“被拽回原地”的感受;而设备过大虽然能够让“回原位”的过程变得平滑,却无疑进一步增加了设备的体积和重量,让家用级的使用成本变得更为难以接受。
Infinadeck一直在声称要构筑廉价和方便的全向跑步机系统,而他们迟迟没有放出更新的消息,也许也正在受困于这些结构和选材上的难题吧。
我们简单地总结一下之前提到的各种定位方案的优劣,如下表所示:
方案 | 成本 | 延迟时间 | 识别范围 | 定位精度 | 人数 | 干扰方式 |
Kinect体感 | <2000元 | >30ms | 4x3米 | 精确到角色骨骼,但是不稳定 | 最多6人,容易丢失 | 过多的杂物,多余的红外光源,强反射材质 |
PS Move | <2000元 | >30ms | 可以适当扩展 | 区分角色和武器 | 根据颜色ID适配多人,可能会误报 | 过多的杂物,复杂的环境和背景色,遮挡标记点,错误的摄像头标定 |
光学定位系统 | >20万元 | <20ms | 可以无限扩展,但是成本也随之飙升 | 精确到角色骨骼 | 通常不超过4人 | 过多的杂物,复杂的环境和背景色,遮挡标记点,错误的摄像头标定 |
HTC Lighthouse | <8000元 | <20ms | 5x5米 | 头部和双手手柄 | 建议1人 | 过多的杂物,不规则区域,错误的摆放 |
激光雷达 | 1-4万 | 20-30ms | 40x40米 | 接触点,距离越远精度越低 | 建议1人,无法区分ID | 过多的杂物,互相遮挡 |
UWB | ? | <20ms | 取决于基站数量 | 15-30cm | 建议1人 | 过多的杂物,多径问题,其它设备的干扰 |
SLAM | ? | >30ms | 可以无限扩展,但是数据量飙升 | 取决于预处理精度 | 1人 | 通常需要预处理地图,之后不能有大的场地变化 |
Virtuix Omni | <8000元 | 一步之内 | 不限制 | 精确到步态 | 1人 | 无干扰,但是穿戴复杂,体验不真实 |
Infinadeck | ? | 一步之内 | 不限制 | 精确到步态 | 1人 | ? |
结论似乎暂时还很让人沮丧,没有哪个方案可以说同时解决了成本,多人游戏,低延迟,抗干扰,以及空间限制这几大问题。
换句话说,虽然笔者历经千辛万苦和各种求知求助,总算集齐了七大武器加上一个额外的Bouns(跑步机),却依然无法达成那个一开始就存于心中的愿望:VR虚拟空间行走的体验,难道就真的是一个遥不可及的目标?
幸好,我们看到有足够多的从业者已经为这个目标而开始努力。
笔者体验过上海青瞳的光学定位方案,其低延迟和准确性已经做到了可用的级别,而更低成本的产品研发想必也是这个团队下一步的目标;诺亦腾据传也不满足于目前系统关键部件的高成本和受制于人,开始研究自己的光学定位系统;The Void更是秘密收了一个专精于UWB定位的团队,打算把自己的主题公园定位方案更加精进。至于未来更多相关的脑洞大开,创新方案,以及更接近实际需求的定位手段,也许也已经距离我们不远。
让建造和维护成本更可控,让多人同场游戏不再是关键难题,让你的游戏者不要变得举步维艰——就请相信VR空间定位的下一步棋,会给我们带来惊喜。
题图来自:engadget.com
雷锋网原创文章,未经授权禁止转载。详情见转载须知。