[译]为什么苹果眼镜会没有ARKit——当前AR产品的8大问题

【声明】本次翻译已征得了原作者的同意。(如须转载原文,请务必附上链接:https://medium.com/super-ventures-blog/why-apples-glasses-won-t-include-arkit-46a1d40381fe)


本文译自Super Ventures的管理合伙人Matt Miesnieks在其官方博客上发表的文章Why Apple's glasses won't include ARKit。文章以“苹果AR(增强现实)眼镜暂时不会有ARKit支持”为切入点,结合作者自身多年AR产品开发和投资的经验,详细列举了当下阻碍AR眼镜产品推出的8个方面的技术问题,分别在现有解决方案的基础上对未来两三年中的技术进展做了预测,并对苹果公司未来的AR眼镜产品策略提出了意见,最后在文末回答了几个相关的问题。这篇文章的前半部分是我目前所看过的,对于当前AR技术产品开发所面临问题分析最为全面的一篇文章,称得到上是针对当下“光怪陆离的AR前景”最为冷静和深刻的剖析,向我们表明了我们大多数人对于AR产品的想象是如此的飘渺,而未来技术发展的道路依然漫长。我觉得这篇文章对任何人深入理解AR产品都会大有裨益,故征得作者的同意后,花了两天的时间将其译成中文。你或许不同意作者对于苹果公司“技术/产品”路线的推崇和时尚引领未来的观点,但我还是相信其中的内容会对广大的从业者有所启发,并鼓励相关的技术人员在各自的领域中,为了数字与现实结合的美好未来而共同努力!



目前唯一一件能比ARKit(译注:苹果公司的增强现实工具集,目前发布的第一版已经成为系统框架的一部分)本身更让人兴奋的事,恐怕就要属运行着ARKit的苹果眼镜了。很多的传言或者传言的传言都宣称,“如果届时不出意外的话”它们马上就要来了。所以,今天我准备站在“技术要素”的角度,回应一下这里的“届时”。我知道苹果正在制造眼镜类产品,而且其技术原型也非常的先进;但同时我也知道,要将一个完整的可穿戴AR HMD(头戴式增强现实设备)从无到有的制造出来所需要什么。在消费级AR眼镜被推出之前,首先需要创造出其所包含的基本组成要素,而依我看来,今天这些要素还都不存在(即便以最前沿的观点来看)。


 
您这是在暗示么?

本文采用的是“自下而上”的视角来看待,苹果(或者其它厂商)推出消费级产品之前先要达到的技术要求。我不会选取那些依赖于魔术般技术突破的夸大其词,而是一一列出需要解决的技术问题及当前进展,并以此为根据推测消费级产品何时能够实现。

我并不清楚苹果的产品发展路线,但我却清楚AR产品开发中潜在的技术和设计难题,和很多朋友透露出来的关于苹果目前虚拟现实工作的只言片语,以及在我职业生涯中所观察到的平台更迭的历史节奏。加之过去九年的相关研发经验,我便能够描绘出当前增强现实技术发展的图景。

首先让我们来给出AR眼镜的最终定义,在本文中它意味着一副我们愿意在公共场合佩戴,能将数字内容嵌入到真实世界,以应用生态系统为支持的网络化时尚眼镜。我们不必纠结于这个定义本身。因为在它最终到来之前,一定会有实现了部分此愿景的优秀产品足以让我们去购买或者喜爱,并且不断地更迭和完善。而我在此试图探究的是:什么时候苹果能够推出它们自家“堪用”的AR眼镜产品,且能够满足消费者对其的期望?

除此之外,当涉及到眼镜/眼部佩戴装置/HMD(头戴显示器)等范畴的时候,“增强现实”这个词的定义往往显得很混乱。关于什么是可穿戴头显,什么是增强现实眼镜,就有很多容易混淆的地方。它们都会在你面前放一块透明的显示屏(有的与视线同轴,有的离轴,有的是单目,有的是双目),但使用体验(以及整体产品)却完全不同。营销部门一般将HUD(平视显示器)称做AR Glasses(增强现实眼镜),而将AR Glasses类产品称做Mixed Reality(混合现实)或者Holographic (全息显示)。其实两者的可以很容易区分开:如果所有的内容都是固定在显示屏上的,转动头部而显示内容不变,那它就仅是个头戴显示屏而已。对此,谷歌眼镜就是个很好的例子,还有爱普生Moverio。(事实上,当下大部分配有显示屏的头戴设备都仅是一台HUD平视显示器,但是通常你都可以为它填加一个像Vuforia一样的增强现实SDK,使它们变为简单的增强现实眼镜。ODG就是从事相关工作的。)单单一台HUD设备还不能算是增强现实,而仅是你戴在头上的一台普通显示器。只有数字内容被嵌入到了现实世界中,就像ARKit在手机上实现的,或者像Hololens和Meta一样,你可以算有了一副AR眼镜。AR眼镜是个超集,它们是一台HUD,加上透视镜片,六自由度追踪,以及其它很多的组件……

顺便提一句,此增强现实眼镜购买指南,有目前市场上增强现实眼镜和可穿戴HUD设备的明确列表。



这就是AR眼镜的用户体验。数字内容都嵌入在真实世界中你所指定的位置上,比如当你转头时,电视则始终停留在墙上原来的位置。但如果你使用的是Google Glass(它是一个HUD,而不是AR),则随着你的移动,电视则始终固定在你所戴眼镜中的一个特定位置上。



当前阻止我们拥有AR眼镜的八大技术难题


以下是苹果(或其它厂商)推出消费级虚拟现实眼镜产品前,所必须解决的八大主要问题。而更重要的是,理解为什么需要解决这些问题。

时尚炫酷的硬件。这在我看来是最重要的。很难想象能有比近眼穿戴设备更为个人化的可穿戴产品了。穿着就是我们个性最直接的体现。在当下除了技术以外,没有什么能够阻挡优秀的设计师去设计最时尚的眼部穿戴产品。企业级AR应用能够最先在市场上发力,就是因为这些难看的设备是别人花钱要求你戴的,而它们首先要解决的是技术问题,而不是设计问题。

 


来自e-magin的高分辨率OLED微型显示器,适用于HMD(或手表)。将其产生的图像通过波导组件投影到眼镜中的镜片上,你就可以在眼前看到了。


一套足够小以适应消费者眼眶,足够亮以便在阳光下使用,足够锐利以显示文字和足够宽视野的光学显示系统。仅能够在室内使用的AR产品是没有什么意义的。增强现实的目的就是穿戴起这些设备,使它们能够跟随我们走出去,成为我们生活的一部分。所以,其光学显示系统必须能够在室外阳光下工作,同时能够锐利地显示文字。相较于VR(虚拟现实),AR(增强现实)对于视野的要求要低一些。因为在其主要的功能性使用场景中,并不需要像在依赖于周围视觉的游戏中那样的身临其境。较宽的视野也主要是用来避免内容显示不全。当前能够量产的主要是由OLED微型显示器驱动的光导显示设备。只有单一焦平面。功能更为完善的显示设备,要在1到2年后才能出现,而且它们很可能再需要1到2年的时间才能够量产。我几年前曾经听说,一位来自某个大型OEM厂商的技术类战略投资人放弃了对早期的Magic Leap进行投资,并不是因为他认为其显示技术只是个幌子,不,其技术很成功且产品演示效果惊人;而他之所以放弃,是因为他了解在量产过程中,产能爬坡和消除光学缺陷时所面临的巨大挑战。我目前还没有听说Magic Leap有什么好的解决办法,最近的消息显示他们可能采用另一种更容易制造的显示设备。这也是为什么军方一直到今天还在使用OLED和光导技术,他们更不缺乏研发更好的显示系统所需的资金和研究力量。目前用注塑工艺制造的光导组件成本也非常低,只有一到两美元。所以,显示系统的主要成本就是一个七位数的前期一次性光学设计费用,以及曾经非常昂贵如今降价迅速的高分辨率OLED显示器的价格。而且到目前为止,仍没人把应用于智能手机行业的量产经济学用到头戴显示设备的生产中来。



Mark Billinghurst在2014年时一些研究成果,从那时算起,5年的时间将意味着……


采集用户“自然的输入”的硬件系统和准确判定用户意图的软件系统。这是一个很大的问题,而且目前它的离解决还很遥远。当你对它思考的越深入,就会感觉它越困难。 过去大多的研发精力都用在单一输入模式的完善上(完美的语音识别,完美的姿态识别,完美的计算机视觉等),但是即便你能够创造一种完美的输入模式(我很怀疑有人能),也会碰到无数的情境——置身于其中的用户根本不愿意去使用它。比如,在影院中使用语音输入(轻触手表可能更理想)或者在公共场合下使用手势输入(语音也许更好)。为了避免使用上的复杂和尴尬,一种基于人工智能的,能够在任何情况下准确捕捉用户意图的多模式输入系统就显得非常必要了。目前我的SV合伙人Mark Billinghurst就在它的实验室里,进行 着用于增强现实的多模输入方面的研究。就我们了解,目前,苹果、微软和谷歌公司(我最近听说一款动作跟踪戒指)都在进行着多模输入系统的研发工作。我猜从现在算起到相关的产品发布,至少还需要9到12个月的时间。“Airpods/Siri + iPhone”可能是当前市场上被广泛采用的多模式输入方案的最佳实例。你可以通过轻触屏幕,耳朵或者说话来控制你的手机,这些操作方式非常简单,而系统则通过人工智能来自动选择。

具有足够高每瓦性能的传感器和处理器,能胜任长时间工作,并且没有人机工程方面的过热过重问题。更高的集成度意味着给予设计师在时尚方面的更多自由。从运行在手机上”转到“运行在透视显示器中”,意味着能耗和延时方面的大幅提升。而一些AR特性能在手机上很好的运行,并不意味着它们就能被搬到眼镜设备上。三维重建,机器学习应用和同步渲染都是很好例子,以现有的技术水平,它们都可以在手机上实现,但同时它们也是CPU /GPU的重度用户,往往导致热量产生和续航水平下降。所以,从“能在手机上运行”到你可以期待它们“能在眼镜上运行”,至少需要12个月的时间。 而在某些情况下,定制芯片可能是最好的解决方案(例如苹果的W1芯片,Movidius的CVGPU或MSFT即将推出的HPU v2),但这也可能意味着更长的等待时间。



通过语义分割,AR系统就可以区分出场景中的每个单独对象,进行标记并将该信息从ARkit传递到应用程序,以便它选取与相应内容最为恰当的交互方式。


能够实时理解三维现实世界结构和意义的能力(ARKit是这方面的开始,它提供了相对于你自身的6自由度姿态感知能力和一个基础水平面)。人们目前才刚刚开始意识到这有多么重要,恐怕在接下来的12个月里它才会逐渐变成一个众所周知的问题。除非以某种方式与物理世界交互,否则一个与现实世界没有联系的AR应用程序是没有任何建立的意义的。这就是“原生AR”的定义。如果没有“数字+物理”交互,那么一个普通的智能手机应用则会提供更好的用户体验。专门为平坦桌面设计的桌面3D游戏,就是一个“为什么非要用在AR里?”的完美例子。为了与周围的现实世界互动,AR系统要能够捕捉我们面前的物理世界的三维虚拟模型。一旦这个问题被应用开发人员所了解,而AR系统也开始服务于周围的显示世界(如Tango,Hololens和Occipital现在可以做到的),那么进一步的问题——“我要怎样才能把我炫酷的应用内容呈现在一个三维场景中?而我事先完全不知道这个场景看起来是什么样子的!” ——也就成了一个大麻烦。目前有一些简单的启发式的方法,但是它们非常的粗糙,要开发者自己来构建所需的工具。如今需要有人来构建一套对于应用开发人员来说足够易用的程序化的内容布局工具(在前些年,微软公司就利用FLARE在这方面做了一个非常好的尝试。它们真是超前啊!)。目前这方面最先进技术的代表,要数能够在电影场景里程序化生成半兽人大军的SFX软件了。据我所知,一家建筑业方面的创业公司也拥有这种技术,并正在考虑如何将其应用于AR领域。到目前为止,我没有看到对于这个问题其它方案或者还有什么人正在着手解决它。对于三维场景重建,如今最前沿的技术也仅达到利用深度相机在手机上密集地大规模实时三维建模的水平。而不借助深度摄像机的三维重建技术,则还需要大约9个月的研究工作,以及另外9到12个月的产品化过程。而目前最先进的三维语义分割技术,也仅实现了“在手机上运行学术研究人员开发的代码”这种简单的方式,同样也需要至少几年的时间才能够出现足够优秀的消费级产品。而大范围跟踪与三维苹果地图一类应用的集成,如今依然停留在研究阶段,只有一些相关的研究尝试。其中谷歌Tango VPS当属其中最为先进的,但也很可能需要12个月,我们才能看到能够运行在普通手机上的基础版本。



在模糊的图中,我们可以看到在同一张桌子上玩虚拟越野车的两个玩家可以实时的看到对方的越野车,这是2013年时的多用户共享虚拟AR环境。


能让我们与它人交流和分享的能力。在Dekko我们做了其中一个(如果不是第一个的话)商业上可行的IOS多玩家AR游戏(Tabletop speed——能与现实世界中的对象碰撞的虚拟R/C越野车)。跟同样能够看到你的越野车的玩家游戏,所带来的愉悦感提升简直是指数级的。而现在几乎所有的AR演示和应用都假设你是这个世界上唯一的用户。所以,当有很多人都有具备AR体验能力的设备时,我们自然就希望分享“我们所看到的东西”和 “一个增强视角下的我们自己”。Charlie Sutton和Cliff Warren早在三星的时候就看到了这一点,并做出了一个极其有竞争力的(事后看来)原型产品。想象一下,你可以戴上一顶类似Snap滤镜生成的虚拟帽子,而所有(或你允许的)戴AR眼镜的人都可以在你的头顶上看到它。要做到这一点,首先要在对此充分理解的基础上,运用更为稳定的户外定位SLAM技术,再加上SLAM地图共享的能力,使得我们彼此能够使用一个坐标系统。Tango VPS是当下的翘楚,但它仍需要一年或更长的时间才能真正跨入业界,而消费级的应用和API等则还要另外6到12月的时间才能真正把它利用起来。在这方面最令人兴奋的应用案例之一是Holoportation的概念。



难道我不想整天都戴着这个?而不只是在自拍的时候。这就是我希望别人(戴着AR眼镜)看到我的样子!


一个AR原生的HMD用户界面,它是一种全新的应用程序范例,而我们过去40年一直在使用的桌面概念已经不能继续胜任了。这简直就是一个巨大的设计黑洞,可以说将过去那种4×6的方形图标直接摆进我们的透视显示器中的方法是肯定是行不通的。鉴于过去十年我们所积累下来的智能手机应用,几乎没有一个能够直接搬进AR世界里,一个非IOS或Android的全新的应用生态系统将有机会出现。有趣的是,我发现就AR设计方面的表现来说,拥有工业设计背景的设计师往往要比应用程序设计师更好(或者那些努力应对现实世界问题的天理难容的游戏设计师)。我觉得这是因为,这些工业设计师一开始就是在“构建真实的三维产品帮人们解决现实世界问题”的过程中被训练出来的。而在增强现实的世界中,你只需要为你的产品或解决方案设计一个数字模型就够了(而且很可能使它更具互动性),根本无需做出看得见摸得着的实际产品。当前的最先进的技术,是在军事方面的自动驾驶和三维游戏界面。Hololens是目前可行的AR GUI当中最为完善的,当然用过一次,你便会体会到我们还要在技术上走多远了。在学术研究方面已有了不少切实成果(这就要提到Doug Bowman,来自Virginia Tech的3D UI设计教授),但相应的产品化过程依然要下一番功夫。据说在苹果的实验室里,也有一个运行良好的成熟方案。



Magic Leap的AR GUI。其中的一些内容元素是固定显示在HUD中的(角落里的音乐控制,时钟),另一些元素则嵌入到了现实世界里(YouTube和玩具), 而邮件应用则可以在两者之间切换。 但是这时候你可怎么关闭一个“应用程序”,然后打开另一个新的啊? 难道指一指桌上真的咖啡杯就算是你告诉“星巴克”应用程序给你一杯咖啡了? 由此可见,在这里智能手机的应用生态系统已经不再适用了。


面向实用化和娱乐化的应用生态系统。目前AR领域还没有像智能手机上一样的杀手级应用,我们需要一个优秀的用户界面,能充分利用AR带来的优势,将我们连接到网络上去做我们所喜欢做的事情。

以上是一个长长的清单,列出了ARKit眼镜出现之前还有待解决的问题。我认为苹果不会采用类似Hololens的方案,也不会试图用一个产品来解决所有这些问题。要想真切理解这个清单,就去带上一副Hololens吧,透过上面的八个问题去看看那里的虚拟世界。Hololens是惊人的,因为它是首款实际解决了上述所有问题,并且达到企业级(非军用)价格水平的单一集成化产品。在它之前还从来没有产品做到过。它称得上是增强现实领域的Nokia Communicator,实际用处不大,但是却是技术可行性的切实证明。当然,针对以上八个问题,它们所采取的解决方案显得非常的简陋,与理想还相去甚远,可它们依然做到了以前没人能够做到的。这也意味着微软很可能比任何人都了解这些问题。


双管齐下


以我看来,苹果会采取双轨并行的产品策略,最终推出AR眼镜产品。苹果是著名的设计领导者,在历史上它们的产品也是以“一次解决一个设计问题”而闻名,因为用户的使用行为太难改变了。初代的iPhone便是一个很好的例子,它通过多点触控解决了智能手机的输入问题,从此改变了一切。而它所具有的其它功能都与当时市场上的其它手机并无二致。

首先是一系列的技术问题。机器视觉,传感器,SDK,三维开发工具集。另一方面,则是更难以解决的设计问题(在AR社区中还没能得到重视)。包括产品所针对的用户场景,我如何与用户界面进行交互,怎样将我呈现出来(我坚决要求能够戴在脸上!),产品的需求如何?

目前可以看到,技术问题正在iPhone平台上被越发强大的ARKit SDK逐步解决。

而设计问题的解决之道则是,将现有的可穿戴设备整合在一起,形成一个能够协同工作的群星荟萃般的产品集合。

然后融合两者,造就ARKit眼镜。

真正有趣的是,接下来会出现哪些过渡性的产品和市场机会。黑莓,诺基亚,Palm Pilots等众多产品都曾在“从手机接入互联网到iPhone/Android称霸“的过渡时期非常成功。


AR技术问题解决之道


ARKit是一件AR行业的大事,不仅因为它被苹果的营销童话所笼罩,也是因为它如今为开发者的AR应用提供了一个高质量的“6自由度姿态”。 AR中的一切都建立在高品质的姿态识别上。将数字内容镶嵌在现实世界中,室内/户外导航,三维重建算法,大范围跟踪,虚拟与真实的碰撞和遮挡,手势识别,所有这些功能的优劣都取决于系统姿态识别结果的好坏。我之前的文章更为详细地解释了苹果是如何做到这一点的。

苹果在iPhone平台上推出ARKit之时,就很清楚手持式设备所包含的特有因素对于AR使用场景的严重影响(恕不能尽述,为此我将再写相关的文章)。苹果深知这一点,因为它们AR团队的许多领导者在加入苹果之前就对此十分清楚了! 之所以在iPhone上首先推出ARKit,是因为这样消费者对于它的期望也就会低得多,实际上ARKit的第一版只是作为一个有限的SLAM系统(尽管其效果显著)。 同时,开发人员也可以利用这个机会学习如何构建AR应用(其与智能手机或VR应用大相径庭)。消费者将会在YouTube上看到大量优秀的演示,并开始了解AR的潜力。苹果公司也可以摆脱可穿戴类硬件自身的种种束缚,在他们生产出的具有最高计算和感知能力的设备上,为市场级应用推出更好的算法。



形式上予以妥协,以求强大的处理能力


对于AR眼镜来说,ARKit技术何时才能算足够好呢? 我认为只有该系统能够通过单目RGB摄像机,实现实时的大范围户外跟踪和定位处理,以及密集3D重建的时候。 这也是ARKit能够实现“大家理想中的AR”的最低标准。 还要注意到,与此同时,“自然输入”的问题也需要被成功解决。


苹果的AR设计问题解决之道


这一部分内容很有趣。在我自己心里,我仍是一个精通商业的技术专家,但是我娶了一位AR设计师(@silkamiesnieks)。我的AR产品和开发团队都是设计师(在Dekko的Silka和 在三星的@cactuswool)来领导的,它们教会了我很多东西。另外,我还没有看到有别的哪一个AR产品团队也这样做,我认为它们会因此错过机会(我猜苹果和Snap都有设计师参与到AR产品团队的领导层中)。我觉得(从目前第一线的经验来看)建造AR眼镜更像是一个“设计问题”,而不是一个技术问题,虽然我们在技术问题上一样步履维艰。技术优先的政策导致了目前“难题一锅粥“的现象,而此时正有一两家AR OEM厂商其中奋力拼搏。“困难”的技术问题要先于“超困难”的设计问题得到解决,可也正是设计方面的思路反过来决定了哪些技术问题需要被解决。

我很高兴平时能够看到计算机视觉专家和高级产品设计师对面而坐,彼此学习对方的交流方式,并看到两个团队是如何一同解决AR问题的。

我对苹果实现AR硬件的轻松方式印象深刻。Airpods是我认为第一个成功的AR硬件产品。虽然当我这么说的时候经常会遭受白眼,但是它们确实解决了眼镜的两个关键问题。它们通过语音输入输出实现了一种自然的交互方式(加上简单的触控)。我们用声音“增强”了周围的环境,比如博物馆的语音导游。这就是音频AR。我经常穿带它们去餐厅,酒吧等等。没有人介意,也没有人因此动粗,员工或朋友都正常地与我交谈(我可以事先把音乐暂停了)。让我惊讶的是他们很快就对这些产品习以为常了。我预计在未来的12个月里,我们能看到更多来自各个AR平台OEM厂商的“人工智能耳机”产品。相关的并购也会发生在,3,2,1……



增强现实穿戴起来酷极了!有了音频增强现实,谁还管它能不能看见画儿呢?


Airpods另一个关键的地方是它是与眼镜分离的。这降低了眼镜 最终 体积和成本。显然我们在日常生活中有很多副不同的普通眼镜(太阳镜,阅读眼镜,运动眼镜等等),那么AR眼镜为什么不可以呢?工业界认为(很可能是对的)我们不会因为追求时尚的原因而买很多台高达1500美元的面部计算机,但是如果到时候眼镜不仅仅是一个塑料镜框,同时还配备波导显示屏,加强的W1芯片,还可能有与智能手机一样的相机、运动传感器,而整体的物料成本可能仅有几十美元呢?

当然本周早些时候,蒂姆库克说,iPhone会是更接近于增强现实的产品。

而且OLED微显示器是当下可穿戴设备的最好选择,所以iPhone 8更换为OLED显示屏,也显然是大有裨益。当然不久以后,OLED微显示器也会被多焦距HMDs,视网膜投影,或者其它神奇的技术所取代,但是目前为止最佳的方案还是它。

我认为苹果将为它们第一款眼镜产品配备的,不是相机而是HUD。简单点说,就是戴在脸上的苹果手表。一次解决一个设计问题,其它的则沿用已有的方案。我曾经和那些把玩过苹果原型产品的人聊过天,它们都没有相机。3D打印镜框,看起来很漂亮,很像RayBan的Wayfarers。最近那个爆料的Reddit帖子很准确。目前正在测试的使用场景是“通知”,这对于类似于谷歌助手的siri服务来说再自然不过了。不过就我九个月前得到的消息,那时的苹果年度营销计划里还没有眼镜类产品。我觉得我们明年才有可能看到眼镜类产品(不具备AR功能,但却有HUD显示系统通知)的出货,而今年则只有以AR技术支持的iPhone。当然也有一定的可能,Apple Glasses v1第一代苹果眼镜具备相机(也同样不是因为技术原因),但那也就太不像苹果了,它一贯奉行“以更简单的产品一次解决一个问题”——这次让人们都用上可穿戴显示设备。



Marc Newson近期的高端时尚系列眼镜


在眼镜产品开发方面,苹果公司最重要的优势是开发团队中有Marc Newson坐镇。如果你还不知道它是谁,请务必去了解一下。它深知如何设计炫酷的眼镜。我在三星时学到的其中一点就是,工业设计师认为眼镜是最难以设计的实际产品之一。主要是因为每个人的脸型,品味都不相同,也没有任何的现实设计依据(增加功能是没办法使每个人都满意的,所以设计必须非常简单和纯粹)。



但是技术规格呢??!!!


苹果也一直在学习如何销售“时尚”。苹果手表在这方面难能可贵。到现在我仍对苹果手表的任何技术规格都一无所知,但我在时尚杂志中看到碧昂斯戴着一个发行版手表。苹果也学会了如何通过一系列配色和表带差异,使人们能够充分表达自己的个性。再没有任何一家AR领域的技术公司(除了进步神速的snap)能了解这一点了。

如果还有谁认为,大众市场将不会将AR眼镜视为第一个同时也是首屈一指的时尚消费品的话,那它很可能现在还戴着谷歌眼镜。请记住,它们需要被精心的设计,并在营销定价方面的仔细规划。


最终的底线


不难想象,不出几年我们就可以看到人们在日常生活中戴着它们炫酷的苹果手表、苹果眼镜和Airpods了,而且很可能它们的包里还装了第二副眼镜,口袋里装着iPhone。那个时候手表可以作为一种次要的输入方式(轻触手表,以在眼镜中选择)。当你走进一个酒吧时,可以方便地摘下眼镜,同时保持其于Airpods和手表的连接。如果这时你需要一块显示屏来分享,或保留更多的隐私,你仍可以掏出自己的iPhone。

那将是什么时候?

2018

我可以轻易想象出,在2018年我们会拥有一台没有ARKit支持的苹果眼镜(具备显示屏,基本的输入方式,主要由手机和Airpods控制,没有相机)。非常简洁(AR行业肯定会哭诉:“小打小闹!浪费机会!”),强调时尚,拥有一系列不同的款式和价格,风靡于时尚杂志。iPhone上的ARKit开始支持三维重建,再加上一些能够改善内容渲染(光源感知?)和多用户AR体验的特性。

2019

依然是“非ARKit”眼镜,但却配有相机(可以拍摄照片和视频,更像Snap的Spectacles)。期待支持视频传输的W2无线芯片。iPhone上的ARKit已经能够支持大范围追踪和大尺度彩色三维重建。深度整合苹果地图和Siri。

很可能另一家公司也开始出货它们“堪用”的完整版消费级AR眼镜。企业AR产品开始发力。一些移动平台AR应用显示出强劲的指标。

2020

第三版眼镜推出,解决了续航,显示,无线连接,输入,用户界面等诸多问题。ARKit也经历了较大的改动和增强,以应对更大的空间和更多的用户,而内容创建工具也已足够成熟,使得大部分开发者可以方便的上手。人们开始担心,随着其它优秀竞争对手的产品纷纷出货,苹果也会开始逐步丧失AR眼镜的市场份额。

2021

融合后的ARKit眼镜产品获得巨大的成功!我们到达了彩虹的那一端。


那些很难回答的简单问题


iPhone上的ARKit呢?太棒了!今年它会有4亿安装量吗?明年会有亿亿吗?

是的,是的。但是移动平台上的手持式AR还要克服许多其固有的用户体验方面的挑战。ARKit自身在如今的用户体验中还有诸多不足,需要在将来完善(比如缺乏碰撞和遮挡,缺乏绝对坐标系等等)。我认为将来有可能在移动AR平台出现许多非常好的使用场景,但我不认为它们能够在明年就牢牢抓住数百万的日常用户。你仍然可能在iPhone的ARkit的平台上建立一个出色的创业公司,并在几年后以一亿美元退出,但你不太可能成为下一个谷歌。相关的问题,我将另作阐述。

AR可能永远是一类小众产品。其市场潜力类似于游戏主机(拥有数百万台设备)。AR眼镜如何才能发展为智能手机那么大的市场(拥有数十亿台设备)?

将AR看作娱乐产品(VR也是一样),这个观点本身就限制了它的市场规模。而这些年来我一直坚信,AR的真正潜力在于其能够作为一类优秀的通信和信息设备,这是今天我们使用智能手机的原因。如果AR产品能够提供强有力的用户体验,使我们更好的交流和了解世界,那么它就能成为一个智能手机大小的市场。

而另一方面,如果你将VR看作一种使我们逃离现实的途径,那么AR就是在增强我们已置身其中的现实,这样只要我们来分析一下一个典型个体每天的时间分配,就会发现天平已经指向AR一边。我们每天可能花费几个小时的时间“躲”在一本书或者电视里,但剩下的大部分时间里我们依然生活在真实世界中。

很难猜测我们究竟是喜欢通过VR(FB的spaces或RecRoom),还是AR(Holoportation)交流?我赌AR,虽然在技术上更难以实现。

那VR呢?难道如今这些就是它全部的发展了吗?

在ARKit出现之前,我也许会勉强同意并说“等等AR吧!”现在我已经不用这么说了。

为什么其它公司不会先于苹果,解决这些问题呢?

微软领先于其它人很多年,并拥有完善的软、硬件资源来赢得这场比赛(操作系统+开发者,必应地图,Xbox三维图形技术,OEM硬件合作伙伴,微软研究院)。而谷歌在人工智能和设备生态系统方面也拥有明显的优势。我相信其它公司也会制造出完善的消费级AR眼镜产品,但我不认为它们能够获得商业上的成功,因为消费者的购买意愿是由时尚引领的。

我错了,因为……

在我上述这些预测中,很可能会出各种各样的错误。最有可能的是,苹果已经提出了一种创新的解决方案,能够在提供良好用户体验的同时绕开很多技术问题。

还有一种很大的可能性,其中一个局外人在移动市场中赢得了主导地位(比如谷歌推翻了微软,英特尔和其它PC OEM厂商的统治)。也可能是Snap,或者一个车库里的初创公司,甚至是微软的强势回归。类似潜在的行业动荡已经超过十年没有发生了。现在正是激动人心的时刻。Facebook已经表现出兴趣,当然这是另一篇文章所要讨论的了。目前整个智能手机供应链生态系统的体量,加上“通过更高的集成度来换取更大的时尚设计空间”的事实,都为能够充分利用这一点的玩家提供了市场方面的优势。在新应用范例的推动下,市场会逐渐转向时尚引领的消费模式,这也为破局者开辟了新的入场机会。

我很高兴听到其它我预测错误的证据。

你可能感兴趣的:(技术信息)