编者按:锤子科技 CEO 罗永浩一直都在说语音就是未来,所以他搞出了 TNT 概念机。之前老罗接受采访时还说,怀抱着腐朽的键鼠嘲笑语音操控的傻x们,会被扔进历史的垃圾堆里去。实际上,看好语音的人真不少,Jean-Louis Gassée就是其中之一。他认为语音 UI 肯定是未来,这不是问题,问题的关键在于:什么时候呢?是现在,还是 10 年之后?只有那些知道时间的人,才能成为亿万富翁,否则充其量只是一个未来学家。
由于出现的所谓的“Alexa 运动”,许多人都说未来的 UI(用户界面)叫语音。然而,当新奇感消失之后,到底还有多少人使用 Alexa(或者是 Siri、谷歌助手)?用它干什么?问题的答案可以帮助我们理解语音 UI 的未来。
几十年来,我们就在说要用语音与机器交流,科幻中一直有这样的场景,比如《星际迷航》电影中的电脑,再到《2001 太空漫游》电影中的 HAL。就在不久之前,如果想让机器说话还只是科幻。
几十年来,经过一段沉寂之后,几乎每年总会听到有人说“这一次我们终于看到希望了”。有一名记者曾经参观过产品评测人员的办公室,评测人员鼓吹说,语音识别有很多优点,最大的优点就是不用手操作。我们都知道记者发现了什么:这些“富有远见”的评测人员没有一个使用新语音界面。
不论怎样,我们对语音控制仍然保留一份期待。当我们与机器交流时,用语音说出命令是自然、显而易见的进化。Xerox Parc 开发了图形用户界面,将计算机从 CLI(Command Line Interface,命令行界面)解放出来,语音 UI 有可能让我们从触摸解放出来,当人的两手很忙时,语音就是第三只手,我们可以用它控制恒温器、导航系统,还可以选择音乐,做其它事情。
有些人的神经系统不健全,语音 UI 可以为他们带来便利,让他们重获尊严。如果用户的读写能力不强,使用设备时也可以减少障碍。当你完成某项任务时,不会读、不会写也没有关系,在教育不发达的地区,新界面可以发挥巨大作用。
到了今天,语音 UI 已经不再只是期待。因为它的远见,因为它将语音 UI 带给用户,亚马逊赢得广泛的赞许。
2014 年年末时,亚马逊推出 Echo,它是一个音控智能音箱,价格嘛,有的不到 40 美元,有的 230 美元,贵的音箱装有屏幕。
价格不是故事的重点。亚马逊早早就向 AI 投资,孕育了 Alexa,它是 Echo 的智能语音应答机,寄身于云端,现在它的技能一天比一天增多。因为第三方开发者很积极,到去年 7 月时,Alexa 技能数量已经超过 1.5 万个。
以此作为基础,亚马逊向用户提供支持,这种支持是周到的,也是实用的。比如,亚马逊精心设计了 Skills Guide,引导用户在新世界漫游,这个世界没有菜单,没有鼠标,没有键盘,另外,亚马逊还会帮助现有的 Echo 用户享受新生活,在 Alexa 宇宙获得更大乐趣。
每周,亚马逊都会将新闻通讯发给 Echo 用户,告诉他们可以用什么新方法、或者正在测试的方法与 Alexa 交流。这不是一般的邮件,比如引诱你购买新机器人扫地机、鼓励你购买洗衣粉(上个月你才买了)的邮件。不是的,每一周,亚马逊都会告诉 Echo 用户,根据几个月或者几年前的购买行为,如何才能让购买变得更好。
语音 UI 是一个有益的进步,虽然技术现在还有点呆板,有时还让人恼怒。智能设备只是乖乖坐在那里,等待我们的命令,它到底理解了什么命令?如何才能精准?我们所知甚少,或者根本不知道,这是一大挑战。还有,整体来说,语音助手还无法通过图灵测试,换言之,语音助手无法愚弄人类,让人类相信它是人。
有些人对未来技术很感兴趣,对于他们来说有一点很困惑:亚马逊(还有谷歌、苹果)对数字保密。到底卖了多少 Echo 设备?使用频率是多少?每天 10 次吗?每周 5 次吗?从不使用吗?谁用得最多?用来干什么?
亚马逊知道答案,但是它们只让自己知道,不告诉别人,我们只能依靠市场分析来猜测。2016 年年末时,一份报告指出 Echo 用户使用最多的功能就是用音箱设定计时器。最近又有报告说,Echo 用户购买的东西更多一些。
认真调查是一件很复杂的事,而且成本也不低。你需要收集大量样本,比如 1000 人的样本,才能让结果达到合理的可信区间,参与者还要能够从大体上代表用户。我高度怀疑“报告”是否能达到标准。例如,说用户使用最多的功能就是用 Echo 设置定时器,这个结论来自哪里?只是调查了 180 名 Echo 用户。
同样的,谷歌助手也没有多少可以参考的数据。Android 智能手机相当成功,有迹象暗示说,在一些读写不普及的国家,谷歌助手获得巨大成功,比如印度,但是说到量化使用数据、成败得失,我们一点也不知道。
对于苹果来说,我们对 Siri 兼容设备的数量有一个清晰的理解,只要是推出不到 4 年的 iOS 设备(可能稍有误差),基本上都支持 Siri。和亚马逊 Skills Guide 相似,苹果也建了一个 Siri 指导网站,界面清爽,告诉新用户、老用户使用时有着怎样的可能性……用户是怎样使用 Siri 的?什么时候,什么地方,谁,使用频率如何?我们不知道,苹果没有说。
为什么我们应该关注这些数据呢?一方面是出于好奇,还有就是了解一下语音 UI 战争会如何演变。今天,亚马逊是老大,但它未来还会占据第一名位置吗?有 3 家大企业竞争,它们是亚马逊、谷歌和苹果,三家企业有完全不同的业务战略:
就眼来下说,亚马逊是语音 UI 和电子商务的领导者,未来进一步征服市场时,它会占据有利位置。为了积累用户,亚马逊与谷歌助手、Siri 竞争,它必须引诱更多人安装 Echo,或者是内置 Alexa 的设备。
谷歌并没有将设备卖给平民,它向商户出售广告工具,以此赚钱。谷歌助手植入了 Android 设备,接触到海量用户,但亚马逊却将音箱与广告、电商融合。
苹果不卖广告,也不卖洗衣粉,它通过销售设备赚钱。和苹果生态系统的其它组件一样,比如 iTunes、App Store、服务业,Siri 的存在只是为了帮苹果销售更多 iPhone、Mac、iPad 和手表。
三大竞争者,各自统治不同的领域。哪家会最终获胜呢?稍后再问吧。
不论未来发生什么事,我们都为亚马逊语音 UI 的表现感到惊奇,内心忍不住思考它会给谷歌广告业务带来怎样的影响。
未来计算的关键组成部分是语音 UI 吗?可能吧。不过我们不要忘了 Horace Dediu 的格言:谁预测未来,我们管它叫未来学家;如果知道什么时候未来变成现实,我们管它叫亿万富翁。
未来值得期待,我们不会无聊的。
编译组出品。编辑:郝鹏程