从三年前的Alphago与李世石的的世纪大战引爆科技圈已来,人工智能的话题一直是科技瞩目的焦点,相较于传统的基础研究,好像人们对于这种新鲜事物更加的情有独钟,在Alphago大胜九段围棋大师时,人们惊呼“人工智能将要代替人类”,不过随着时间的过去,人们也逐渐变得更为理性,即便是近三年人工智能技术的成就惊人的瞩目,但是远远没有脱离“人工”的现实。

不过并不代表人工智能不重要,相反它已近融入到我们生活中。早在18年5月的I/O开发者大会上面,不少的从业者展示了人工智能语音技术,演示现场使用智能语音Duplex更是惊艳四座、技惊全球。在对方完全不情的情况下,使用AI语音预约理发服务、并且成功预约,而且对方也并未察觉,随后董事长骄傲的向外界宣布:他们的智能电话机器人摆脱了好不好用的范畴,已经通过了图灵测试。

然而事情远远没有想象的这么简单,在随后不久,《纽约时报》的记者在测试中发现,成功预约的4次中,有三次都是由人工伪装完成的。后来Duplex的官方申明中进行反驳道,并不是人工伪装,只是进行了适当的干预,其他都是自主完成操作。然后记者又继续进行反驳,后面的口水战就不用详述了。

虽然著名的图灵测试,在其特定的历史环境下面也存在局限性,但这次事件过后,业界又对于人工智能充满了忧愁,AI陷入了“人工智能”之困的窘境。其实这一切都是对于如今的人工智能期望值过于高的缘故,要知道如今的智能并不能之为智能,在基础物理学还未突破之际,完全智能化的产品是不现实的。如果以电影《机械姬》中的人工智能为标准的话,那就有点不讲道理了。

实际上,AI语音交互的基础是基于深度学习算法对语言系统的深度集成,因而决定其具有明显的“双边效应”,一方面,AI语音交互的完成度越高,其用户数量增长越;另一方面,用户数量与使用频次的增长反作用于AI语音交互的深度学习训练解决电话机器人好不好用的问题,从而实现更高的完成度、更准确的反馈。

在技术构成上面,可分为三个层面“交互层、算法层、数据层”在一个完整的AI语音交互过程中。从本质上来讲,现阶段的语音交互系统是在大数据下面进行的“动态规划”以逻辑方式对数据进行精准匹配,数学层面是运筹学的一个分支,是求解决策过程的最优数学方法。

要实现语言数据的100%精确匹配需要一些“先决条件”。
交互层实现100%准确率的语音识别准确率是保证整个语音交互不会出现语义“理解”偏差的重要前提,而要实现语音识的精准必须构建完整的“语句数据库”,然后通过大量的识别训练提升其准确度。

其次,在实现精确语音识别后,需要算法对其进行“数据打包”并且实现对“语言系统数据库”进行快速检索,从而匹配到相应的“反馈方案”,而由于不同的语义决定了不同的语音交互场景,因此需要涵盖几乎所有语音交互场景的“算法仓”,同时每个算法必须满足对于精度和效率的双重需求。

这样繁琐复杂的的程序也无法实现真正上的人工智能,也只是属于弱人工智能的范畴,人们总是对于人工智能期待值过于高,但是基础物理学未得到突破之前,很难实现电影级别的智能产品,相较于电影。我们都往往忽略了一个点,人工智能的出现是为了更好的服务于人,或企业,而不是必须要像人,至少目前技术来讲实现不了也没必要。我们更应该关注如今AI技术对于当下的改变,而AI语音交互作为AI技术应用的前沿阵地,任何的技术以及应用层面的进展都更值得我们去关注。