人类的语言就是它的文明本身,要让人工智能真正理解语言几乎是不可能的,只有当人工智能的硬件复杂度积累足够才能做到,而这时的人类对失控的人工智能又无法理解;人类的理性是有限而可笑的,试图理解世界却又不想失去控制。
至于现有的语音识别系统,无论是Siri,Google now,Cortana都只是人类利用有限的智慧做出的拙劣的仿品,并不是真正基于对语义的理解而是快速的词条,例句匹配,只不过是官方选的句子合适让你产生翻译和谐的错觉而已,当然ai里也有对语法的设定来限定单词的位置,但语义这种核心项目却没有涉及,因为机器和人的思维方式完全不同,前者是完全的逻辑模型,而后者只有有限理性。要让机器智能模拟人的智能不但不可行,也不可取。
说的多了,直接回答你的问题,永远不会。在机器智能复杂度之前,技术不能,至多能在一定程度上辅助人类;而在机器智能超越人类之后,人类还有生存的余地么。
还有,鉴于很多人都会把识别成功和真正理解混淆,我需要补充一点东西:
1.机器要想达到人工传译的水准,仅仅通过生成快速链接(这里指的是原理层 面,而且是产品化的,一些语法规则的限定上面也有提到,但更多是让词语组合的可能范围缩小)是荒唐可笑的;要想实现和人工翻译一样的准确度,就必须有类似人类大脑的复杂度,而你知道,人类对大脑的了解是贫乏的,所以说是有限的理性,而目前的人工智能系统只是人类掌控的玩偶,所以在复杂度上的答案是显而易见的。
2.如果熟悉人工智能就应该知道有个案例叫做中文屋子,30年前的东西,但现在还远未解决,或者说有定论,而现在计算机界对人工智能的成果应用也有限,强大的GPS(通用问题求解系统)也有近50年的历史,虽然不完善,但理念决对领先现今商业应用技术,这种现象有两个原因:成本过高和科学界对语义识别的心灰意冷。
3.六七十年代是人工智能的黄金时代,所有人对强人工智能都抱有极大的期望,以致于大家都以为自然语义识别的实现近在咫尺(毕竟语义识别是强人工智能实现的核心)但实际上是研究者估计过高,十多年间进展极微,公众与媒体也就失去兴趣,而政府与企业的支持也随之渐默。
4.很多人会疑问我的回答与所提的问题有多少关联,因为我提的是语义识别而题主在问机器翻译的准确度;但如果你多想一点,而且认真看了我的回答,你就会明白我想阐明的问题:我指的是语言这种工具本身的可系统化程度,而非语言工具箱中诸部件与另一工具箱部件映射的准确程度。
5.再度回到翻译这个主题,前面我说明了自然语义识别的困难程度,现在可以对我上面对机器翻译的观点做出解释了:假设你有一个观点,为了传播这个观点,你选择用语言做为载体(事实上,你别无选择,除了语言工具本身的类别),这个观点由一个相同语言环境的人接受,但事实上观念已经产生一定损耗和异化,而他想跨文化传播他的你的观点,最后由一个异语言环境者接受。在这个过程中,观点产生了几重变化呢,如果那个外国人说那个观点不对,你怎么评判呢,你怎么引导他理解你的观点呢?这和现有的机器识别方式全然不同,机器翻译的主要原理是寻找可以和它词汇库匹配的词汇,然后按照语义映射表进行形式转换;在这个过程中匹配以及语义映射的准度决定了翻译的准度,而提高准确度的方法,每个人都可以想出很多,但你可以知道这样的识别和我们理解的识别相差多大(顺便说下,语音识别看似高端,但原理完全相同,只是匹配方式不同而已,而且,由于人在朗读时有意识的断句,更简化了语音识别的匹配程序)
6.对于语言这种系统,有表层结构与深层结构之分,前者之语言的形式,而后者是该形式对于特定概念的映射,一般都是一对多;我们所指的语义就是深层结构。
从这些概念我们比较自然语言和机器语言:前者一般是多项映射,而后者则为严格对应。究其原因,前者是自然累积产生的冗余体,而后者因为机器缺少选择能力,且运算复杂度较低,这也是人工智能难以理解语义的深层原因。
本文来自作者知乎回答微软的原声翻译在未来会威胁到翻译这职业吗?