人工智能发展态势及自然语言理解小议

0、 写在前面

人工智能的发展没有止境,除了踏踏实实做技术外,我们还需要好好审视一下一些具体又抽象的问题,个人理解如下。

1、运算智能!感知智能。认知智能?

人工智能的主要发展阶段有这么几个阶段:
1.运算智能所谓运算智能,也称为计算智能。也就是拥有快速计算和记忆存储能力。这一方面,计算机早就超过我们人类了。包括1996年的IBM的深蓝计算机战胜了当时的国际象棋冠军卡斯帕罗夫(传说迫于对于人工智能的恐惧,深蓝计算机比赛完成后就被拆解了。),2016年的AlphaGo风波席卷全球,在人类认为最不可能被战胜的“围棋”项目中,人类也败下阵(围棋曾认为是具有“灵魂”的博弈),而接下来的战场,就到了多人游戏、不完全信息博弈上来了。2017年1月30日,人工智能再一次在德州扑克上战胜了人类顶级选手。这可能知识一个开端,但无疑证明,运算智能已经发展到相当高的阶段了。
2.感知智能即视觉、听觉、触觉等感知能力。人和动物都具备,能够通过各种智能感知能力与自然界进行交互。目前来看,人类和人工智能平分秋色,各有千秋,对于很多不可思议的感知,机器还无法模拟和实现(例如完成拿杯子的动作),但是人类感知是被动的,机器可以主动进行感知(雷达就是很好的例子,可以脱离本体本身对外界进行探测。这有点像人类的视觉感知,但机器人也同样具有视觉感知,因此雷达这方面机器人胜出)。
3.认知智能认知智能才是我们大众口中的——人工智能的形态。也就是说人工智能具有思考的意识。但这我早就说过,如果一个人工智能能够进行普适思考,也就是说可以对任何问题进行思考,那么它迟早有一天会思考自身存在的价值和意义,一旦具有了自我意识,人类再想对于人工智能的管理,就会麻烦很多。因为人对于人工智能唯一的不可逾越的优势,就是人类具有自我意识,而一旦这个优势没有了,无论从存在形态(生物体难免会出现生老病死)、拥有资源(目前是信息化时代)上,人工智能会占绝对优势。但不用担心的是,在近期,这种人工智能不会出现。

2、人与人工智能学习语言过程的差异

人类的学习过程和人工智能的学习过程并不相同。无论人工智能如何模拟人类的行为,在本质上,还是有相当大的区别。为了再次体会对于语言的学习过程,我特地学习了一门新语言“日语”。以我对于日语的学习,重新对于自然语言处理进行解读。
在刚开始时,由于我对于日语一无所知,所以,我看到的就是一个个符号,而这个符号的发音、意义,我一无所知。状态就如同一个生语料进入到计算机当中。学习日语首先要学五十音,于是我就开始了五十音的学习过程,这个过程对于人来讲,主要的任务就是记忆,把字形、字音进行一个相互映射并长期存储到脑海中,而且是一种相互映射的过程,也就是说,读出音,能想到字,看到字,能想到音。这一过程对于计算机来讲,是相当容易,而且目前很容易实现。
那么接下来阶段,就是对于语音语调的调整,与发音类似,但这次并没有相应的映射关系,大部分是基于规则的。这方面,计算机目前虽然稍显复杂,但是仍然可以实现。
再接下来,就要学习单词,单词是由各个基本音组成,这时候,每个单词都由若干个基本音进行标识,如果仅仅是这一步,那还尚且容易,计算机仍然可以做到,但是,下面这一步正是目前计算机的难点,那就是比如我们学习“妈妈”这个词时,可能口语里是“ママ”,书面语是“お母さん”,但这只是不同的编码形式,计算机也可以实现,但是我们知道妈妈是一个人,是一个对我们关怀的人,她有一个形象,而且,我们首先是知道妈妈指的是自己的妈妈,然后还要能理解别人喊妈妈时,是喊的别人的妈妈,这种逻辑行为以及对于歧义的理解,目前计算机还无法做到。
我想其归根到底,还是由于我们的计算机架构问题,主要是计算与存储分开(显然我们人类并不是这样),这样,知识即使称为知识图谱,仍然满足不了这种表现形式的需求,因为知识并不等于智慧,这点我们在下面会讲。
再往下,就又是一个计算机困难,我们人类学习语法的过程,对于计算机来讲,按理说应该是相当简单才是,实际情况则是相当困难。其原因并不是因为语法有很多规则,也不是语法没有规则,恰恰是因为语法中,既存在规则,又不存在规则,不具有自洽性,这也是产生误会的原因。我们人类可以在误会中学会这种矛盾体,而在计算机里,往大了说是不能存在两条规则矛盾的,往小了说,一个变量不能既是False又是True。
再往下就更没有办法进行学习了,因为在前面的学习过程中,计算机的缺课太多了,再往下已经没有办法进行了。因此人工智能对于语言的理解,目前还专注于浅层语义分析阶段,而就算是依存句法的分析,也是相当缓慢和困难,无法应用到实际生活中。

3、朴素贝叶斯、逻辑回归、隐马尔可夫模型、线性链条件随机场、一般条件随机场模型的区别与联系。

这里可能要写到真正学术的部分,我尽量不讲太细。关于这几个模型之间的区别和联系,我想很多时候,都是在描述其各自的定义,并没有一个宏观的可概括的形式。但这些我们都经常遇到,甚至我们对他们的原理也已经很熟悉了,但是就是还不能准确的说出这几个模型之间到底有什么不同。在《条件随机场简介》(《An Introduction to Conditional Random Fields》 Sutton et al .2012)里,作者就对于其关系描述的十分清楚和到位,具体细节大家可以参考一下这篇文章,我这里借用一下这张图来表示一下这种关系:
人工智能发展态势及自然语言理解小议_第1张图片
条件随机场与常见模型关系

这里上面一部分是我们的生成模型,下面一部分是判别模型,大家就可以很清楚的了解到他们之间的区别和联系了。

4、人机交互接口的巨大变化

自从计算机诞生以来,人机交互的方式也在不断的发展。在开始时,人们还没有显示器的时候,只能通过执行结果的纸带来实现输入输出。其实早在1714年,类似键盘的打字机就已经出现在世界上了。但是那时候的键盘还并不算得上真正的键盘。直到1868年,“打字机之父”肖尔斯才申请了专利并且在几年之后设计出了现在键盘——QWERTY键盘。
后来,图形化界面开始使得交互更加便捷,但是第一个图形界面并不是现在独霸天下的Windows,也不是高高在上的MacOS,而是1973年的Xerox Alto,但是这个系统并没有商业化,也十分简陋,多半只有文字和方框。但是自从它出现以后,原本并没有多少人青睐的鼠标(1968年道格拉斯恩格尔巴特发明),才开始被大众所接受。
值得主意的是,自从鼠标和键盘在40年前发明以后,一直到现在,人机交互接口还没有一个明显的质的变化,也就是说并没有出现一个新的人机接口,虽然现在可以语音控制计算机执行一些特定的指令(Siri),但是还并不成熟,而且显然这并不能成为主流,因为声音会影响每个人,而且为了信息的安全性,也不太可能使用现在这种语音方式(例如密码等)。当然,现在也出现了体感式操作,以及结合VR\AR的运动型感知交互,但是要发展成熟并为大众所用,但至少是一种用户体验增强的方法。当然,像是脑电波感应这种,我觉得大有所为,因为同时具有了保密性、个性化、迅速性等多种优势,但是可能在可实现范围内,还是相当拘束。不过这也算是一个新的创新了。

5、知识≠智慧?

对于这点,可能有一点疑问,这里是针对计算机人工智能来讲,还是针对人来讲。但总归一点,我觉得知识和智慧的存在方式不同。知识一般指的是可被普适学习的东西,它一般是一种客观存在的具有物质性的东西,也就是说是一种静态的产物。而智慧通常都是一种动态过程的表现。
我们一般描述一个人有知识,则会描述他上知天文、下知地理等,意思是说他懂的东西多。而说一个人有智慧的时候,通常是讲述他如何巧妙或者高质量的完成、经历一些事情,从他对于外界反应做出应答和得到的最终结果来看他的智慧所在。因此知识和智慧是不太相同的。如果放近了讲,知识和智慧的区别也许是这样,我们开卷考试,即使你有了一整本书,如果你之前没有学习,试卷上的题目你还是并不能做出来,这就是没有把知识学会,其实就是使得知识具有动态性的原因。
在未来,除非有协处理器能够与我们大脑进行这种动态的模糊性交互,否则个性化“定制”人类的思维,将会是十分困难的。(比如我需要学会开车,结果插一个芯片就会了等等,但是这样是有可能的,刚开始插入芯片以后,我们只能简单的进行操作,随着人脑和协处理器的联系愈加紧密和密切,我们就能熟练的掌握这项技能了。)

6、结束语

这只是一个开始,再接下来的学习中,我们可能要对计算语言学的各个部分进行相关的学习和介绍。对于人工智能,我充满期待。

你可能感兴趣的:(人工智能发展态势及自然语言理解小议)