前两天,现实中的“钢铁侠”特斯拉 CEO 马斯克,以及谷歌实验室,相继发表了他们脑机接口研究的最新成果。马斯克更是在发布会上手舞足蹈,笑的像个两百斤的孩子。
马斯克的脑机接口已经经过动物试验,很快会开始人体试验。也就是说,人类通过意念控制物体将不仅局限于科幻作品中,而是现实中人人可以做到,《黑客帝国》即将实现。
让这一切成为可能的,除了马斯克的强大财力,近年热门的人工智能技术也起了不小助力。你也许觉得人工智能 AI 是某种尖端科技,与你无关,那你一定是不知道人工智能对人类最大的贡献:搞清了人类的学习模式,弄明白了怎样学习最有效。
至于人工智能是如何搞清人类学习模式的,这个还得从人工智能的发展历史说起。
人工智能领域先驱,日本人工智能领域代表人物山本一成,在他的著作 《你一定爱读的人工智能简史》 中,就从人类智慧的大视野出发,以简单通俗的语言,探讨了人工智能发展的历史与学习的本质。
一、学渣机器与学霸人类
自从图灵机诞生,科学家们就认为人工智能是理所当然的,人类可以制造出与人类相媲美的机器。可以用来辅助人类,延伸人类,甚至是取代人类。
但几十年来,AI 研究一直未有突破,甚至到 2007、2008 年 AI 研究一直处于寒冬期,也就是作者山本一成开始研究 AI 时,无数研究者不得不改换门庭,弃人工智能而投其他领域。
至于 AI 为何如此难以突破,主要是研究者们执着于弄清人类掌握知识的原理:人类为何能掌握知识,拥有智慧。如果找到了人类拥有智慧学习知识的秘诀,就可以如法炮制,让比人类记忆力更出色,处理速度更快的机器也一样“聪明”。
然而就像人类这么多年也只能了解 DNA 的构造,而无法破解 DNA 的奥秘一样,人类同样也无法搞清楚自己是如何学习的,为何能掌握知识,为何能拥有智慧。
当 AI 学渣仰视人类学霸时,它无数次想弄明白为何学霸比它聪明,为何它要练习无数遍都无法识别一个“杯子”,但学霸只要看一眼就能知道,甚至是从来没见过的,也仍然能准确识别为。
仰视了几十年,学渣终于放弃了,研究者们决定:既然理解不了人类的学习奥秘,那我们就来模仿人类的学习行为吧!
二、学渣模仿学霸
在试图揭开人类学习奥秘几十年无果后,研究者转而开始研究人类是通过哪些行为学习知识的,并且发现,所有的认知都是从记忆信息开始,比如背课文。
我们在婴儿时期,也是由父母一个一个的指着物体,让我们记忆,之后我们才能识别更多物体。
而机器,或者说是计算机的优势也恰巧在此,计算和存储。于是 AI 研究者决定让机器以“背课文”的方式对信息进行记忆来模仿人类的学习行为。
这种无法理解人类学习本质,转而模仿人类学习行为的计算机技术,被称为机器学习技术,也是该技术也将人工智能从寒冬期带入了发展期。
这就像一个学渣无法参透学霸为何总是成绩优异,于是开始模仿学霸自律的学习行为,以及一些学习方法。
由此,研究者们先让机器从识别物体入手,进行“看图说话”。
然而这种全盘记忆的方法,就像背参考答案,一模一样的考题能高分通过,稍有变动就是翻车现场。
这时研究者总结出,人类对物体的识别在于对物体的特征识别,而并不依靠是否曾经见过。就像人类掌握知识在于对知识的识别和套用,而不在于是否对每一种突发情况都演练到了。
至此,机器学习由全盘记忆,转变为特征识别。
除了对物体进行特征识别,人类还会进行归类学习,比如家长教孩子都是以“人”、“动物”、“吃的”开始。
这种在不同物体间寻找共性并归类的方法,在人工智能中叫做“建模”,通过建立模型来识别物体。建模就类似人类给电脑编写的一条复杂指令,机器遇到一个新物体,会搜索其特征,并根据之前经验建立的模型,对该物体套用,看是否符合。
建模之后,为了提高正确率,研究者们采用了一种叫“伞形扩散”的方式帮助机器完善模型。
伞形扩散就是说将一个知识放在雨伞的中央,之后再将其四面八方扩散出去,进行验证。这就像是我们学习的各种公式和定理,十分简短,但却会幻化出许多练习题,通过对练习题的解答,才能检验我们对该公式定理的是否掌握。
虽然题海苦无崖,行之却有效,不然记忆力和处理能力超群的机器也不会采用这种方法苦修。
在这一人工智能发展期,还可以看出人类学习的一些误区。比如同样是读过、理解,合上书为何学霸就学会了,而你就呆住了?以及都说好记性不如烂笔头,老师也没少罚抄,为何却还是不会做。
首先,机器从全盘记忆转为特征记忆就说明,信息并不等于知识。人类通过总结归纳能力将信息转化为知识,由此能识别同一物体的不同样貌。而机器的问题,是它只是储存了信息,而无法将信息转化为知识,变个颜色就眼瞎了。所以我们接收到的信息并不等同于我们学习到的知识。
其次,机器将全盘记忆转为特征记忆,说明拥有超级记忆力的机器,无法通过记忆信息而学习知识。也就是为什么我们在读过、理解过书上的知识后,我们却无法使用,Tell ≠ Learn ,Listen≠Know。就像数学试卷的最后一题,你能阅读题干,能理解题干,但你就是解不出来。记忆不等于学习,光看,光理解,不实践检验就无法真正获得知识。
这也是我们对长辈称呼感到抓狂的原因,第一次见长辈是父母告诉你称呼,但并未告诉你为何如此称呼,你接触的是信息而不是知识,你使用的是记忆而不是学习,下一次遇到另一个长辈,你注定还是不会。而过段时间遇到同一个长辈,你也只能尴尬的点头傻笑了。
三、学渣即将逆袭
每次背课文,你一定都羡慕记性好的人,甚至希望把书吃进去就能获得知识。
可是具备超群记忆力的机器,为啥却是笨笨的学渣,甚至被戏称为“人工智障”呢?
人类记忆力这么差,好多事转头就忘,却是藐视机器的学霸,这是为何?
机器虽善记,但它不会用,学习到的知识无法连接,无法迁移,是平面的,是浅层次的。只能看到几片三角形木板,却无法像人类一样将木板组合拼接成“七巧板”。
研究者们将这种差别,认为是人类拥有复杂的神经元结构。类似下图这样,一个竖过来的,多层的连线题。人类对事物的认知经过神经元网络的连接与迁移而变得立体、多面,并且知识也得以迁移。
这里我想引用 YJango(人工智能领域博士,超智能体账号运营者) 举过的一个例子:人类大脑拥有三种知识 A、B、C,通过神经元的连接、组织、迁移,人类可以解决问题的总数,排列组合后是 2^3-1,即 7 种问题。而同样拥有 A、B、C 三种知识的机器,能解决问题的个数,仅为 3 种。如果我们再把知识总数放大一点,这次让人类拥有 20 种知识,则人类能解决问题的个数是 20^20-1≈100万个。而机器呢?拥有 20 种知识,也只能解决 20 个相关问题。
神经网络技术的引入,使机器从浅层次的学习,进入到深层次的学习,并被称之为深度学习技术。
在引入深度学习技术后的机器,对物体的识别正确率和速度不断攀升,甚至超越了人类。这也使得人工智能领域得到了飞速发展,机器学渣开始对人类学霸奋起直追。
四、学渣成功挑战学霸
有记录以来最早的机器战胜人类,是 18 世纪后半叶出现的国际象棋木偶 The Turk,其因与拿破仑对战获胜而震动欧洲。虽然后来证实是有国际象棋大师藏于木偶之中,但人类希望能创造出与人类匹敌的机器的愿望,一直延续至今。
目前人工智能史上有三次学渣机器挑战学霸人类获胜的标志性事件,这三次标志性事件分别是:
1997 年 IBM 超级计算机“深蓝”国际象棋获胜
2013 年日本 PONANZA 将棋获胜
2016 年阿尔法狗围棋获胜
2013 年这一次学渣逆袭,便是《你一定爱读的人工智能简史》作者山本一成开发的程序。此时的人工智能在日本将棋(一种日本象棋)领域已经难逢敌手,甚至有许多职业选手转而研究将棋程序 PONANZA 的棋路,并称之为 PONANZA 流。
但这一阶段,将棋程序 PONANZA 还停留在刷题阶段,需要人类给他指明夺分方向,类似于写作文需要人类进行命题。如果没有了人类命题,或者是脱离了固定棋路,甚至是对手用自损三千招数迷惑它,比如说围棋这种局面时刻变化的游戏,PONANZA 就会难以应对。此时的人工智能程序 PONANZA 就像一个只知在阵前冲杀的士兵,空有武力而无策略。
然而学霸往往是全科学霸,哪怕学霸毕业后,也只有学霸想不想做,而没有能不能做好。
真正掌握一种知识,是在不同环境中,对知识的运用。不仅是在古诗词默写中能填空,更应该可以在生活中引用。不仅在物理课本上学习电力知识,至少在家换灯泡得知道先把电闸关了。
武侠小说里,主角除了神功护体,也必须在江湖上历练一番才能称之为大侠。令狐冲下山行侠仗义,他却发现无法用山上学到的善恶、黑白去看待江湖,何谓侠,何谓义,都需要经过历练才能参悟。
所以对学到的知识,怎么用,用在哪里,是学了死知识,还是能活用,就成为了人工智能在高潮期关心的问题。
高潮期的代表事件,就是2016 年阿尔法狗在围棋赛中战胜人类。之所以引人注目,不仅是战胜人类,更是在比赛过程中,阿尔法狗表现出了似乎具有人类的思维能力。落子前需要停顿思考,招数也具有全局观,有勇有谋,而不是像 PONANZA 一头冲到底。仅仅诞生两年的阿尔法狗,在棋盘上打败了需要二十年才能培养起来的顶尖职业棋手。
根据山本一成介绍,阿尔法狗的逆袭主要是其采用了深度学习技术,以及强化学习技术共同加持的结果。深度学习技术上一段讲过,就是神经网络的不断下钻。而强化学习技术,则是人类的下山历练。
通过历练中搜集到的信息,进行判断,并根据判断自行调整输出结果,或者说是对世界的认识,这就是人类在走出校门后的学习过程。阿尔法狗也正是模拟了这一过程,通过棋路预测器和胜负预测器为自己建立了数据库和判断机制,由此才能“佯作思考”状。
举个 AI 不智能的例子,美颜滤镜。人类将算法目标设置为了大眼、瘦脸、磨皮,然而当明星遇到美颜滤镜,却常常花容失色,一个个变成了鞋拔子下巴,外星人眼睛的妖怪。你也许会笑 AI 不智能,将美人变成了妖怪,但实际上,只是因为美颜滤镜的 AI 程序停留在了刷题阶段,无法自行判断何谓美。
总结
通过山本一成在《你一定爱读的人工智能简史》里面对人工智能发展历史的介绍和技术本质的讲解,通读下来,似乎更像是 AI 研究是如何搞清人类学习模式的。
为什么英语试卷满分,却是口语哑巴,为什么错题总是纠缠不休,以及怎样学习最有效。
根据人工智能的发展史与技术突破,我总结了以下三点:
1.为何学习
人类的记忆有限,穷其一生也无法接触到所有信息并记忆,故而需要对信息总结归纳,将信息压缩为知识。即为 AI 中的建模。
2.如何学习
可以分为明确任务,用例子构建知识,验证知识三步。明确任务是人工智能的识别功能,用例子构建知识和验证知识,则是建模步骤,通过套用模型验证知识,从而达到掌握知识。
3.学不完怎么办
世界之大,人类社会已经有千年文明,知识层出不穷,可以说是根本不可能全部学完,这种又要怎么办?
方法是分而治之和排列组合。
分而治之是将大问题划分为小知识,我们不需要掌握每一个问题,而应该掌握解决大问题所需要的小知识。并合理运用这些小知识,前面提过,当我们拥有 20 种小知识时,我们能解决的问题就是 100 万个。
所以目前来看,人工智能对人类最大的贡献也许不是技术进步,而是搞清楚了人类的学习模式及其作用。
读书有意思,读有意思的书,做有意思的人。
我是张萌萌,每周一本书,欢迎关注我。