姓名:杨晶晶 学号:21011210420 学院:通信工程学院
转载自:https://zhuanlan.zhihu.com/p/82364670?from_voters_page=true
【嵌牛导读】列出了半个世纪以来在人工智能领域的成就,并讨论了最近IBM的沃森-危险边缘挑战赛(Watson- Jeopardy Challenge)。我们也权衡了从未达到过人类级别的人工智能的前景。
【嵌牛鼻子】人工智能领域的成就。
【嵌牛提问】人工智能领域有哪些成就以?人工智能未来的前景是什么?
【嵌牛正文】
引言
首先,我们回顾了搜索、知识表示和学习在人工智能系统建设中的重要性,并给出了示例,说明合适的知识表示有助于解决问题。
其次,我们介绍了在神话和文学中反复出现的一个主题——创造生命或智能体的尝试总会遇到可怕的后果。也许,我们应该向人工智能界提出一些警告。
本书说明了计算机科学中无法求解的问题的概念,即不存在求解算法的问题。我们自问是否能够创造人类级别的人工智能,就是这样的问题。
接着,我们回顾了半个世纪以来在人工智能领域的成就。
然后,我们讨论了IBM的沃森系统。2011年3月,在一场观众众多的电视比赛中,IBM计算机击败了危险边缘挑战赛中的两位常胜Jeopardy冠军。最后,我们回顾了关于创造生命的若干理论,并解释了智能和意识。
1 提纲挈领——概述
如果你想设计智能软件,那这个软件就需要具备以下特点。
(1)搜索能力。
(2)知识表示的语言。
(3)学习的能力。
在早期的工作中,这就已经显而易见,盲目的搜索算法(即没有领域知识),如广度优先搜索和深度优先搜索的算法,无法有效、成功地越过它们所面临的大规模搜索空间这个障碍。
如本书中所述,一条有用的指导原则是,如果你想设计用于执行某项任务的系统,请先查看自然中是否已经存在类似的系统。如果现在是1902年,而你想设计一个“飞行机器”,那么你的注意力应该集中在鸟类上。1903年,莱特兄弟成功地制造了飞机。飞机的机身相对较薄,并且有两个突出的大飞翼,这一点都不奇怪。
盲目搜索算法不具备所必需的功能来应对人工智能领域出现的大规模的搜索问题。但是,人类是专家级别的“问题求解机器”。纽厄尔和西蒙认识到了这一特点,研究了在问题求解过程中被要求“说出自己思想(think aloud)”的人类。1957年,这项研究最终导致了一般问题求解器(GPS)的发明。一般问题求解器具有从人类学科中提取出来的启发式,成功解决了以下问题:水壶问题、传教士和食人族问题以及康尼斯堡桥问题等、搜索算法以及博弈算法中,有效地使用了启发式方法,部分克服了组合爆炸的难题。
知识表示方法也对问题求解的能力产生了实际的影响。康尼斯堡桥问题是:“能否一次并仅有一次经过这7座桥,重新回到起点?”
1736年,莱昂哈德·欧拉(Leonhard Euler)写了关于图论的第一篇论文,给出这样的结论:当且仅当图17.3所示的桥包含了一个环,且这个环包含了所有的边和顶点时,图17.2所示的桥才可以如所描述的那样遍历。Euler得出结论,当且仅当每个顶点的度是偶数时,这个图才包含这样一个环(现在称为“欧拉环”)。
显然,问题的表示对于有效地发现解有着巨大的影响。上述指导原则带领我们得到了两种学习范式。人脑(和神经系统)是自然学习系统中最引人注目的例子。在第11章中,它作为一种隐喻出现,在那一章中,我们概述了一种学习的方法——人工神经网络(ANN),它能够从人类大脑模型中抽象出突出特征,如高连通性、并行性和容错能力。在许多问题求解领域,从经济预测到对弈和控制系统,ANN模型都可以认为是成功的。
第二个范式是进化,这也许不是那么明显。达尔文(Darwin)描述了植物和动物物种如何适应环境得以生存。在此处,是物种本身而不是个体在学习。第12章概述了两种进化学习方法——遗传算法(GA)和遗传规划(GP)。在从调度到优化的问题求解领域中,这两种方法都获得了成功。
2 普罗米修斯归来
在希腊神话中,普罗米修斯是个神,他从天庭中偷取火种,并把火种带到了人间。有些记述也赋予了他将人类从黏土中造出来的重任。在文学中,以无生命的材料创造生命的主题是普遍存在的。也许最令人毛骨悚然的描述出现在《Frankenstein》一书或玛丽·雪莱(Mary Shelly)的小说《The Modern Prometheus》中。毫无疑问,读者熟悉这个科学家创造生命然后对自己的创造物感到惊恐的故事。1931年,由詹姆斯·惠尔(James Whale)执导的电影中,鲍里斯·卡洛夫(Boris Karloff)扮演了怪物的角色。
Shelly小说的第一版出版于1818年,当时工业革命正如火如荼地进行着。人类利用蒸汽动力在制造业和纺织业领域进行了翻天覆地的改革。电报的发明使远距离通信实际上变成了即时通信。许多人认为这场革命的后遗症并不完全是有益的。我们对蒸汽和煤电,然后是石油,以及最近的核能的依赖,已经严重污染了星球、水体,还有空气。还有人认为,工业革命促进了堕落的物质主义。文学评论家则非常深刻地指出,《弗兰肯斯坦》的道德是,社会必须警惕其试图掌控大自然的尝试。随着在整个21世纪,人们对智能知识的掌控持续增强,这也许需要不断向人工智能界强调这个警告。
其中一个作者(S. L.)在其童年时期看过这部电影:但是到了今天,他睡觉时仍然开着灯。
计算机科学是一门涉及信息和计算的科学领域。其重点是问题的算法解。20世纪让这个新生学科谦虚谨慎。由于人们发现了问题可解性的基本限制,因此这个学科就愈加谨慎起来。也就是说,可能存在一些问题,这些问题不存在算法解。著名的问题就是所谓的“停机问题(halting problem)”。给定任意流程P,运行任意数据w,P(w)会暂停吗?例如,四色问题也许是图论中著名的开放性问题。它的命题是“对地图进行着色,四种颜色是否足以使两个相邻区域的颜色不一样?”1976年,阿佩尔(Appel)和哈肯(Haken)对这个问题做出了肯定的回答。对于这个问题,计算机程序求解了几百个小时。如果运行这个程序的操作系统可以预测该程序最终会停止,那么这将大有裨益。停止问题告诉人们,这种先验知识并不总是可能的。
本书早些时候提到了阿兰·图灵(Allen Turing)。1936年,他正在研究什么样的函数是可计算的这个问题。[3] 例如,加法是一个可计算的函数,也就是说,可以给出一个逐步的过程,这样如果将整数X和Y作为输入,那么在有限的计算步骤之后,可以获得它们的和X + Y。他提供了一个现在称为图灵机的计算模型(见图17.4)。图灵机由如下三部分组成。
(1)输入/输出磁带,在输入/输出磁带写上输入问题;同时在磁带上也写入了结果。存在各种图灵机模型;图17.4所示的是一种双向无界磁带的模型。磁带被分成了单元格,并且在每个单元格中都可以写入一个符号。磁带上的每个单元格预先加载了空白符号(B)。
(2)一种包含算法(即求解问题的分步过程)的有限控制。
(3)读/写头,这可以读取磁带上的符号,并将符号写入此磁带。它可以向左或向右移动。
Turing讨论了通用图灵机(UTM)的概念——这种图灵机能够运行其他图灵机的程序,即能够模拟“普通”图灵机的行为。Turing证明了,对于任意的图灵机(T),任意输入(w),即T(w),不可能确定图灵机(T)是否会停止。这就是所谓的图灵机停机问题。这个问题更一般的版本(即停机问题),不能被证明是不可判定的。人们不假思索地接受了,图灵-邱奇论文给出的这个观点。这篇论文中提到,图灵机与数字计算机的计算能力相当,结果就是,大多数计算机科学家认为,在图灵机上无法解决的问题在算法上也是无法解决的。因此,计算有根本的限制。作为计算机科学的子学科,人工智能也具有这些基本的限制。人们想知道的是,人类级别人工智能的创造是否也有这些限制。
3 提纲挈领——介绍人工智能的成果
搜索方面。
视频游戏设计中已纳入了A*,这使游戏变得更加真实。
Mapquest、Google和Yahoo地图使用启发式搜索。许多GPS和智能手机应用程序都集成了这种技术。
用Hopfield网络和进化方法找到难题,有时甚至是NP完全问题(如TSP)的近似解。
博弈方面。
Minimax评估使计算机可以玩比较简单的游戏,如tic-tac-toe和nim。
由启发式和其他机器学习工具辅助,通过alpha-beta修剪的Minimax评估使得计算机可以玩锦标赛级别的跳棋(Samuels和Schaeffer)和国际象棋(Deeper Blue击败世界国际象棋冠军Garry Kasparov)。
锦标赛级别的奥赛罗程序(Logistello,1997),以及西洋双陆棋(TD-Gammon,1992)、桥牌(Jack和WBridge 5,2000s)和扑克(2007,见第16章)中的“精通玩家”。
模糊逻辑方面。
手持式摄像机自动补偿虚假的手部移动。
汽车牵引力控制装置。
数码相机、洗衣机和其他家用电器的控制装置。
专家系统方面。
具有内置推理和解释性装置的知识密集型软件或所谓的专家系统(ES),可帮助消费者选择合适的车型、浏览在线网站、进行购物等。
ES还可用于分析、控制、诊断(患者有哪些疾病?)、指导和预测(我们应该在哪里挖石油?)。
ES用于多个领域,如药物、化学分析和计算机配置。
只要ES系统用于帮助而不是取代人类,将ES作为人工智能领域最大的成就之一就不会引起争议(见第9章)。
神经网络方面。
雷克萨斯汽车有倒车摄像头、声纳设备和神经网络。采用这些技术,汽车可以自动并行停放。
当车辆太靠近其他车辆或物体时,梅赛德斯汽车以及其他汽车有自动停止控制。
Google汽车几乎完全自主,但是它自动驾驶时,车内必须有人。
光学字符读取器(OCR)自动路由大量邮件。
自动语音识别系统得到广泛的应用。软件智能体例行公事地帮助我们浏览信用卡和银行交易。
在机场,当检测到在“禁飞”名单中的人时,软件会提供自动安全警报。
神经网络协助医学诊断和经济预测(见第11章)。
进化方法方面。
电信卫星的轨道调度,防止通信渐隐消失。
优化天线和超大规模集成(VLSI)电路设计的软件。
数据挖掘软件使数据对公司更有价值(见第12章)。
自然语言处理(NLP)方面。
会话智能体为个人提供旅游信息,并协助预约酒店等。
GPS系统通常向用户发出语音指令,例如“在下一个路口,左转”。一些智能手机具有应用程序,允许人们说出请求:“最近的能制作卡布奇诺的咖啡店在哪里?”
Web请求允许跨语言进行信息检索,并在需要时进行语言翻译。
交互式智能体向正在学习阅读的儿童提供口头协助(见第13章)。
具有神经网络、自然语言处理(见第13章)、语音理解和规划(见第14章)的机器学习应用程序,在机器人技术方面取得了显著的进步(见第15章)。
总体来说,对于一个开始其第二个50年发展的计算机科学子学科,来说这是一个不太糟的成绩。
{应用之窗!}
Google无人驾驶汽车
1998年,斯坦福大学研究生拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)创立了Google。Google最初是一个名为BackRub的搜索引擎,这个搜索引擎使用链接来评价网页的重要性。Google搜索引擎是对“googol”这个词的戏称,但是获得了巨大的成功,并迅速成为地球上强大、知名和主流的搜索引擎。多年来,Google还开发了同样成功的电子邮件系统“Gmail”和大受欢迎的公共视频系统“YouTube”。 Google还开发了一款无人驾驶汽车。
Google无人驾驶汽车(见图17.5)的工程师之一是德米特里·多尔戈夫(Dmitri Dolgov),这个项目的负责人是塞巴斯蒂安·特伦(Sebastian Thrun)博士。Thrun是斯坦福大学人工智能实验室的前任主管,并且是Google街景视图的共同发明人。Google无人驾驶汽车已经测试了好几年,并且在未来的几年里,仍将继续以实验的形式呈现。虽然无人驾驶汽车看起来离大规模生产还需要几年的时间,但是技术人员认为,在不久的将来,它们将像手机和GPS系统一样受人欢迎。Google认为这项技术可能多年无法盈利,但是在其他无人驾驶汽车制造商的信息和导航服务的可能销售中,Google可以预见到巨额利润。
Google无人驾驶汽车使用人工智能技术,如激光点标记感测附近任何事物的痕迹(如在地上的标记和标志),做出人类驾驶员应该做出的决定,如转向以避免障碍或看到行人时停车。
根据法律规定,为了防止出现问题,方向盘后必须有人,还需要技术人员监控导航系统,确保测试安全、不会发生事故。对于不同的驾驶员,你可以选择不同的驾驶个性,如“小心驾驶”“防守驾驶”和“积极驾驶”。
机器人的反应通常比人类快。基于感受器和设备,机器人能够全面感知。它也不会分心,也不会有通常会导致事故的其他因素,如疲劳、药物和粗心。工程师的目标是使这些无人驾驶汽车比人类更可靠。人为错误是造成许多事故的原因。此外,这些无人驾驶汽车使用的软件必须经过仔细测试,必须没有病毒和恶意软件。其他关注点是燃油效率和空间效率——也就是说,理论上,无人驾驶汽车是不会发生事故的,所以汽车可能会“拥挤”在道路上。一些Google无人驾驶汽车已经有了1600多千米的行驶记录,而且没有任何事故或人为干预。这些车辆经过少量的人为修正,也具有了十万多千米的行驶记录。[1]
Google无人驾驶汽车的一个测试是在旧金山附近的校园外开始的。它在约182米的范围内使用了各种传感器,并遵循编入汽车的全球定位卫星系统或GPS的路线。这辆车在加利福尼亚州的规定速度下,以每小时约105千米的速度行驶。就像人类一样,在转弯时,汽车变慢了,接下来加速了一点点。位于汽车顶部的设备提供了详细的环境及其周围情况的映射版本,因此它知道需要采用哪些路、哪些路要避开、哪些路是死路。它能够在忙碌的高速公路上行驶几英里,并且可以无事故地离开高速公路。它也可以开车穿行,停在红灯和停止标志处,能够与行人互动。如果有人类出现,它会等待他们移动。它有一个语音系统,向车上的人或驾驶员宣布其动作。当人工智能系统检测到传感器存在问题时,也会提醒驾驶员。它也可以防止事故,使用检测系统来指出发生了什么。驾驶员也可以通过按下右手附近的红色按钮、触摸制动器或转动方向盘来重新获得对汽车的控制。
当汽车无人驾驶,系统自动控制时,这称为巡航模式(cruise mode),此时,汽车里的人可以放开方向盘。实际上,它成了一种公共交通工具,无费用,不拥挤,不会东张西望且不会有其他因素(这些因素会令普通汽车司机感到分心)。
不过,这仍存在一些法律问题,例如,如果发生意外,谁将为之负责。所有允许无人驾驶汽车测试的州,在无人驾驶汽车时会发生事故的情况方面都没有制定相关的法律。Google发现,只要无人驾驶汽车的车辆内有人,这个人可以掌控任何可能发生的错误,那么驾驶无人汽车就是合法的。
Google无人驾驶汽车将减少对私家汽车的需求,从而减少交通流量,使得人们有了更多可用的土地,无须更广泛地铺设道路。
最近,Google一直在构建具有正常控制标准的实验性电动汽车,其除了启动和停止车辆之外,不需要驾驶员控制。人们可通过智能手机应用程序命令汽车自动驱动,到达需要它的人们的所在地,并将人带到目的地。这辆汽车还发明了一个功能,就是所谓的交通堵塞辅助(Traffic Jam Assist)功能,这允许无人驾驶汽车在行驶过程中跟随另一辆车。
Google对无人驾驶汽车的计划是,拥有至少100台电力驱动的新型原型车。Google的团队将限定它们以约40千米/小时的速度在市区和郊区行驶。测试将由Google人员进行,这将有助于在狭小封闭的地区进行测试。很自然,这需要一段时间来说服监管机构,让他们接受人们使用无人驾驶汽车是安全的。
参考资料
Thrun S. What we’re driving at. Google, 2010.
Markoff J. Google’s next phase in driverless cars: No steering wheel or brake pedals. New York Times, 2009.
Markoff J. Google Cars drive themselves, in traffic. New York Times, 2014.
4 IBM的沃森-危险边缘挑战赛
人与机器对战提供了一个体系,激发着人们对一些技术成就的热情和宣传。IBM是此类三个事件的发起人。第一个事件发生在1997年,一台有特殊目的、具有搜索装置的并行计算机Deeper Blue,在六场比赛中击败了国际象棋世界冠军(见第16章)。
一个TFLOP(teraflop)代表每秒一万亿(1012)次浮点运算。
Blue Gene是一个项目,这个项目专注于生产一些高速的超级计算机来研究生物分子现象。这个项目的机器已经实现了数百TFLOP的速度。2014年,Blue Gene / L系统的速度超过了每秒36万亿次。
一个petaflop对应于每秒一千万亿(1015)次浮点运算。
在过去几年中,IBM的沃森-危险边缘挑战赛一直在进行。其目标是设计一台计算机,它能够回答使用自然语言提出的问题,而自然语言充满了歧义。在自然语言处理领域中,问答系统并不新鲜(见第13章)。但是,IBM希望沃森能够以与优秀的人类玩家(2~3秒)相当的速度进行表演。
有关IBM的沃森-危险边缘挑战赛的信息可以在网络上找到。依次输入“www.ibm.com”和“Watson-Jeopardy Challenge”即可。
顶级的人类参赛者掌握了众多不同主题的信息,这些主题包罗万象,从世界地理到百老汇戏剧,从文学到流行文化,无所不包。
已有的一些问题如下。
(1)“2000年,第100集Got Milk广告中显示了某个流行歌手3岁和18岁的样子,她是谁?”正确的答案是:“Britney Spears”Blue J(沃森早期的名字)回答:“Holy Crap”。
(2)“在九球比赛中,每当你将某个球打入袋中时,都要重新开始。”Blue J回答正确:“母球”。
(3)“哪个国家和智利共享最长的边界?”Blue J的回答不正确:“玻利维亚”正确的答案是第二个选项“阿根廷”。
2007年,IBM高级员工大卫·费鲁奇(David Ferrucci)被选为沃森开发团队负责人。他在语言处理系统方面拥有丰富的经验。在史蒂芬·贝克(Stephen Baker)的畅销书[4]中,Ferrucci坦承了两个相互矛盾的恐惧:第一个是经过数年和数百万美元的研究后,沃森(以及IBM)在国家舞台上惨败;第二个是在最后一刻,另一家公司将绕过IBM并设计出一个优胜的系统。事实证明,这些恐惧伴随了他4年。Ferrucci明白,如果沃森要成功,那么它必须要加载事实——不只是事实,而且是正确的事实。于是,他们研究和分类了数千个过去的Jeopardy问题,并决定让沃森装载成“吨”的维基百科文章。接下来,沃森下载了古腾堡图书馆,“学习”名家著作。沃森也收集了来自人类竞争对手的见解。在沃森项目早期,人们发现,深刻的知识不是必需的——具有许多不同主题的传统知识就已足够。肯·詹宁斯(Ken Jennings)没有通过苦读若干厚厚的书来准备比赛,而是使用闪存卡练习,他希望在广泛的话题上拥有一些粗浅的知识。
接下来,开发人员填鸭式地喂食了沃森百科全书、词典、新闻文章和网页。正如Baker所描述的那样:“(沃森)痛苦而缓慢。”在接下来的几年里,沃森开始与前危险边缘竞争者进行比赛。慢慢地,它的表现开始有所改善。
沃森由2000多个处理器组成,每个处理器并行工作,遵循不同的推理线程。它为每个问题显示了几个答案,并且列出了每个答案的置信度。每当沃森对其中一个回答充满自信时,它就会快速地按下蜂鸣器。
逐渐地,面对人类的竞争,沃森开始表现良好。它偶尔会失言,发出亵渎的语言。当然,IBM的企业形象很重要;他们安装了一个过滤器,使得沃森不会发出最常见的亵渎语言。
人机比赛于2011年3月初举行。尽管出现了一些尴尬的失误,但沃森最终获胜了。其中最有名的失误是最后一道危险边缘问题:
“它最大的机场是以第二次世界大战来命名。”在“美国城市”的类别中,沃森回答说:“多伦多”
为了给沃森辩护,Ferrucci解释说,伊利诺伊州有一个多伦多,多伦多也拥有一支美国职业棒球队。不过,事实依然是沃森犯了一个错误。当然,一个有趣的问题是:“类似沃森的机器有什么样的未来?”危险边缘冠军计算机肯定没有市场。但是,IBM预计,沃森及其继任者在医学、法律等领域将会受到专家式的培训,在这些领域,新知识正在以惊人的速度被发现。如果“医学沃森”阅读了最新的期刊,并可以就患者的最佳治疗方法向医生提出建议,那么这将大有裨益。或者,“法律沃森”可以识别先例,从中找到法律的辩护点。
为了帮助宣传沃森-危险边缘挑战赛,IBM于2011年2月派代表前往纽约城市学院和纽约市立大学研究生院(CUNY)。IBM团队成员之一的洛迪克·萨德罗齐尼(Wlodek Zadrozny)在纽约城市学院进行了讲解演讲。参加此次活动的IBM团队成员如图17.6所示。图17.7为Wlodek Zadrozny与纽约城市学院的与会者一起讨论沃森。最后,杰瑞·莫伊(Jerry Moy)主持了两场CUNY演示。
人工智能技术的正确角色是协助人类,而不是取代人类。沃森将为不同领域的人类专家提供宝贵的帮助。
{人物轶事}
雷·库兹维尔(Ray Kurzweil)
Ray Kurzweil是世界著名的科学家、发明家、企业家和未来学家。《福布斯》杂志称他为“托马斯·爱迪生的合法继承人”,并将他列为全球8大顶级企业家之一。一直以来,人们都说Kurzweil“自成一个行业。” 他的一些著名发明包括第一台CCD平板扫描仪、第一个全方位字体光学字符识别、第一台盲人打印语音阅读机、第一个文本语音合成器、第一台音乐合成器(能够重现大钢琴和其他管弦乐器)以及市场上销售的大型词汇语音识别系统。
Kurzweil获得了50万美元的MIT-Lemelson奖奖金,这是为创新而设的大奖。1999年,他获得了美国国家技术勋章,这是美国在技术方面国家级别的最高荣誉。2002年,他正式入驻美国专利局成立的国家级发明家名人堂。
此外,他还获得了20个荣誉博士学位,有3位美国总统授予其荣誉。他创作了7本书,其中5本是畅销书。《The Age of Spriritual Machines》被翻译成9种语言,曾位列亚马逊科学畅销书的第一名。他的书《The Singularity Is Near》是《纽约时报》的畅销书,并且在科学和哲学方面曾是亚马逊排名第一的书。
2012年,Kurzweil被任命为Google工程总监,带领团队进行机器智能和自然语言处理方面的开发工作。Kurzweil的书还包括:
《The Age of Intelligent Machines》(1990)。
《The 10% Solution for a Healthy Life》(1993)。
《The Age of Spiritual Machines》(1999)。
《Fantastic Voyage (with Dr. Terry Grossman)》(2004)。
《The Singularity》(2005)。
《Transcend: Nine Steps to Living Well》(与特里·格里斯曼博士合著)(2009)。
《How to Create a Mind》(2012)。
此处关于Ray Kurzweil的大部分信息源来自KurzweilAI网站。
奇点(Singularity)
2005年, Ray Kurzweil出版了《The Singularity is Near: When Humans Transcend Biology》一书,这可能是他出版的最具有争议的书籍了。这本巨著的中心主题是他所说的“Law of Accelerating Returns”。他认为,计算机、遗传学、纳米技术和人工智能正在呈指数增长。据他预测,到2045年,人工智能将超过这个星球上的人类智慧。图17.10为Kurzweil AI主页描绘的奇点。
库兹维尔认为进化要经过如下6个阶段:
(1)物理与化学。
(2)生物学和DNA。
(3)大脑。
(4)技术。
(5)人类技术与人类智力的融合。
(6)宇宙醒来。
他声称,前4个阶段已经发生了,而人类现在处于第5阶段。到2045年,技术急剧进步,人们能够通过纳米技术和人工智能让身体变得更健康。
http://Kurzweil.net描述的摩尔定律如图所示。
5 21世纪的人工智能
回到先前讨论中提出的悬而未决的问题:人类级别人工智能的创造是否会超出人工智能的基本界限?我们先来思考一下人类智力的起源,然后再思考一下生命本身的起源。
英国著名科学家理查德·道金斯(Richard Dawkins) [5]解决了后一个问题,他在达尔文的进化论中找到了见解。当然,40亿年前,地球上没有动物或植物——只是基本原子的“原始汤”。Dawkins认为,达尔文的理论可以推广到“稳定者生存”,换句话说,稳定的原子(和分子)更有可能在这个古老的地球上生存下去。他进一步推测,在早期的历史上,这个星球拥有丰富的水、二氧化碳、甲烷和氨,因此可能形成氨基酸(作为蛋白质的组成成分的复合分子)。蛋白质是已知生命的前驱体。Dawkins设想,在这个星球漫长的生命之路上,下一步是所谓的“复制因子”的意外创造。这个复制因子具有一个显著的性质——能够忠实地复制自己。他认为,在这个原始环境中,能够快速准确地复制自己的复制因子是稳定的。
复制(或繁殖)过程本身需要有稳定的基本“原材料”的供给。毫无疑问,不同的复制因子不断竞争,以获得充分的水、二氧化碳、甲烷和氨的供给。这一进化过程持续了40亿年。Dawkins认为,经历了这个漫长的进化回合,在当今栖息在这个星球上的动植物中,我们可以找到继承者——这就是基因。
关于这个星球上可能的生命起源,Dawkins通过解释这些基因如何努力确保生存来继续其非凡的论述。在过去大约6亿年的时间里,它们的行为非常像第12章中引用的虚构的精灵。它们一直在塑造人类的眼睛、耳朵、肺等,生命之舟(即身体)也就从这些器官中构建而来。在这一论述中,动物的身体和植物好像只是保护所有重要基因生存的保护性隔断。最近,随着深入(SL)阅读Dawkins的作品,我的思绪回到了“星球大战”系列电影中的一个场景。在这个场景中,敌方部队将士兵置于装有巨腿的机器人战斗机器中,这形成了士兵的保护壳。即使我们接受了Dawkins的理论,但还是有一个问题——“人类意识的起源在哪里?”Dawkins可能会认为那些拥有意识的动物(再次通过自然选择产生的)将具有优势,因此可以实现相对的稳定性,从而确保生存。
杰拉德·埃德尔曼(Gerald Edelman)是一名生物学家,曾获得了诺贝尔奖。他提出了一种意识生物学理论[6],这个理论也建立在达尔文主义的基础上。他认为意识和心灵纯粹是生理现象。神经元组自组织成许多复杂和适应性强的模块。Edelman认为,脑具有功能可塑性,也就是说,由于人类基因组没有足够的编码能力来完全指定脑结构,因此大量的脑组织是自我定向的。
在物理学中,统一场理论应该是关于一切事物的理论,这个理论试图将自然界中发生的各种力统一起来,例如重力、电磁力、强力和弱力。
Marvin Minsky在《Society of Mind》中[7]解决了一个更为广泛的问题。他问:“大脑是如何组织的?”“认知是如何发生的?”正如Dawkins告诉我们的,人类的大脑是历经数亿年演变而来的。统一场理论无法简单直白地解释人类头骨内复杂器官的功能。构建一种智慧好比组建一支没有指挥者的管弦乐队。其中,乐器就是智能体(见第6章),它们不是在播放音乐,而是在解释世界。一些智能体有助于了解语言,另一些智能体可以解释视觉场景,还有一些智能体为人类提供了常识(见第9章中Cyc项目的讨论)。除非智能体之间能进行有效的通信,否则这一切毫无意义。Minsky假设,在任何时间点,个人的心理状态可以解释为一种功能,这个功能中的智能体子集是活跃的。也许人工智能还是太过年轻的一个领域,还没有准备好提出一个像Minsky这样的智能“统一场理论”。但是,当人工智能成熟的时候,Minsky的《Society of Mind》可能会在其中发挥突出的作用。
2015年,在生物和化学层面上,人们完全了解了个体神经元的功能。在人类的知识中,依然存在的不足是,一群神经元如何处理感觉数据、编码经验、理解语言,以及在更一般意义上如何促进认知、启动意识。目前的研究使用X射线和其他扫描技术,在功能模块层面获得对大脑的理解。Kurzweil预测[8],到21世纪中叶,我们将对人类大脑有一个完整的、体系架构般的理解。
此外,他推测,计算机组件的小型化将会提升到一个新阶段,到那时,使用硬件来完全实现大脑是可行的——这种实现可能需要数十亿个人工神经元和数万亿甚至数十亿个神经元的连接。也许在那时,我们将有足够的力量来实现人类层次的人工智能。对我们而言,比较明智的做法是记住普罗米修斯创造完全意识人类的“奖励”,即他被捆绑着,这样狮子就可以享用他的肝脏,然后他的肝脏再生,让狮子再次享用他的肝脏。科幻文学概述了人类创造人类层次人工智能的无数情景。我们希望,如果人工智能可以永远遵循这个崇高的目标,那么这个奖励将比给普罗米修斯的“奖励”更令人满意。
6 本章小结
在本章中,我们回顾了近50年来人工智能领域所取得的许多成就。我们将人工智能放在一个框架中——作为计算机科学的一门子学科。就像考虑计算机科学中众所周知的停机问题是不可判定的那样,我们也就“创建人类层次的人工智能是否可能”这一命题进行了思考。我们讨论了IBM的沃森系统,并描述了其作为法律和医学专业人员助理的功能。
最后通过思考生命、智能和意识的起源,我们做出了总结,并介绍了Kurzweil的乐观观点,即在不久的将来成功创建人类层次的人工智能的可能性。
本文摘自《人工智能》(第2版)
人工智能(第2版)
[美] 史蒂芬·卢奇(Stephen Lucci),丹尼·科佩克(Danny Kopec) 著
人工智能百科全书
易于上手的人工智能自学指南
涵盖机器学习 深度学习 自然语言处理 神经网络 计算机博弈等各种知识 图文详细 讲解细致 配备丰富的教学资源和学习素材
美国经典教材,在美亚上,被评价为自Russell & Norvig的《人工智能:一种现代方法》之后更好的教材,更加适合本科生使用。
本书是作者结合多年教学经验、精心撰写的一本人工智能教科书,堪称“人工智能的百科全书”。全书涵盖了人工智能简史、搜索方法、知情搜索、博弈中的搜索、人工智能中的逻辑、知识表示、产生式系统、专家系统、机器学习和神经网络、遗传算法、自然语言处理、自动规划、机器人技术、高级计算机博弈、人工智能的历史和未来等主题。