笔者提供为AI贡献了思想、观点和技术的某些学科的一个简史。像任何历史样,这段历史也集中于少数人物、事件和思想,而忽略了其他一些也很重要的东西。我们围绕一系列问题来组织这段历史。我们当然不希望造成以下印象:即这些问题是这些学科处理的所有问题或者这些学科一直都朝着作为其终极成果的AI前进。
1. 哲学
形式规则可用于推出有效的结论吗?
思想如何从物理的大脑中产生?
知识来自何方?
知识如何导致行动?
亚里士多德( Aristotle公元前384公元前32)是第一位系统阐述支配头脑理性部分的一组精确规则的人。他为严密推理制订了一种非形式的三段论系统,给定初始前提后该系统原则上允许你机械地推导出结论。很久以后, Ramon Lull(卒于1315)认为有用的推理确实可以用机械人造物来实现。 Thomas Hobbes(1588-1679)提出推理就像数值计算“我们在无声的思维中加加减减”。计算本身的自动化已经在顺利进行中。在1500年左右,里昂纳多·达·芬奇( Leonardo da vinci,1452-1519)设计了一台机械计算器,但没有建造出来;最近的重建表明该设计是起作用的。虽然由布雷西·帕斯卡( Blaise pascal,1623—1662)在1642年建造的Pascaline更著名,但是第一台已知的计算机器是由德国科学家Wilhelm Schickard(1592-1635)在1623年左右建造的。帕斯卡写道:”算术机器产生了明显比所有动物行为更接近思维的效果。”高特弗雷德·威尔海姆·莱布尼兹(Gottfried Wilhelm Leibniz,1646—1716)建造了一个试图对概念而不是数字执行操作的机械装置,但是其范围非常有限。莱布尼兹确实超过了帕斯卡,因为前者建造的计算器能加、减、乘与求根,而 Pascaline只能加与减。有人推测机器不仅能做计算而且还能思考并独立行动。在其1651年的著作《大海兽》中, Thomas Hobbes提出了“人工动物”的思想,并主张“心脏只为一跳;神经只为那么多连结;关节只为那么多转动”。
认为头脑至少部分地根据逻辑规则来运转并建造能模仿那些规则的一些物理系统是一件事情;而认为头脑本身就是这样的物理系统是另一件事情。雷内·笛卡尔(Rene Descartes,1596-1650)关于头脑与物质之间的区别以及由此引起的问题给出了第一个清晰的讨论。伴随着头脑的纯物理概念的一个问题是似乎为自由意志几乎没有留下空间:如果头脑完全由物理定律来支配,那么它比一块岩石”决定”朝地心落下没有更多的自由意志。笛卡尔强烈提倡在理解世界时推理的力量,这是一种现在称为理性主义( rationalism)的哲学,亚里士多德和莱布尼兹算作其成员。但是笛卡尔也是二元论( dualism)的支持者。他认为人类头脑存在一部分(称为灵魂或精神的)在自然之外的不受物理定律支配的东西。另一方面,动物没有这种二元性:它们可被当作机器来对待。对二元论的替换物是唯物主义( materialism),它认为脑髓根据物理定律的运转形成了头脑。自由意志只是对选择实体可用选择的感知出现的方式。
给定一个能处理知识的物理头脑,下一个问题是建立知识的来源。经验主义( empiricism)运动始于弗朗西斯·培根( Francis Bacon,1561-1626)的《新工具论》(Nowm Organum),被 John Locke(1632-1704)的格言:”无物非先感受而后理解”所刻画。大卫·体谟( David Hume,1711-1776)的《论人类天性》( A Treatise of Human Nature)(休谟,1739)提出了现在被称为归纳( induction)原理的东西:一般规则通过揭示规则中元素之间的重复关联来获得。以 Ludwig Wittgenstein(1889-1951)和伯特兰·罗素(Bertrand Russell,1872-1970)的工作为基础,由 Rudolf Carnap(1891-1970)领导的著名的维也纳学派发展了逻辑实证主义( logical positivism)学说。该学说认为所有知识都可用最终与对应于感知输入的观察语句( observation sentences)相联系的逻辑理论来刻画;因此逻辑实证主义结合了理性主义和经验主义。 Carnap和 Carl Hempel(1905-1997)的证实理论( confirmation theory)试图分析来自经验的知识获取。 Carnap的著作《世界的逻辑结构》(The Logical Structure of the World)(1928)为从基本的经验中提取知识定义了一个明确的计算过程。它也许是首个把头脑看成一个计算过程的理论。
头脑的哲学描述中的最后元素是知识与行动之间的联系。这个问题对人工智能是极其重要的,因为智能既要求推理又要求行动。进而,只有懂得如何证明行动是正当的我们才能懂得如何构造一个其行动是无可非议的(或合理的) Agent在《论动物行为》(De Motu Animalium)中,亚里士多德主张通过目标与行动结果的知识之间的逻辑关系来证明行动是正当的:
但是,思维有时伴随着行动有时却没有,有时伴随着运动有时却没有,这是如何发生的呢?看起来好像与对不变的对象进行推理并推断结果的情形一样几乎相同的事情总会发生。但是在那种情况下结果是推测的命题……然而这里根据两个前提导出的结论是一个行动我需要遮盖物;斗篷是遮盖物。故我需要斗篷。我必须制作我所需要的东西;我需要斗篷,故我必须制作斗篷。结论”我必须制作斗篷”是一个行动。
在《尼各马科伦理学》( Nicomachean Ethics)(第三卷.3,1112b)中,亚里士多德进步详细阐述了这个论题,并提出了一个算法:
我们要深思的不是结果,而是手段。因为医生不会深思病人是否会治愈,演说家也不会深思他是否会说服听众他们假设了结果并考虑如何以及通过什么手段来获得该结果,他们还要考虑手段是否容易实现,从而产生最好的手段当只有一种手段来达到结果时,他们会考虑如何根据这种手段来达到结果,以及通过什么手段来实现这种手段,直到他们得到第一原因,……在分析序列中最后出现的手段在实现序列中似乎是第一个手段,如果我们碰到了不可能实现的事情例如,如果我们需要金钱而又得不到,那么我们就放弃搜索;但是如果一件事情看似可能,我们就尝试着去做。
2300年后亚里士多德的算法被纽厄尔和西蒙实现在他们的GPS程序中,我们现在称其回归规划系统。
基于目标的分析是有用的,但是没有说明当多个行动均可达到目标时或者当没有行动可完全达到目标时该做什么。 Antoine Arnauld(1612-1694)正确地描述了用于决定在这种情况下该采取什么行动的一个定量公式。 John Stuart Mill(1806-1873)的著作《功利主义》( Utilitarianism)(M,1863)在人类活动的所有领域推广了理性决策准则的思想。
2. 数学
什么是能导出有效结论的形式化规则?
什么可以被计算?
我们如何用不确定的信息来推理?
哲学家们标出了人工智能的一些基本思想,但是到正式科学的跳跃要求在三个基础领域(逻辑、计算和概率)具有一定水准的数学形式体系。
形式逻辑的思想可以追溯到古希腊的哲学家,但是其数学发展实际上始于乔治·布尔( George Boole,1815-1864)的工作,他详细设计出命题逻辑,又称布尔逻辑( Boole,1847)1879年,高特洛布·弗雷格Frege,1848-1925)扩展了布尔逻辑,使其包含对象与关系,创建了现在使用的一阶逻辑。阿尔弗雷德·塔斯基( Alfred Tarski,1902-1983)引入了一种关联理论,它指出如何把逻辑对象与现实世界的对象联系起来。
下一步是确定逻辑和计算能做的事情的极限。一般认为第一个不平凡的算法( algorithm)是计算最大公约数的欧几里得( Euclid算法。 algorithm这个单词(以及研究算法的思想)源于9世纪的波斯数学家al- Khowarazmi,其著作还把阿拉伯数字和代数引入欧洲。布尔和其他人探讨了用于逻辑演绎的算法,而到了19世纪晚期,把一般的数学推理形式化为逻辑演绎的努力已在进行中。1930年,库特·哥德尔( Kurt Godel,1906-1978)证明了存在一个有效的过程来证明弗雷格和罗素的一阶逻辑中的任何真语句,但是那个一阶逻辑不能处理刻画自然数所需要的数学归纳法的原则。1931年,哥德尔证明了确实存在演绎的局限。他的不完备性定理(incompleteness theorem)证明了在与佩亚诺( Peano)算术(自然数的基本理论)一样强的任何形式理论中都存在不可判定的真语句,即在该理论中这些真语句没有证明。
这个基本的结果也可解释为证明了整数上的某些函数无法用算法表示—即,它们是不可计算的。这促使阿兰·图灵( Alan Turing,112-1954)尝试着去精确刻画哪些函数是可计算的( computable)—能够被计算。实际上这个想法稍微有点问题,因为实际上不能给出计算或有效过程概念的形式化定义。然而,丘奇图灵( Church-Turing)论题说明图灵机( Turing,1936)有能力计算任何可计算的函数,该论题被广泛认同为提供了一个充分的定义。图灵还证明了存在一些没有图灵机可以计算的函数。例如,没有图灵机可以一般地判断一个给定的程序对于给定的输入能否返回答案或者永远运行下去。
虽然可判定性和可计算性对于理解计算是重要的,但是易处理性( tractability)的概念更大的影响。粗略地说,如果解决一个问题的实例所需时间随实例的规模成指数级地增长,那么该问题称为不易处理的。复杂性的多项式级与指数级增长的区别最早在20世纪60年代中期得到重视( Cobham,1964: Edmonds,1965)。这是重要的因为指数级增长意味着即使适度大的实例都不能在合理的时间内得到解决,所以,应该努力把产生智能行为的整体问题分成易处理的子问题,而不是不易处理的子问题。
可如何确认不易处理的问题呢?由斯蒂文·库克( Steven Cook,1971)和理查德·卡普( Richard Karp,1972)开创的NP完全( NP-completeness)理论提供了一种方法。库克和卡普证明了存在大量经典组合搜索与推理问题是NP完全的。NP完全问题类可归约到的任何问题类可能就是不易处理的(虽然尚未证明NP完全问题必是不易处理的,但是大多数理论家相信这个结论)。这些结果与大众新闻迎接第一台计算机—”比爱因斯坦更快!”的”电子超级脑袋”—时的乐观形成对比。尽管计算机的速度在增加,资源的小心使用将成为智能系统的特征。粗糙地说,世界是一个非常大的问题实例!人工智能中的工作有助于解释为什么NP完全问题的某些实例是艰难的,而另一些是容易的( Cheeseman等,1991)。
除逻辑和计算之外,数学对人工智能的第三大贡献是概率( probability)理论。意大Gerolamo Cardano(1501-1576)首先制定了概率的思想,按照赌博事件的可能结果来描述它。1654年,布雷西·帕斯卡( Blaise pascal,1623-1662),在一封致彼埃尔·费尔马( Pierre fermat,1601-1665)的信件中指出如何预测一场未完成的赌博游戏的未来并对赌徒指定平均的收益。概率很快成为所有定量科学的无价之宝,以帮助对付不确定的测量和不完备的理论。詹姆斯·贝努利( James Bernoulli,1654-1705)、彼埃尔·拉普拉斯( Pierre Laplace,1749-1827)和其他人推进了该理论并引入了新的统计方法。托马斯·贝叶斯( Thomas Bayes,1702-1761)提出了根据新证据更新概率的规则。贝叶斯的规则构成了人工智能系统中大多数用于不确定推理的现代方法的基础。
3. 经济学
我们应该如何决策以便收益最大?
当其他人不合作时我们应该如何做到这样?
当收益遥遥无期时我们应该如何做到这样?
经济学作为科学始于1776年,那时苏格兰哲学家亚当·史密斯( Adam Smith,1723—1790)出版了《国民财富的性质和原因的研究》(An Inquiry into theNature and Causes of the Wealth of Nations)。虽然古希腊人和其他人也对经济学思想做出了贡献,但是史密斯是第一个把它当作科学来对待的人,他认为经济组织由试图最大化他们自己的经济福利的若干个体 Agent组成,虽然多数人以为经济是关于金钱的学问,但是经济学家会说他们实际上在研究人们如何做出能导致更喜欢的结果的选择。当麦当劳为一美元提供一个汉堡包时,它们在断言:它们更喜欢美元并希望顾客更喜欢汉堡包。对”更喜欢的结果”或效用(utility) 的数学处理首先被 Leon Walras(发音为” alrasse”)(1834-1910)形式化,并被弗兰克拉姆齐( Frank Ramsey,1931)改进,再后来被约翰·冯·诺依曼( John von N)和奥斯卡·摩根施特恩( Oskar Morgenstern)在他们的著作《博弈论与经济行为》(The Theory of Games and Economic Behavior)(1944)中进一步改进。
决策理论( Decision theory)把概率理论和效用理论结合起来,为在不确定情况下即,在概率描述能适当捕获决策制定者的环境的情况下,做出(经济的或其他的)决策提供了一个形式化且完整的框架。这对”宏观”经济是合适的,其中每个 Agent不必注意其他作为个体的 Agent的行动。而对”微观”经济,情况更像博弈游戏:一位玩家的行动可能显著地(正面或负面)影响另一位玩家的效用。冯·诺依曼和 Morgenstern对博弈论( game theory)(参见Luce和 Raiffa,1957)的发展包括以下惊人的结果,即对某些博弈游戏,一个理性的 Agent应该采用(至少看来好像是)随机化的政策。不像决策理论,博弈论并不为选择行动提供清晰的规定。
在很大程度上,经济学家不会处理上面列出的第三个问题,即,当行动的收益不是即刻的反而是由几个依次采取的行动来产生时如何做出理性的决策。该主题在运筹学(operations research)领域被研究,运筹学出现于第二次世界大战期间,源自英国为优化雷达设置所取得的成就,后来在复杂管理决策中又找到了非军事应用。理查德·贝尔曼(Richard Bellman,1957)的工作形式化了一类称为马尔可夫决策过程(Markov decision processes)的连续决策问题。
经济学和运筹学中的工作为我们的理性 Agent概念贡献很多,然而多年来人工智能研究一直沿着完全分离的路线向前发展。一个原因是做出理性决策的显著复杂性。先驱的人工智能研究者赫伯特·西蒙( Herbert Simon,1916-2001)因其早期的工作在1978年获得经济学诺贝尔奖,其工作指出基于满意度( satisficing)的模型—做出”足够好”的决策而不是费力地计算最优决策给出了真实人类行为的一个更好的描述( Simon,1947)。自从20世纪90年代以来,一直存在对决策理论技术用于 Agent系统的兴趣的复兴( Wellman,1995)。
4. 神经科学
大脑如何处理信息?
神经科学( Neuroscience)研究的是神经系统,特别是大脑。虽然大脑使思考成为可能的精确方式仍是一个重大的科学之谜,但是它确实使思考成为可能的事实已被了解达数千年。因为有证据表明重击头部会导致精神缺陷。人类大脑以某种方式有所不同也已被知道很久了:大约公元前335年,亚里士多德写道:”在所有动物中,相对其身材来说人类具有最大的大脑。”然而,直到18世纪中叶大脑仍未被广泛地确认为意识的场所。在此之前候选的位置包括心脏和脾脏。
1861年,保罗·布鲁卡( Paul Broca,1824-1880)对大脑损伤病人中失语症(言语缺陷)的研究说明存在负责特定认知功能的局部化大脑区域。特别地,他指出言语生成被局部化到现在称为布鲁卡区2的大脑左半球的一部分。到那时,已经知道大脑由神经细胞或神经元( neurons)组成,然而直到1873年 Camillo Golgi(1843-1926)开发出一种染色技术使人们能够观察大脑中的单个神经元(参见图1.1),人们才知道这个事实。该技术被SantiagoRamon y Ca/a(1852-1934)用在其对大脑神经元结构的开创性研究中。Nicolas Rashevsky(1936,1938)率先用数学模型来研究神经系统。
我们现在有一些数据涉及大脑区域与身体器官之间的映射,这些大脑区域控制对应的器官或者从对应的器官接收感觉的输入。数周内这样的映射能被彻底改变,并且某些动物似乎具有多重映射。此外,我们尚未完全了解当一个区域受损时其他区域会如何接管其功能。几乎没有理论涉及如何存储单独的记忆。
1929年,随着 Hans Berger发明了脑波计(EEG),便开始测量无损伤的大脑活动。近来开发的功能性磁共振成像(mR)( Ogawa等,1990; Cabeza和 Nyberg,2001)正为神经科学家们提供大脑活动的空前细致的图像,这使按有趣的方式与正在进行的认知过程相对应的测量成为可能。这些测量由于在神经元活动的单细胞纪录方面的进步而得到加强。单独的神经元可用电学的、化学的、甚至光学的方式来刺激(Han和 Boyden,2007),从而允许映射神经元的输入输出关系。尽管这些进步,我们仍然远离理解认知过程实际上是如何工作的。
真正惊奇的结论是简单细胞的聚集能够产生思想、行动和意识,或者按John Searle(1992)简练的言语就是大脑产生精神。唯一实际存在的可供选择的理论是神秘主义:精神运转在某个神秘的领域,该领域超出了自然科学的范围。
人脑与数字计算机多少有些不同的性能。人脑用甚至比高端个人计算机更多的存储与相互连接弥补了这方面的不足。然而,最大的超级计算机具有类似于人脑的容量(可是,应该注意人脑似乎并不同时使用其所有神经元)。未来主义者充分利用这些数字,指出正接近一个奇异点( singularity),在该点计算机达到一个超人的性能级( Vinge,1993: Kurzweil,2005),但是原始比较并非特别有益的。即使使用一台具有几乎无限容量的计算机,我们仍然不知道如何实现人脑级的智能。
5. 心理学
人类和动物如何思考与行动
科学的心理学的起源通常追溯到德国物理学家 Hermann von Helmholtz(1821-1894)和他的学生 Wilhelm Wundt(1832-1920)的工作。 Helmholtz应用科学方法来研究人类的视觉,他的《生理光学手册》( Handbook of Physiological Optics)甚至现在都被描述为”关于人类视觉的物理和生理的唯一最重要的论著”( Nalwa,199,第15页)1879年,Wundt 在莱比锡大学开放了第一个实验心理学实验室。 Wundt主张仔细控制的实验,其中他的研究者们在内省他们的思维过程时要执行知觉的或联想的任务。虽然仔细的控制使心理学朝成为一门科学走了一大段路,但是数据的主观性使实验者经常驳斥他或她自己的理论显得不大可能。另一方面,正如H.S. Jennings(1906)在其有影响的著作《低等有机体的行为》( Behavior of the Lower Organisms)中所描述的,研究动物行为的生物学家们缺乏内省数据并培养出一种客观的方法学。对人类应用这种观点, John Watson(1878-1958)领导的行为主义( behaviorism)运动,以内省不能提供可靠证据为理由拒绝任何涉及精神过程的理论。行为主义者坚持只研究给予动物的感知(或刺激)及其导致的行动(或反应)的客观度量。行为主义发现了很多关于老鼠和鸽子的事实,但成功理解人类的情况较少。
认知心理学( Cognitive psychology)把大脑看作一个信息处理装置,至少可以追溯到威廉·詹姆斯( William James,1842-1910)的工作。 Helmho也坚持感知涉及一种无意识逻辑推理形式。虽然在美国认知观点基本上被行为主义遮掩了,但在由FredericBartlett(1886-1969)领导的剑桥应用心理学小组,认知建模还能兴旺。由 Bartlett的学生和后继者 Kenneth Craik(1943)发表的《解释的本质》( The Nature of Explanation),有力地恢复了像信念和目标那样的”心理”术语的合法性,认为它们正如使用压力和温度来谈论气体一样科学,尽管气体由没有压力和温度的分子组成。Cmk明确说明了基于知识的Agent的三个关键步骤:(1)刺激必须翻译成内部表示,(2)认知过程处理该表示以获得新的内部表示,并且(3)这些表示反过来重新翻译回行动。他清晰地解释了为什么这是Agent的一个好的设计:
如果生物体包含外部现实及其头脑中它自身可能行动的一个”小规模模型”那么它就能试验各种可采用的方法,推断出哪个是其中最好的方法,在未来状况出现前作出反应,在对付现在和未来时利用过去事件的知识,并在各方面对它面临的紧急情况按更完整的、更安全的、更充分的方式作出反应( Craik,1943)。
1945年Caik死于自行车事故后,他的工作由 Donald Broadbent继续推进。后者的著作《知觉与传播》( Perception and Communication)(1958)是把心理现象建模成信息处理的最早著作之同时,在美国,计算机建模的发展导致认知科学( cognitive science)领域的创建。该领域可以说始于1956年9月麻省理工学院(MT)的一个研讨会(我们将看到这正好是AI本身”诞生”的那次会议之后的两个月)。在这次研讨会上,乔治·米勒( George Miller)介绍了”魔术数字7”( The Magic Number Seven),诺姆·乔姆斯基(Noam Chomsky)介绍了”语言的三种模型”( Three Models of language),而阿兰·纽厄尔(Allen Newell)和赫伯特·西蒙( Herbert Simon)介绍了”逻辑理论机”( The Logic Theory Machine)这三篇有影响的论文指出计算机模型可以如何分别用于处理记忆、语言和逻辑思维的心理学。
目前心理学家中常见的(虽然远离普遍的)观点是”认知理论应该像计算机程序”( Anderson,1980);即,认知理论应该描述详细的信息处理机制,靠这个机制可以实现某种认知功能。
6. 计算机工程
我们如何才能建造高效的计算机?
为了人工智能获得成功,我们需要两件东西:智能和人工制品。计算机已是精选的人工制品。现代数字电子计算机被第二次世界大战中参战的三个国家的科学家独立地和几乎同时地发明出来。第一台可运转的计算机是电动机械的 Heath Robinson,它由阿兰·图灵的研究组建造于1940年,其唯一用途是解密德国人的消息。1943年,同一个研究组开发了 Colossus,基于真空电子管的强大的通用机器2。第一台可运转的可编程计算机是Z-3,它由 Konrad Zuse于1941年在德国发明。Zuse还发明了浮点数和第一种高级编程语言Plankalkul第一台电子计算机,ABC,在1940年到1942年之间由 John Atanasoff和他的学生 Clifford Berry在爱荷华州立大学装配成功。 Atanasoff的研究获得较少的支持或认可;正是在宾夕法尼亚大学作为一个秘密军事项目的一部分由一个包括 John Mauchly和John Eckert的研究组开发的ENAC被证实是现代计算机最有影响的先驱。
从那时起,每代计算机硬件都带来速度和容量的增加以及价格的减少。直到2005年左右,计算机的性能大约每18个月翻一番,那时候能量消散问题致使制造商们开始增加CPU核的数目而不是时钟速度。当前的预期是未来的能力增加将来自大规模并行与人脑的性质不可思议的一致。
当然,在电子计算机之前还有一些计算装置。最早的自动机器追溯到17世纪,在1节讨论过。第一台可编程的机器是1805年 Joseph Marie Jacquard(1752-1834)设二计的一台织布机,它使用穿孔卡片来存储适合于要编织图案的指令。在19世纪中叶,查尔斯巴贝奇( Charles Babbage192-1871)设计了两台机器,但都没有做完:想用差分机来为工程与科学项目计算数学用表。该机器最终于191年建成,并在伦敦科学博物馆显示出能工作( Swade,200. Babbage的分析机更加雄心勃勃:它包含可寻址的存储器,存储的程序以及条件跳转,并是第一台能够完成通用计算的人工制品, Babbage的同事Ada lovel诗人拜伦( Byron)爵士的女儿,可能是世界上第一位程序员(编程语言Ad就是以她的名字命名的)。她为未做完的分析机编写了程序,甚至推测机器可以下国际象棋或创作乐曲。
人工智能还欠了计算机科学的软件方面一笔债,后者提供了操作系统、编程语言和为编写现代程序(以及关于程序的文档)所需的工具。但是这也是债务已归还的一个领域人工智能中的工作开创的许多思想已想方设法反向进入主流计算机科学,包括分时、交互式解释器、使用窗口和鼠标的个人计算机、快速开发环境、链表数据类型、自动存储管理以及符号化、函数式、说明性和面向对象编程的关键概念。
7. 控制论
人工制品可以如何在其自身的控制下运转?
亚历山大的凯西比奥( Ktesibios of Alexandria,大约公元前250年)建造了第一台自我控制的机器:具有一个维持恒定流速的调节器的水钟。这项发明改变了人工制品能做什么的定义。以前,只有活的东西能够作为对环境中变化的反应来修改其行为。自我调节反馈控制系统的其他实例包括詹姆斯·瓦特( James Watt,1736-1819)创造的蒸汽机调压器和Cornelis Drebbel(1572-1633)发明的恒温器,后者还发明了潜水艇。稳定反馈系统的数学理论在19世纪得到了发展。
创造现在称为控制论( control theory)的中心人物是诺伯特·维纳(Norbert Wiener1894-1964)。维纳是一位卓越的数学家,在他对生物和机械控制系统及其与认知的关系产生兴趣之前,曾与伯特兰·罗素( Bertrand Russell)等人一起工作过。
像 Craik(他还用控制系统作为心理学模型)一样,维纳和他的同事Arturo Rosenblueth以及 Julian Bigelow挑战了行为主义者的正统学说( Rosenblueth等,1943)。他们认为有目的的行为是由试图最小化”误差”一当前状态与目标状态之间的差距一的调节机制引起的。20世纪40年代晚期,维纳和 Warren McCulloch、 Walter Pitts以及约翰·冯·诺依曼( John von Neumann)一起,组织了一系列有影响的会议,探索了新的关于认知的数学与计算模型。维纳的著作《控制论》( Cybernetics)(1948)变成了一本畅销书,并使公众认识到人工制造智能机器的可能性。同时,在英国,W. Ross Ashby( Ashby,1940)开创了类似的思想。 Ashby、 Alan Turing, Grey Walter和其他人一起为”那些在维纳的书发表以前就具有维纳的思想的人”形成了比俱乐部( Ratio Club), Ashby的《大脑设计》(Design for a Bain)(1948,1952)详述了他的思想:智能可通过使用包含恰当反馈回路以实现稳定适应行为的自动平衡( homeostatic)装置来创建。
现代控制论,特别是被称为随机优化控制的分支,其目标是设计能随时最大化目标函数( objective function)的系统。这与我们关于人工智能的观点大致一致:设计能最佳表现的系统。它们的始祖之间具有密切联系,但为什么人工智能与控制论是两个不同的领域呢?
答案存在于参与者熟悉的数学技术与包含在每个专业范围中的对应问题集之间的紧密耦中。微积分与矩阵代数是控制论的工具,它们鼓励可由固定的连续变量集来描述的系统然而创立人工智能的部分原因是当作逃避这些意识到了的局限的一种方法。逻辑推理与计算的工具允许人工智能研究者们考虑一些诸如语言、视觉和规划那样的问题,这些问题完全落在控制理论家的范围之外。
8. 语言学
语言与思维如何关联?
1957年,B.E.Sinr出版了《言语行为》( Verbal Behavior),由领域内最早的专家撰写的这本书为语言学习的行为主义方法给出了一个综合的、详细的解释。然而奇妙的是该书的一篇评论变得与该书本身一样著名,并且用于几乎消除了对行为主义的兴趣。这篇评论的作者就是语言学家诺姆·乔姆斯基( Noam Chomsky),那时他正好出版了一本关于他自己的理论的书,《句法结构》( Syntactic structures)。乔姆斯基指出行为主义的理论没有处理语言中的创造性的概念—它没有解释儿童怎么能理解和构造他或她以前从未听过的句子。乔姆斯基的理论—基于可追溯到印度语言学家帕尼尼( Panini,,大约公元前350年)的句法模型—能够解释这个现象,并且不像以前的理论,其理论足够形式化以致原则上可被编程实现。
现代语言学与人工智能在大约相同的时间”诞生”,并且一起长大,交叉于一个称为计算语言学( computational linguistics)或自然语言处理( natural language processing)的混合领域。很快证实了理解语言的问题要比1957年感觉的复杂得多。理解语言需要了解主题和语境,而不仅仅是了解句子的结构。这似乎是显然的,但是直到20世纪60年代它并未被广泛接受。知识表示( knowledge representation)(如何把知识翻译成计算机可用来推理的形式的研究)中的大量早期工作与语言联系在一起并从语言学的研究中获得信息,反过来语言学的研究又与数十年关于语言的哲学分析的工作联系在一起。