学:学生,教:教师,李:李晓榕
教:当前人工智能很火,李老师是怎么看的?
李:人工智能当前在不少国家很火,中国最甚,得到了国家极其高度的关注,在各国中最突出。首先可以肯定,几年内就会不断有大量新颖的科技产品问世、应用、推广、普及,改善生活,它们涉及人工智能的研发,在各自特定的方面都会有过人的能力,会取代很多人的工作,十分重要。这是大势所趋,任何怀疑和否定,都无法抗拒这一大势。比如我觉得,在不少国家,三四十年内,车辆都会是无人驾驶的,而且出于安全考虑,人开车是不负责任甚至违法的,就像今天不允许在大街上骑驴或赶马车一样。
教:但是,自动驾驶技术的关键和难点是环境感知,这里的环境感知主要靠的不是人工智能,而是估计、滤波与多传感器的信息融合,即利用多个传感器采集环境数据并加以综合处理,达到对环境的有效认识。
李:的确,智能特别是感知怎能离开多源信息处理?“智能”一般至少具有“有效获取并处理信息以达目的之能力”之意,所以,(尤其是当前基于数据培训的)人工智能与信息融合当然大有重叠,甚至认为前者包含后者。我想,你所质疑的是如下问题:
大量即将面世的科技新产品到底是不是人工智能产品?
不少这些产品其实主要靠的是信息技术、自动化技术等,人工智能未必是其主体、灵魂或关键,即便是号称人工智能短期内的最大成就——自动驾驶,也是如此,这很能说明问题。这些产品与以往科技产品的研发未必有多大本质不同,但研发者、厂商、媒体历来惯于给新产品贴上最风行最时髦的技术标签——当下就是人工智能。当然,可以辩解说,人工智能包括信息技术、自动化技术等几乎所有技术,因为智能需要它们。清楚这些后,如果你对这些产品不满(比如使你丢了工作),也不该把账都算到人工智能头上——这不只是人工智能的“罪过”。这个问题值得注意,但我更想讨论的是:
人工智能产品究竟是否真有“智能”?
这次人工智能大潮的兴起主要源于大数据深度学习。大家应该会同意,智能的一大体现是善于随机应变,适应新情况,因人因地因时因事制宜,胜任事先并不明确其内容的各种任务,因而难以事先培训。另一大体现是善于学习,能举一反三,而非举百反一。在此意义上,靠大数据培训的这种方法其实并不太“智”,它“举亿反一”,以量取胜,而非以智取胜。
学:我觉得我们应该更公平一些。我们说这些人工智能产品有智能,是指经过大数据深度学习之后的产品,而不是之前的,正像任何一个人都是人类多少万年遗传进化的结果,所以他的智能也是遗传进化的结果。比如我们可以说,一般来说,学习增强了能力,大数据深度学习使得这样一个产品脱胎换骨、升华成为智能了。
李:有道理,但不尽然。特定的培训可以明显增强特定的技能,而一般不是智力、智能、智慧,因为智能不只是特定的技能,还得相当“智”。比如,一个受过“题海战术”训练的人,求解相应题型之题的表现更好,难道他因此就比未经训练从而不太会解题的人更聪明更智能吗?更进一步,难道训练之后的他比之前的他明显更聪明吗?我们一般不会这么认为,一大原因恐怕是,我们知道他已经多次完成过这类任务(并且清楚完成的好坏),因而可以从中学习,更别说他受过针对这一任务的强化训练,纵然不聪明,肯定也相当会解相应题型之题了。这里有两个关键:①是否做过针对任务的适应性训练,②是否做过不少类似之事。一旦做过,用完成这种任务的好坏来判定其智能的高下,就该大打折扣。大数据深度学习的产物就是如此。
教:我觉得,靠大数据的这种学习,可以说是靠“蛮力”来取胜的,所以并没多少无可置疑的智能可言。
李:人的学习无需如此海量的事例,因为人会归纳,而机器不会。简单地说,深度学习就是深层人工神经网络模型针对特定任务的大数据函数拟合培训,其数学本质是数据拟合。学成后,给定输入时,输出结果就像插值结果。道理很简单:要能对付不简单的实际问题,数据驱动的“普适”模型不能太简单,而要避免这种复杂模型的过度拟合,就得用海量、丰富而完备的“大数据”来拟合,大数据深度学习其实是“海量培训”。这是保证这类题海战术有效可行的前提。没有大数据,要避免过拟合,模型至多只能得到低阶的近似规律,只有增大数据的量和丰富度,才能得到更高阶的近似规律。
教:其实没什么大不了的,我们不是总把使用模糊逻辑、神经网络的东西称为是“智能”的吗?它们其实又有什么真正的智能呢?何况我们说的是“人工”(artificial)的智能,也就是“人造的、貌似真而其实不真的”伪智能,因为artificial本来就有这种“假而不真”的含义。谈论的对象越珍贵,这种“假而不真”的含义就越突出,一个artificial宝石,就是一个假宝石,智能可比宝石珍贵多了。
李:我可没你这么负面。的确,“伪”字的原义是“人为”“非天然”。比如《荀子·性恶》的名言“人之性恶,其善者伪也”就是说:善是后天人为的。这是“性恶论”的滥觞。科技产品的“智能”,有多方面可说。①早先,工业界不少计及环境因素、由计算机控制的仪器仪表被冠以“智能仪器”“智能仪表”的美名,这也许可以如下辩护:计算能力是一种智能。它们日渐普及、习以为常之后,也和计算一样都不再被认为是智能的,前缀“智能”随之消失。一些用到逻辑演算、演绎推理的产品名称也都经历过类似的变化过程。②纵观人工智能研究历史,一再有人声称已有科研成果,比如机器人,“能思考”(machines who think)“有心智”(machine with a mind)“是智能的”。③“智能”(intelligent, intelligence)一词在科技界早已泛滥,有些人出于自夸推销标榜等心理,给用了有赖于模糊逻辑、神经网络、进化算法、专家系统、机器学习等方法的东西贴金,美其名曰“智能的”,无论它们其实有多“傻”。这样大量使用,以致理直气壮、心安理得,最终约定俗成。照此风气,今后出现比这些“智能”技术更强大的东西,恐怕只能说是“奇妙的、神奇的、魔法般的”乃至“超自然的、神圣的”(magical, miraculous, wonderful, supernatural, holy)。
话说回来,说到底就看我们心中的“智能”究竟是什么。比如,科学通才、人工智能的开山大师之一、符号学派的教主西蒙(Herbert Simon)早在1956年就宣布,纽厄尔(Allen Newell)和他刚开发的史上首个人工智能程序——“逻辑理论家”(Logic Theorist)能思考、是智能的,因为它能在真值函数的命题逻辑系统中自动构造形式证明,而这有赖于智能。其潜台词是:能完成公认有赖于智能的任务,就是智能的。这种功能主义的理据被广泛接受,大家恐怕也觉得言之成理吧。然而,按此理,计算机自诞生之日起不仅是智能的,因为计算需要智能才能完成,而且还有超级智能,因为其计算能力超过人。无独有偶,另一位人工智能的开创者麦卡锡(John McCarthy)说:即便简单如恒温器也可以说有信念(它有三种信念:太热、太冷、刚好),而有信念看来是大多数能展现问题求解能力机器的特点。恒温器能自动调节温度,若无上述信念,如何办到?可见,他所说的信念根本不必有心理状态来支撑。这些观点都十分偏激,有违常人的理解。
学:我想,西蒙大概是指他们的程序“含有智能的成分”,因为它确实含有智能的成分。
李:有智能的成分,怎能就说“是智能的”呢?否则也可以说“人人都是铁人”,因为人体内都含有铁元素。西蒙的确是指“是智能的”而非“有智能成分”,因为他当时就说:“我们发明了具备抽象思考能力的程序……解释了合成的物质如何能够拥有人类的心智”,“现今世界上已经存在能自己思考、学习、创新的机器”。他甚至预言:“十年之内,心理学理论将以计算机程序的形式表现出来”。当然,公平地说,我们这是反观历史,自然看得清楚,有事后诸葛亮的味道。
学:“智能”到底是什么意思?
李:英语中的intelligence(智能)一词最核心的内涵是指理解力。最权威的《牛津英语大辞典》对intelligence的主要释义是1:①理解力,智力;②可见出品质高下的理解、特指上乘理解,敏锐,精明(中古英语);③心智上理解某物,理解、知道、懂得、明了、领悟(某物)。Intelligible也主要指“可理解的”。英文understand(理解)一词由under-和stand组成,指“立于其所处”,即站在对方的立场,进入其心理空间,分享其体验、感受、情绪和其他心理活动,与之形成一种同一和共情,乃至成为其部分,而不只是外部解释、分析等仅限于理性的内容。
______________________________
1. Oxford English Dictionary, Intelligence: 1. The faculty of understanding; intellect. 2. Understanding as a quality admitting of degree; spec. superior understanding; quickness of mental apprehension, sagacity ME. 3. The action or fact of mentally apprehending something; understanding, knowledge, comprehension (of something).
学:学生,教:教师,李:李晓榕
教:那“智能”有没有一个精确的定义?李老师的定义是什么?离开了定义,好像不太好讨论。
李:一再有人要我精确定义我所谈论的对象,我都谢绝了。今天深入地说说此事。只要清楚谈论对象是什么,各人的理解不妨略有出入。英国前首相鲍尔温告诫说:不要热心于下定义……“杀之者文字,活之者精神”。凡事都想下严格精确的定义,是本质主义还原论带给现代人的通病,我们都是患者。科学知识越多、训练越有素,病往往就越重。下面谈几个方面。
①精确与单纯为伍、与复杂为敌:硬科学以数学和量化为基础,其概念都很单纯简单,便于精确定义。所以精确定义在硬科学中居功甚伟,硕果累累。而生活和人文社会等众多学科中的大量概念都复杂得多,都有丰富多面、界线不清、不确定乃至矛盾的内涵,要求界线明确的精确定义都会是强扭之瓜,弊大于利。越常用的概念越是如此。心智、智能、意识、生命、物质、精神、科学、技术、社会、文化、复杂性等都是这种不深究则清楚,而本质主义还原论地一深究就糊涂的概念。这些内蕴丰富、核心明确而边界模糊的概念给我们简要地谈论很多复杂事物极大便利。这类概念不宜精确定义。以人的身体为例,我身上的细胞始终在不断更新,按还原主义精确定义的“我”对应的是哪个细胞集合整体?我之为我离不开我身上(比如肠胃中)的细菌。精确定义的“我”包括这些细菌吗?它们对我的身体有重要影响(比如菌群失调)。一方面,不包括它们,我就不成其为我,甚至无法存活;另一方面,我死后这些细菌并不会马上全都死去,而会进一步工作,腐烂、降解我的尸体。再以颜色为例。一个物体的颜色其实并非其本身的性质,而是它对各种波长光的折射百分比经视觉系统的处理结果。不同人的视觉系统大同小异,因而所见颜色也大体相同。所以,不存在独立于人之外客观的精确“红色”,各人视觉的差异,也使完全精确定义“红色”缺乏基础。就连颜色这么简单的物理概念都无法完全精确定义,更别说智能等更复杂得多的概念,它们高度依赖于人与外界的交互。谬误的一大根源是把原本不错的东西用于其适用范围之外。精确定义在自然科学、工程科学的硬科学分支1中屡试不爽,把这种成功简单移用到其他地方,就是这种谬误。我们如此向往精确明了,以至于在它不存在不适用之处仍坚持这种理想。这是一种不该有的执念。正因如此,社会科学、人文学科等学术研究充斥着这种概念的定义之争,且长期持续不断,不少学者难以自拔。概念越重要,争论就越激烈。智力智能的概念也不例外,比如,如何定义智力智能是心理学领域争论最激烈的一个问题。
学:李老师说得很有道理,但是,我们总还是习惯于认为,一个事物应该有也只能有一个本质,否则我们对它的把握就不够彻底、不够到位。
李:的确如此,这就是本质主义的信念,我们都被洗脑了。这正好是我想说的第二点。
②精确定义的本质主义之根:一事物为什么只能有一个单元本质,而不能有多元本质?在多元“本质”中为什么只能有一个是始终最本质最重要的?客观世界为什么一定会满足人的这种主观信念?我们又为什么要自缚手脚,要求我们的观念世界也满足它?如果问题不复杂,这种自我约束的确有助于抓住本质、简化问题,从而奏效。尽管如此,如果不事事都这样自缚手脚,我们的观念不是更自由、更强大、更有效、更能对付更复杂之事吗?以“人”的定义为例。历史上有众多定义,比如古希腊大哲柏拉图把人定义为“双足无毛动物”2,我们早先取笑过。后来普遍把会制造工具作为人的定义。然而,半个多世纪前,人类学家在非洲发现,那里的黑猩猩也会制造工具。其实,何必非得认定人在某一方面不同于其他动物呢?为什么不能承认人有多元本质,在其交集上(即多元本质交汇之处)而未必是某一元上区别于其他动物?再举一例。什么是“我”,也有各种定义和理论,比如认为我是由我的身体决定的身体论、由我的大脑决定的大脑论、由我的脑中数据信息决定的数据论、由过去的我连续变化成今天的我而决定的连续论。它们都各执一偏,强调多元本质中的某一元。其实,何必非得限于某一元?为什么不能承认“我”有多元本质,它们共同组成了“我”?说得更透彻一点,如果要坚持认定“我”的本质只有一个,那么可以说,在人类现有的知识体系中它可能有“多元”体现或含义,因为该体系的任何一元都不能把握这一本质,就像微观量子不能被宏观粒子或波的概念把握。凭什么坚信一事物的本质非得限于现有知识的某一元呢?
③我认为,精确与意义、理解“不共戴天”:完全精确必定完全确定、毫无不确定性;而信息植根于不确定性,信息量反映不确定度,毫无不确定性则不会有任何信息;没有信息则不会有意义和价值,理解也无从谈起。所以,人类的真正语义理解、对人类真有“意义”的东西都或多或少是模糊含糊、不清晰分明确定的,无法完全精确,只有不含真正理解或意义的东西,比如演绎逻辑、计算算法、形式句法等纯粹形式上的东西,才能是完全精确的。正因坚信数学的完全精确性和逻辑性,数学形式主义的旗手、大数学家希尔伯特才会认定数学其实只是一个形式系统,大哲罗素才会有名言3:数学就是这种科学,在其中我们既不知道说的是什么,也不知道所说的是否真实。当然,对此我不苟同,因为数学并非全无“意义”,也无法完全彻底精确(比如无法彻底消除悖论),现代数学史上形式主义和逻辑化运动的最终失败,根源也在于此。也正是因为坚信精确的数学、物理学在科学和全部学问中的基础地位,分析哲学尤其是逻辑实证主义才特别强调概念的明确性和推理的严密性,才特别钟爱和依赖于严格精确的定义,特别重视分析还原方法。可见,就像信息有赖于不确定(程度的可能改变),现实中的“意义”有赖于不精确性,完全精确了也就不再有现实意义了。更进一步,意义和价值越大越丰富,往往就越难精确化清晰化,精确度清晰度也越低。所以,模糊理论之父扎德说4:随着复杂度的增加,精确之言变得没有意义,有意义之言变得不精确。
④精确和逻辑亲如兄弟,相辅相成:要由精确前提得到精确结论,符合形式逻辑是充分且必要的;严格符合逻辑的东西必然精确。实验心理学业已证实,人非机器,其智能并不擅长于对付精确,大多数人不擅长逻辑等精确思维。所以,逻辑等精确思维和推理工具在观念世界中既不十分便利,又大有局限性。比如,想靠它们来彻底阐明人造概念很可能反而造成误解。
更有甚者,在政治、生活等众多方面,都不该一味追求精确。比如,奥威尔的名著《一九八四》早已预言,要求使用相对更精确少歧义(但非绝对精确)语言的“新语言”(Newspeak)有严重恶果,它通往地狱,限制自由和自我表达,缺乏人之为人的乐趣。在硬科学之外,精确往往是奢望或者弊大于利,这种风气会有严重后果。像一个不谙逻辑的美妙少女一样,生活之所以美好而使我们乐在其中,正因其丰富朦胧、流变多样、缺乏逻辑和确定性,假如完全精确、尊崇逻辑,没有不确定性,生活又有什么意义、价值和乐趣?如果不信,不妨尝试在你的生命中只限于用精确的数理逻辑等形式语言,而不许用不精确的日常自然语言,看看是否寸步难行,是否退化为机器了?这样,语言会变得完全形式化而没有语义(现实意义)。更进一步,诗歌、文学、艺术之所以美妙,正在其模糊空灵,如梦似影,游离不定,其意在虚与实之间,可感觉而难触摸,可知而难解,可臆度而无达诂,可体味而难描摹,可意会而难言传。
⑤具体说到精确和智能的关系,我认为,对付简单精确无需真正的智能特别是高级智能,亦非智能所长,对付复杂因而不精确才需要智能,才是智能所长,高级智能面对高度不精确也必能游刃有余。而且,如果执着于精确,那么不少人类社会公认的价值观念在深层上是矛盾的,比如,中国传统社会的“忠孝不可两全”,现代西方社会的“自由”和“平等”以及“理性”的彼此冲突。可见,研究对付不精确的东西有助于提升智力水平。这一点与上述“精确与复杂互斥”、“精确与意义互斥”两点密切相关,因为智能在应对高度复杂而有意义之事时更显其“智”其“能”。从另一个方面来说,硬科学把相对简单之事化归为较为精确之形,成为智力平凡的普罗大众都能理解的“下里巴人”,便于机械式程序式处理,而不是只有智者才能欣赏的“阳春白雪”,但智者并不需要这种化归也能把握事物,何况化归复杂之事难免各执一偏。
______________________________
1.其实,就连生物学这样的自然科学,也不能处处奢求精确。比如其主要支柱之一——进化论就不能完全精确:何谓适应?何谓进化?可以争论不休。
2. Plato, Politics: Man is a biped without feathers.
3. Bertrand Russell: [Mathematics is] that science in which we neither know what we are talking about, nor whether what we say is true.
4. Lotfi A. Zadeh: As complexity rises, precise statements lose meaning and meaningful statements lose precision.
本文来自李晓榕科学网博客:
链接地址:http://blog.sciencenet.cn/blog-687793-1278964.html