最近几年--很难说具体是哪一年,人工智能忽然再次大热。半个多世纪以来,人工智能经历了几次大的起伏,这一次大热,意蕴完全不同。
与这一波人工智能热潮相比,我以为基本思想已发生重大变化,或许可以概括为两年:一点是此前的人工智能致力于“打造超越个体智能的机器”,而这一波人工智能的基本思想则是“具身性”,即探索连接,交互,复杂网络环境下机器智能的生长,人与机器的融合,以及人机生态的演进;另一点则是,此前的人工智能致力于发现“描述智能的牛顿定律”,今天的人工智能则首先致力于理解“人与机器,机器与环境的交互,究竟发生了什么?”,重新理解智能机器与人,机器与机器的认知和行为之间错综复杂的关系。
人工智能的终极科学目标是实现人类对自己的科学理解。
人工智能是一个非常庞杂的学科,甚至已经分裂为很多子学科。
制造出能够像人类一样思考的机器是科学家们最伟大的梦想之一。用智慧的大脑解读智慧必将成为科学发展的终极。而验证这种解读的最有效手段,莫过于再造一个智慧大脑--人工智能。
异常强大,能力非凡。
然而,现实中的人工智能却与这些荧幕上的机器人相差甚远,但它们的确已经在我们身边。搜索发动机,邮件过滤器,智能语音助手Siri,二维码扫描仪,游戏中的NPC(非玩家扮演角色)都是近60年来人工智能技术实用化的产物。这些人工智能都是一个个单一功能的“裸”程序,没有坚硬的,灵活的躯壳,更没有想象中那么善解人意,甚至不是一个完整的个体。为什么想象与现实存在那么大的差距?这是因为,真正的人工智能的探索之路充满了波折与不确定。
历史上,研究人工智能就像是在坐过山车,忽上忽下。梦想的肥皂泡被冰冷的科学事实戳破,科学家们不得不一次次重新回到梦的起点。作为一个独立的学科,人工智能的发展非常奇葩。它不像其他学科那样从分散走向统一,而是从1956年创立以来就不断地分裂,形成了一系列大大小小的子领域。也许人工智能注定就是大杂烩,也许统一的时刻还未到来。然而,人们对人工智能的梦想却是永远不会磨灭的。
正如我们前面提到的,这三个学派大致是从软件,硬件和身体这三个角度来仿真和理解智能的。但是,这仅仅是一个粗糙的比喻。事实上,三大学派之间还存在着很多微妙的差异和联系。
首先,符号学派的思想和观点直接继承自图灵,他们是直接从功能的角度来理解智能的。他们把智能理解为一个黑箱,只关心这个黑箱的输入和输出,而不关心黑箱的内部结构。符号学派假设知识是先验地存储于黑箱之中的,因此,它很擅长解决利用现用的知识做比较复杂的推理,规划,逻辑运算和判断等问题。
连接学派则显然要把智能系统的黑箱打开,从结构的角度来仿真智能系统的运作,而不单单重现功能。这样,连接学派看待智能会比符号学派更加底层。这样做的好处是可以很好地解决机器学习的问题,并自动获取知识;但是弱点是对于知识的表述是隐含而晦涩的,因为所有学习到的知识都变成了连接权重的数值。我们若要读出神经网络中存储的知识,就必须要让这个网络运作起来,而无法直接从模型中读出。连接学派擅长解决模式识别,聚类,联想等非结构化的问题,但却很难解决高层次的智能问题(如机器定理证明)。
行为学派则研究更低级的智能行为,它更擅长仿真身体的运作机制,而不是脑。同时,行为学派非常强调进化的作用,他们认为,人类的智慧也理应是从漫长的进化过程中逐渐演变而来的。行为学派擅长解决适应性,学习,快速行为反应等问题,也可以解决一定的识别,聚类,联想等问题,但在高级智能行为(如问题求解,逻辑运算)上则相形见绌。
有意思的是,连接学派和行为学派似乎更加接近,因为它们都相信智能是自下而上涌现出来的,而非自上而下的设计。但麻烦在于,怎么涌现?涌现的机制是什么?这些深层次问题无法在两大学派内部解决,而必须求助于复杂系统科学。
三大学派分别从高中低三个层次来仿真智能,但现实中的智能系统显然是一个完整的整体。我们应如何调节,综合这三个学派的观点呢?这是一个未解决的开放问题,而且似乎很难在短时间内解决。主要的原因在于,无论是在指导思想还是计算机模型等方面,三大学派都存在着太大的差异。
于是,就这样磕磕碰碰地,人工智能走入了新的世纪。到了2000年前后,人工智能的发展非但没有解决问题,反而引入了一个又一个新的问题,这些问题似乎变得越来越难以回答,而且所牵扯的理论也越来越深。于是一心向“应用”看齐。争什么争呀,实践是检验真理的唯一标准,无论是符号,连接,行为,能够解决实际问题的鸟就是好鸟。
在这样一种大背景下,人工智能开始进一步分化很多原本隶属于人工智能的领域逐渐独立成为面向具体应用的新兴学科,我们简单罗列如下:
每一个领域都包含大量具体的技术和专业知识以及特殊的应用背景,不同分支之间也几乎是老死不相往来,大一统的人工智能之梦仿佛破灭了。于是,计算机视觉专家甚至不愿意承认自己搞的叫人工智能,因为它们认为,人工智能已经成为了一个仅仅代表传统的符号学派观点的专有名词,大一统的人工智能概念没有任何意义,也没有存在的必要。这就是人工智能进入2000年之后的状况。
但是,世界总是那么奇妙,少数派总是存在的。当人工智能正面临着土崩瓦解的窘境时,任然有少数科学家正在逆流而动,试图重新构建统一的模式。
他们的特立独行起源于对概率这个有着几百年历史的数学概念的重新认识,并利用这种认识来统一人工智能的各个方面,包括学习,知识表示,推理以及决策。
与传统的方法不同,贝叶斯将事件的概率视为一种主观的信念,而不是传统意义上的事件发生的频率。因此,概率是一种主观的测度,而非客观的度量。故而,人们也将贝叶斯对概率的看法称为主观概率学派--这一观点更加明确地凸显出贝叶斯概率与传统概率统计的区别。
贝叶斯学派的核心就是著名的贝叶斯公式,它表达了智能主体如何根据搜集到的信息改变对外在事物的看法。因此,贝叶斯公式概括了人们的学习过程。以贝叶斯公式为基础,人们发展出了一整套称为贝叶斯网络的方法。在这个网络上,研究者可以展开对学习,知识表示和推理的各种人工智能的研究。随着大数据时代的来临,贝叶斯方法所需要的数据也是唾手可得,这使得贝叶斯网络成为了人们关注的焦点。
在人工智能中,我们应该始终保持清醒的头脑,将智能看作一个整体,而不是若干分离的子系统。
就这样,在争论声中,人工智能走进了21世纪的第二个十年,似乎一切都没有改变。但是,几件事情悄悄地发生了,它们重新燃起了人们对于人工智能之梦的渴望。
21世纪的第二个十年,如果要评选出最惹人注目的人工智能研究,那么一定能够要树深度学习了。
事实上,深度学习仍然是一种神经网络模型,只不过这种神经网络具备了更多层次的隐含层节点,同时配备了更先进的学习技术。
然而,当我们将超大规模的训练数据喂给深度学习模型的时候,这些具备深层次结构的神经网络仿佛摇身一变,成为了拥有感知和学习能力的大脑,表现出了远远好于传统神经网络的学习和泛化的能力。
深度学习实际上只不过是对大脑的一种仿真。
也许,这样巧妙的人机结合才是人工智能发展的新方向之一。因为一个完全脱离人类的人工智能程序对于我们没有任何独立存在的意义,所以人工智能必然会面临人机交互的问题。而随着互联网的兴起,任何计算机交互的方式会更加便捷而多样化。因此,这为传统的人工智能问题提供了全新的解决途径。
然而,读者也许会质疑,这种掺和了人类智能的系统还能叫做纯粹的人工智能吗?这种质疑事实上有一个隐含的前提,就是人工智能是一个独立运作的系统,它与人类环境应相互隔离。但当我们考虑人类智能的时候就会发现,任何智能系统都不能与环境绝对隔离,它只有在开放的环境下才能表现出智能。同样的道理,人工智能也必须向人类开放,于是引入人的作用也变成了一种很自然的事情。