当我们说“人工智能”这个词时,我们其实是在谈论一个非常庞杂的领域。自1956年达特茅斯会议正式提出“人工智能”的概念以来,这个领域已经产生了众多的分支,取得了非常多的成就。正因如此,人工智能领域中的众多概念错综复杂,即使对于人工智能专业的学生,理清它们之间的关系也并非易事。作为一名初学者,为了理清头绪,笔者在本文中对人工智能的一些常见概念进行初步整理和辨析。
一、研究理念:人工智能三大学派
人工智能名下的研究领域颇多,例如知识表达与推理、不确定性推理、认知智能、机器学习等。从研究理念的角度来看,人工智能有着三大学派:符号主义、行为主义和连接主义。
符号主义强调通过符号来表达知识并进行逻辑推理,是早期人工智能研究的主要理念,其主攻的领域是知识表达与推理,典型成就是专家系统。专家系统自20世纪80年代起开始繁荣,成为第一代人工智能的代表,其发展虽然在90年代后经历挫折,但以它为基础的知识图谱、规则引擎等在今天仍然有广泛应用。
行为主义并不关注机器内部的思维如何运行。相反,它的目标是使机器与外界的交互行为具备智能的特点。
连接主义的主要代表是人工神经网络。如果说符号主义赋予了机器以理性,那么连接主义便赋予了机器以感性。与符号主义预先用符号编写知识不同,连接主义不是提前把知识灌输给机器,而是先搭建好神经网络,然后让机器自己去学习。这一流派的研究在早期较为活跃,但是在20世纪70年代的人工智能寒冬中一度停滞。直到1986年,反向传播算法的正式提出为训练神经网络提供了有效的方法,促进了该流派的复苏。自此,人工神经网络迅速发展,成为近几十年人工智能研究的焦点,被誉为第二代人工智能的代表。
时至今日,在三大流派之中,符号主义和连接主义取得了更为显著的成果。相比之下,行为主义的应用领域较为有限。若要对前两者的研究领域进行粗略的划分,可以说符号主义主攻知识表达与推理,而连接主义主攻机器学习。
二、研究领域:机器学习与深度学习?
近十年来,谈及人工智能,机器学习和深度学习几乎是不可分割的话题。然而,对于外行人来说,了解它们之间的内在关系并不容易。
在上节中我们提到,人工智能名下有知识表达与推理、不确定性推理、认知智能、机器学习等研究领域。其中,机器学习的目标是使计算机系统能够从经验中学习并自动改进性能,而无需明确地进行编程。随着基于连接主义的人工神经网络的迅速发展,机器学习的研究也取得了长足进展,近十年来成为人工智能的代名词也就不足为奇。
但是,需要澄清的是:第一,机器学习只是人工智能众多领域中的一个分支;第二,并非所有的机器学习都需要使用人工神经网络;第三,作为蓬勃发展的一个领域,机器学习又可以分为众多的子领域,例如分类、回归、聚类、降维、异常检测、机器博弈等。
为了说明深度学习与机器学习的关系,不妨先解释一下一些词汇在本文中的含义:
领域:问题所属的范畴或主题。例如,人工智能可以是一个领域,机器学习是人工智能的一个子领域,推荐系统是机器学习的一个子领域。
理念:解决问题的指导思想。例如,连接主义是人工智能领域的一个理念,也是机器学习领域的重要理念。
方法:解决问题所采用的算法或实现方式。例如,深度学习是机器学习的一种方法。
范式:解决问题的原则或思考方式。例如,监督学习是机器学习的一种范式。
技术:解决问题的具体工具、知识或模型。例如,人工神经网络是机器学习的一种技术,深度神经网络是深度学习的主要技术。
应用方向:解决问题所满足的需求。例如,自然语言处理是人工智能的一个应用方向。
机器学习是人工智能的一个子领域,是一个较为宽泛的概念,它包含众多传统机器学习方法,例如所谓的十大算法:决策树、支持向量机(SVM)、随机森林算法、逻辑回归、朴素贝叶斯、KNN算法、K-means算法、Adaboost算法、Apriori算法、PageRank算法。在这些经典算法之外,近十年发展最为迅速、成果最为惊人的机器学习方法便是深度学习。而深度学习之所以冠以“深度”一词,是因为它使用深度神经网络来学习复杂的表示和特征。
简单来说,深度学习包含于机器学习,是机器学习的一种方法;机器学习又包含于人工智能,是人工智能领域的一个子领域。
三、机器学习范式:监督学习、无监督学习、强化学习与深度学习?
在互联网上各种各样的科普中,监督学习往往和深度学习一起被称为是机器学习的分支。实际上,这并不严谨,因为二者的性质完全不同:深度学习是机器学习的一种方法,而监督学习则是机器学习的一种范式。
机器学习有着多种多样的范式,光是带有“监督”一词的就有至少4个:监督学习,无监督学习,自监督学习,半监督学习。除了“监督”一族外,机器学习还有强化学习、迁移学习和集成学习等范式。在众多的范式中,监督学习、无监督学习和强化学习较为典型。
监督学习是机器学习中最为常见的一种范式,其核心思想是通过给模型提供带有标签的训练数据,使模型能够学习输入与输出之间的映射关系。其主要针对的机器学习领域是分类和回归。分类是将输入数据映射到预定义的类别或标签中的一种任务,例如图像分类、文本分类;回归是指预测一个连续值,例如房价预测、股票价格预测。
与监督学习不同,无监督学习的训练数据没有标签,模型需要自己探索数据的内在结构和规律。其主要针对的机器学习领域是聚类、降维。聚类旨在将数据分组成具有相似特征的簇;降维则被用来减少数据的维度,同时保留尽可能多的信息。
强化学习旨在让智能体在与环境交互学习的过程中最大化累积奖励信号,以训练智能体在特定环境中做出适当决策。它一般涉及六个关键元素:智能体(Agent),环境(Environment),状态(State),动作(Action),奖励(Reward),策略(Policy)。强化学习主要针对的机器学习领域包括机器博弈等。
四、机器学习依赖的技术:人工神经网络,深度神经网络,卷积神经网络
深度学习的核心技术是深度神经网络,而深度神经网络则是人工神经网络的一种。它是一种模仿人脑结构和功能的计算模型,由大量的神经元相互连接而成。
人工神经网络的概念最早可以追溯到1943年提出的McCulloch-Pitts神经元模型。1957年,感知机模型被提出,成为人工神经网络研究的先驱。感知机是一种单层的神经网络,主要用于二分类问题。然而,感知机的局限性在于它只能解决线性可分的问题,即只能分割具有明显界限的数据集。这导致了感知机的局限性,因为许多实际问题都涉及非线性的关系。
此后,人工神经网络经历了多个阶段的发展,其中的关键突破之一是在1986年反向传播算法的提出。这一算法克服了感知机的限制,使得神经网络能够学习更复杂的非线性关系,促进了人工神经网络研究的复苏,并标志着深度神经网络(DNN)的崛起。
深度神经网络是一种多层次的神经网络结构,可以学习更复杂、抽象的表示。然而,在接下来的几十年中,深度神经网络并没有立即受到广泛关注,因为计算机的计算能力仍然有限,而且数据集相对较小,使得深度神经网络的训练过程非常耗时。随着计算能力的不断提高和大规模数据集的出现,尤其是在2010年以后,深度神经网络才再次崭露头角,在图像识别、语音识别和机器博弈等任务上取得了显著的成功,引起了各界的广泛关注。得益于深度神经网络的广泛应用,深度学习这一机器学习方法成为人工智能领域的热点,吸引了大量研究和投资。
在深度学习研究不断深入的过程中,也涌现出深度神经网络的多种变体,例如卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)和生成对抗网络(CAN)等。在实际应用中,研究人员和工程师可以根据任务的特点有针对性地选择适合的网络结构。
卷积神经网络是一种专门用于处理和分析网格数据的深度神经网络,它的结构通常可以分为输入层、卷积层、池化层和全连接层。输入层负责接收原始数据;卷积层是卷积神经网络的核心组件,使用卷积操作从输入数据中提取局部特征,通过在输入的数据上滑动卷积核来提取局部特征,形成输出特征图;池化层用于减小特征图的空间维度,同时保留关键的信息;全连接层接受来自前面层的所有特征,并将它们连接到输出节点。这种结构使得CNN在图像识别等领域表现出色。
可以说,人工神经网络是机器学习的重要基石,而深度神经网络乃至卷积神经网络则是在此基础上不断演进和优化的结果。这些技术的发展为机器学习提供了强大的工具,推动了人工智能在各个方向上的广泛应用。
五、人工智能的应用方向:计算机视觉,自然语言处理?
人工智能的应用方向十分广泛,包括计算机视觉(CV)、自然语言处理(NLP)、信息检索(IR)、多媒体(MM)和数据挖掘(DM)等。近年来,深度学习在计算机视觉方向取得了显著成就,在人脸识别、图像处理等应用中的表现尤为突出;同时,随着ChatGPT等大语言模型的出现,自然语言处理也成为人工智能领域的热门话题。鉴于此,笔者在此粗略地介绍一下CV和NLP。
计算机视觉是指使计算机系统具有对图像或视频进行理解和分析的能力。在这一方向,深度学习和卷积神经网络发挥了关键作用。计算机视觉的应用包括但不限于图像识别和分类、目标检测和人脸识别。
自然语言处理是指使计算机能够理解、解释和生成人类语言。在这一方向,循环神经网络、长短时记忆网络等技术为处理文本数据提供了有效工具。自然语言处理的应用包括但不限于机器翻译、情感分析、语音识别和自然语言生成。窗体顶端
若要更多地了解自然语言处理,就不能不涉及大语言模型。为此,笔者简要解释一下以下词汇在本文中的含义:
技术:解决问题的具体工具、知识或模型。例如,深度神经网络、卷积神经网络都是深度学习的技术。
框架:提供了通用功能和可复用设计的结构和(软件)工具。例如,TensorFlow、PyTorch、Keras、Caffe等都是深度学习框架。
模型:问题解决方案的数学表示和实现。例如,卷积神经网络、Transformer是深度学习中的常见模型。
在本文语境下,框架和模型都可以被归到技术这一范畴里。
在NLP方向的深度学习模型中,RNN、LSTM等较为经典,而近年来应用较多的是Transformer。Transformer是一种基于自注意力机制的模型结构,被广泛应用于处理序列数据,在机器翻译任务中取得了显著成功。
以Transformer为基础,许多面向更广泛应用的语言模型也相继被提出,例如BERT和GPT。 GPT(Generative Pre-trained Transformer)系列模型是一组基于 Transformer 结构的预训练语言模型,其特点是通过自回归方式生成文本,它在大规模语料库上进行预训练,然后进行微调以适应特定任务。GPT系列的代表应用便是风靡一时的ChatGPT。
结语
本文旨在帮助读者理清人工智能领域中一些常见概念的含义和彼此关系。鉴于笔者水平有限,文章的介绍较为简略,但笔者仍期望以此方式提高非专业人士对该领域的理解,为人工智能时代的到来奠定更为牢固的基础。
人工智能的发展历程犹如一场惊天动地的科技奇迹。从1956年达特茅斯会议提出“人工智能”概念至今,这个领域已经经历了波澜壮阔的变革,塑造了我们生活的方方面面。
在这个过程中,机器学习逐渐成为人工智能的核心,深度学习图像识别、语音识别、自然语言处理等众多领域大放异彩。70年的发展历程中,我们见证了机器在各种任务中不断超越人类的惊人进步。从棋类游戏中AlphaGo的战胜,到胜任自然语言生成的ChatGPT问世,人工智能已经不再是科幻小说的产物,而是实实在在改变着我们的生活。
“科技是第一生产力。”人工智能的迅猛发展为第四次科技革命的来临奠定了基础。其在医疗、交通、教育、能源等各个领域的广泛应用,推动了社会的数字化和智能化进程。当然,人工智能应用的日益普及也引发着对隐私、伦理和安全等方面的担忧,社会各界对于人工智能可能带来的就业变革和社会不平等问题投入了越来越多的关注。
这种焦虑和担忧是有益的。人工智能的发展不仅让我们见识到技术的奇迹,也迫使我们思考人类社会的未来。人工智能研究的最终目标绝不只是训练模拟人类智能的机器,而是创造出具有完备的自我意识、能够意识到自我的存在并能够分辨自我和外界的智能体。
人类,作为一种智慧生命体,在满足生存需求后的终极目标是什么?“我是谁?我从哪里来?我要到哪里去?”西方哲学三大终极问题如是说。要知道“我从哪里来?我要到哪里去?”,就是要探索“我”之外的世界——物理学中的大统一理论,哲学意义上的万物真理;要知道“我是谁”,就是要探索“我”之内的世界——智慧生命体的“智能”本身。
迄今为止,人类对于自身意识和智能的理解依然是模糊不清的谜团。然而,随着人工智能时代的来临,我们面临着前所未有的可能性。一旦我们成功实现人工智能的终极目标,创造出一个完备的智能体,我们对“智能”的理解将得到提升,“我是谁”的问题将有希望得到解决。
更进一步,若我们能够通过技术手段赋予这个智能体超越人类的智慧,它的高级智能或许能够加速人类对外部世界真理的探索。在这一过程中,“我从哪里来?我要到哪里去?”这些根本性的问题或将得到迎刃而解。这个崭新的智能时代,不仅是科技发展的新篇章,也将解答我们的存在的意义。
届时,作为一种新的智慧生命体,强人工智能必然不再仅仅是人类的工具和助手,而是一种“新”的存在。我们何尝不能以看待外星人的眼光看待强人工智能?到那时,人类社会又当如何处置不同智慧物种之间的平衡?
以上内容仍只是幻想,但合理的幻想未尝不是对现实与当下的警示和反思。“经济基础决定上层建筑。”纵观历史,从来没有理所当然的社会观念和制度,一切都在变化当中。当人工智能时代到来,人类社会的伦理、制度、观念将如何变革?人类能否与人工智能一道迈向光明未来?
“宇宙很大,生活更大。”让我们拭目以待。