如果把人工智能、机器学习与深度学习比作大小不同的同心圆,那么三者之间的位置应该是:人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧是深度学习,是当今人工智能大爆炸的核心驱动。
人工智能的定义
人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”就是我们会考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步等等。但总的来说,“人工系统”就是通常意义下的人工系统。什么是“智能”?这涉及到其它诸如意识(consciousness)、自我(self)、思维(mind)(包括无意识的思维(unconscious_mind)等等问题。人工智能的研究往往涉及对人的智能本身的研究。其它关于动物或人造系统的智能也普遍被认为是人工智能相关的研究课题。
“人工智能”一词最初于1956 年的特茅斯会议(Dartmouth Conferences)上提出。此后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。
人工智能(Artificial Intelligence,简称AI)是计算机学科的一个分支,二十世纪七十年代以来被称为世界三大尖端技术之一(空间技术、能源技术、人工智能),也被认为是二十一世纪(基因工程、纳米科学、人工智能)三大尖端技术之一。这是因为近三十年来它获得了迅速的发展,在很多学科领域都获得了广泛应用,并取得了丰硕的成果,人工智能已逐步成为一个独立的分支,无论在理论和实践上都已自成一个系统。
人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机、心理学和哲学知识。人工智能是内涵十分广泛的科学,它由不同的领域组成,如机器学习、计算机视觉等等。总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。
人工智能的实际应用包括:指纹识别、人脸识别、视网膜识别、虹膜识别、掌纹识别、专家系统、智能搜索、定理证明、博弈、自动程序设计,还有航天应用等。
什么是机器学习?
顾名思义,机器学习目的就是让机器具有类似于人类的学习、认识、理解事物的能力。机器学习是一种数据分析方法,它可以自动分析模型的建筑。通过使用迭代学习数据的算法,机器学习可以使电脑在没有被明确编程的情况下,发现隐藏的领域。它是多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。如语音识别、自动驾驶、语言翻译等都是机器学习的应用。
机器学习是人工智能研究较为年轻的分支,它的发展过程大体上可分为4个时期。
第一阶段是在50年代中叶到60年代中叶,属于热烈时期。
第二阶段是在60年代中叶至70年代中叶,称为机器学习的冷静时期。
第三阶段是从70年代中叶至80年代中叶,称为复兴时期。
机器学习的最新阶段始于1986年。
▶ 机器学习进入新阶段的重要表现在下列诸方面:
1、机器学习已成为新的边缘学科并在高校形成一门课程。它综合应用心理学、生物学和神经生理学以及数学、自动化和计算机科学形成机器学习理论基础。
2、结合各种学习方法,取长补短的多种形式的集成学习系统研究正在兴起。特别是连接学习符号学习的耦合可以更好地解决连续性信号处理中知识与技能的获取与求精问题而受到重视。
3、机器学习与人工智能各种基础问题的统一性观点正在形成。例如学习与问题求解结合进行、知识表达便于学习的观点产生了通用智能系统SOAR的组块学习。类比学习与问题求解结合的基于案例方法已成为经验学习的重要方向。
4、各种学习方法的应用范围不断扩大,一部分已形成商品。归纳学习的知识获取工具已在诊断分类型专家系统中广泛使用。连接学习在声图文识别中占优势。分析学习已用于设计综合型专家系统。遗传算法与强化学习在工程控制中有较好的应用前景。与符号系统耦合的神经网络连接学习将在企业的智能管理与智能机器人运动规划中发挥作用。
5、与机器学习有关的学术活动空前活跃。国际上年度机器学习研讨会外,还有计算机学习理论会议以及遗传算法会议。
深度学习是人工智能的主要引擎
深度学习,是机器学习中一种基于对数据进行表征学习的方法,概念源于人工神经网络的研究,由Hinton等人于2006年提出。其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,含多隐层的多层感知器就是一种深度学习结构。
如今,在某些情况下,通过深度学习训练过的机器在图像识别上表现优于人类,这包括找猫、医疗影像分析等。谷歌的AlphaGo学会了围棋,并为比赛进行了大量的训练,不断的和自己比赛。深度学习已成为人工智能发展的主要引擎。
▶ 深度学习的重要发展领域
深度学习首先在图像、声音和语义识别取得了长足的进步,特别是在图像和声音领域相比传统的算法大大提升了识别率,深度学习是仿人的大脑神经感知外部世界的算法,而最直接的外部自然信号莫过于图像、声音和文字。
图像识别:图像是深度学习最早尝试的领域,大牛Yann LeCun早在1989年就开始了卷积神经网络的研究,取得了在一些小规模(手写字)的图像识别的成果,但在像素丰富的图片上迟迟没有突破,直到2012年Hinton和他学生Alex在ImageNet上的突破,使识别精度提高了一大步。
2014年,香港中文大学教授汤晓鸥领导的计算机视觉研究组开发了名为DeepID的深度学习模型, 在LFW (Labeled Faces in the Wild,人脸识别使用非常广泛的测试基准)数据库上获得了99.15%的识别率,人用肉眼在LFW上的识别率为97.52%,深度学习在学术研究层面上一定程度上已经超过了人类肉眼的识别率。
语音识别:语音识别长期以来都是使用混合高斯模型来建模,在很长时间内都是占据垄断地位的建模方式,但尽管其降低了语音识别的错误率,但面向商业级别的应用仍然困难,也就是在实际由噪音的环境下达不到可用的级别。直到深度学习的出现,使得识别错误率在以往最好的基础上相对下降30%以上,达到商业可用的水平。
微软的俞栋博士和邓力博士是这一突破的最早的实践者,他们与Hinton一起最早将深度学习引入语音识别并取得成功。由于语音识别的算法成熟,科大讯飞、云知声、思必驰在通用识别上识别率都相差不大,在推广上科大讯飞是先行者,从军用到民用,包括移动互联网、车联网、智能家居都有广泛涉及。
自然语言处理(NLP):即使现在深度学习在NLP领域并没有取得像图像识别或者语音识别领域的成绩,基于统计的模型仍然是NLP的主流,先通过语义分析提取关键词、关键词匹配、算法判定句子功能,最后再从提前准备的数据库里提供用户输出结果。
显然,这明显谈不上智能,只能算一种搜索功能的实现,而缺乏真正的语言能力。苹果的Siri、微软的小冰、百度度秘等巨头都在发力智能聊天机器人领域,而应用场景在国内主要还是客服。
▶ 深度学习中的关键武器——卷积神经网络和循环神经网络
简单的人工神经网络每层神经元都与下一层神经元逐个连接,也就是通常所说的全连接神经网络(全连接层),这种神经网络结构往往不能高效的提取输入数据的有效特征。因此学者们提出了许多高效的神经网络结构用于构建深度学习网络,其中当属卷积神经网络(CNN)和循环神经网络(RNN)应用最为广泛。
卷积神经网络(CNN):卷积神经网络(CNN)是一种重要的人工神经网络结构,是当前深度学习应用的重要引擎之一,其重要组成部分为卷积层。卷积层即通过对图像的指定区域与卷积核矩阵进行卷积操作获取图像特征,组合不同数量的卷积核可以提取图像的多种特征,然后通过组合卷积层构建卷积神经网络获取图像的深度特征。
举个例子,你可以将一张图片切分为小块,然后输入到卷积神经网络的第一层。在第一层中与指定数量的卷积核做初步计算,然后神经元将数据传至第二层。之后由第二层再与指定数量的卷积核做运算,依次类推,直到最后一层,提取出图像的深层特征,将提取特征输入到分类器,从而输出最终的结果(如下图从左至右为CNN提取特征和预测结果示意图)。
简单来说,如果我们有很多笑脸,把笑脸的像素输入到一个神经网络里面去,如果你希望让机器能识别这是姚明,那是马云,但是因为深度学习的网络很深,要一次性学会这么多较为困难,所以就需要用到一个比较快速收敛的技巧——通过梯度下降的方法更迭代更新学习(即模型训练)。通过迭代更新学习,机器会逐步从大量的样本中逐层抽象出相关的概念,然后做出理解,最终做出预测。
卷积神经网络不仅仅广泛应用于图像领域,在语音识别和自然语言处理领域也有较多应用。
循环神经网络(RNN):循环神经网络也是一种重要的人工神经网络结构,尤其适用于处理时序数据。RNN假设事物的发展是按照时间序列(先后关系)展开的,即前一刻发生的事物会对未来的事情的发展产生影响。所以,在处理过程中,每一刻的输出都是带着之前输出值加权之后的结果。
如下图,st为当前时刻的输出,xt为当前时刻的输入,U为当前时刻输入值的加权计算,st-1为上一时刻的输出,W为上一时刻输出的权重。通过这样的计算方式,我们可以认为,当前的结果包含之前的结果,或者说受到之前结果的影响,具有记忆样本之间相关联系的能力。但是,RNN对于短期记忆的模型效果很好,却无法进行长期记忆的输出,因为权重累加过于庞大,可能导致结果失真、运算效率低下,所以基于RNN衍生的长短期记忆网络(LSTM)现在也被广泛应用。
RNN常用于文本数据、时间序列、语音识别等序列数据处理中,在实际应用中也有将其应用于图像领域的案例。
CNN和RNN都是构成深度学习中人工神经网络的基本网络结构,对于深度学习的应用具有重要意义。同时还有其他网络结构也在发挥着不同的作用,如图卷积神经网络(GCN)在处理社交网络,知识图谱,路网等领域的网络数据集有较多的应用,在此不再一一赘述。
人工智能、机器学习、深度学习三者之间的关系
人工智能为机器赋予人的智能;机器学习是一种实现人工智能的方法;深度学习是一种实现机器学习的技术。也就是说人工智能是终极目标,机器学习是实现人工智能的一种方法,人工神经网络是机器学习中的一类算法,深度学习就是其中一种神经网络算法。深度学习使得机器学习能够实现众多的应用,并拓展了人工智能的领域范围。
参考资料:
《趋势 | 从人工智能到机器学习再到深度学习》/文章来源于“成都自动化研究会”微信公众号
原文链接:
https://mp.weixin.qq.com/s/LJ6ZQ4zGoclIQvOD0Tiofw
《深度学习笔记-卷积神经网络CNN与循环神经网络RNN有什么区别?》
原文链接:
https://blog.csdn.net/weixin_35227692/article/details/79223536
【相关阅读】
▼
70年人工智能简史
人工智能硬核之旅:从算法到芯片
十大最佳深度学习框架
【近期回顾】
▼
01 大数据GIS赋能公安“超脑”
02 十大最佳深度学习框架
03 《空间三维模型数据格式》团体标准发布
04 苏乐平:规划信息化牛人30年的反转人生
05 《SuperMap三维管线技术白皮书》发布!
欢迎转载~