【深度学习】什么是深度学习-1

人工智能,机器学习与深度学习

问自己一个问题:到底深度学习目前实现了什么成就?它到底有多重要?我们已经处在哪个阶段了?

一图看懂三者的关系:

【深度学习】什么是深度学习-1_第1张图片

人工智能是个大范畴,机器学习是人工智能的一个子集,而深度学习则是机器学习里的更小的子集。

但是传统的机器学习其实是比深度学习更难的,要求的数学知识更多,所以不要因为深度学习这个概念更火,而忽视了学习传统机器学习,目前的经验看,坐好冷板凳,把统计机器学习学透,再迁移过来学习深度学习,水到渠成,且更加轻松。

如果习惯了深度学习这一套,可能会变得浮躁,就没有心思坐下来研究机器学习了。

人工智能

人工智能这个概念诞生于1950年代,关于人工智能有一个简洁的定义:

自动执行人类能够执行的任务。

人工智能是个宽泛的概念,在早期,很多专家认为人工智能就是由人来手动设定很多规则,并不牵涉到学习的概念。这种方法叫做符号人工智能。这套方法从1950年代直到1980年代,一直是AI领域的主导。尤其是在1980年代,专家系统是这种学习方法的巅峰时刻。

机器学习

机器学习起源于这个问题:计算机能否超越人类已知的如何给机器下达指令去执行而自己学到如何去执行特定的任务?

也就是说,机器自己学习去做任务,而不要人手动写好执行规则。

换句话说,机器能否让我们惊讶一把?让机器从数据中学到规则,知识?

但凡能够推动一个领域的发展,一定是从问一个问题开始。只有想过,才能真正推开这扇门。

是的,这个问题的提出,推开的这扇门,一直引领着我们进入到当今的人工智能新时代。

传统机器学习,我们向模型输入的是规则 + 数据,然后执行模型给出我们答案。

【深度学习】什么是深度学习-1_第2张图片

现在推开一扇门,如果只输入数据 + 正确答案,能否让机器学到规则呢?

学到规则以后,我们就可以将这些规则应用到新的数据上。

如果这个可行,那么机器学习系统就不再是我们人工编码规则,而是**训练它学到规则了。**多么令人向往!

这个思想一旦兴起,就像燎原的星火,迅速火遍学界和工业界。

注意到,从1990年代开始兴起的机器学习,迅速成为了人工智能领域的一个最火的分支,更快的硬件,更大的数据集驱动着机器学习不断向前推进。

机器学习与统计有密切的关系,但是又有诸多不同,机器学习倾向于处理更大的数据集,更复杂的数据集。结果是,机器学习越来越与数学理论脱离,也即,我们开始无法用理论来解释机器学习了。更多的是依靠工程调参,依靠经验,得出更优秀的结果,但无法解释。

尤其是深度学习,几乎被人视作黑箱子了。

从数据中学习表征

为了做好机器学习,我们需要做好三个准备:

  • 输入数据
  • 样例输出结果
  • 评估算法的方法:当前模型输出与真实输入结果之间的差距

机器学习模型会将输入数据变成有意义的输出结果,这个过程是模型从数据中学到如何输出,所以不管是机器学习也好,还是深度学习也罢,重要的是对数据进行有意义的变换。从另一个角度说就是,模型可以从数据中学到有价值的表征。

机器学习的核心就是寻找到输入数据的合适的表征。

比如针对分类任务,能够学习到给数据合适的表征,更容易对数据进行分类。

下面这个例子,值得好好咀嚼,反思。

【深度学习】什么是深度学习-1_第3张图片

通过建立新的坐标系,我们就可以把数据分割在纵轴的两端:

  • x < 0 是白色圆
  • x > 0是蓝色圆

坐标系变换一下,对数据的分割就变得明显且易于表述了。

上面是我们手动找出来的,如果交给机器自动执行,我们可以随机定一个坐标系,然后给出评价指标:被错误分到类别的圆形所占的比例,就可以自动校正,最后实现正确分类。

这就是一种学习。

所有的机器学习算法都包含着这个核心要素:对于给定任务,自动寻找到将数据变换为有用的表征。

这些操作有时候是坐标系的改变,有时候是线性映射,非线性操作等等。

但是值得强调的是,机器学习并非在无限空间内自由探索转变方式,而仅仅是在我们预定义好的范围内进行搜索,这个范围有个专有名称:假设空间

现在回到上面的问题:什么是机器学习呢?

经过前面的铺垫,我们可以给出一个新的定义:对输入数据搜索有用的数据表征,这些搜索空间是有限的,具体执行搜索时,会给出反馈信号,以指引搜索的过程。

现在机器学习的定义进一步明确后,我们再来看具体到深度学习领域,到底什么是深度学习呢?

深度学习的深为何物

深度学习的深,含义倒是不深,表达的是深度神经网络有多少层。

现在的深度学习模型往往有几十甚至几百层,它们的学习全都是通过训练数据,有些只用几层来做数据表征学习的方法,有一个对应的名字叫做:浅层学习

【深度学习】什么是深度学习-1_第4张图片

深度学习模型并非对大脑的直接建模,实际上深度学习模型受大脑启发,但是越发展到最后,和大脑的关系也就不太大了。

我们只需要关注到:深度学习模型只是一种从数据中学到表征的一个数学框架。

那么,我们不由得会好奇,深度学习模型到底从数据中学到什么表征了呢?

【深度学习】什么是深度学习-1_第5张图片

深度学习模型是一个连续抽取特征表示的学习方法,前一层的输出会作为下一层的输入,因此这个学习方法也称作多阶段学习数据表征。

深度学习的机制非常简单,但是通过堆叠神经网络层,最后表现出来的结果,像魔法一般。

是的,It’s magic.

END.

参考:

《Deep Learning with Python》

你可能感兴趣的:(Deep,Learning,Machine,Learning)