李立宗《讲给入门者的深度学习》

14天学习训练营导师课程: 李立宗《讲给入门者的深度学习》

一、什么是深度学习?

1、传统方法、机器学习、深度学习的区别?

以取暖为例,来说明三者的不同之处。

传统方法:通过火炉生火,需要生火、添柴、通风等,过程复杂。
李立宗《讲给入门者的深度学习》_第1张图片

机器学习:空调,设置温度、湿度等参数值。
根据数据提取特征。
李立宗《讲给入门者的深度学习》_第2张图片

深度学习:智能空调,设置“清爽”、“温暖’”等模式。
对特征进行学习,从中找到有用的特征。
深度学习是一种端到端的机器学习,通过神经网络学习数据的特征,得到最终的答案。
李立宗《讲给入门者的深度学习》_第3张图片

二、深度学习基本原理

神经网络的基本架构: 输入层、中间层(也叫隐藏层)、输出层。
李立宗《讲给入门者的深度学习》_第4张图片
对于上图神经网络结构的层数,我们可以称有两层(只有两层权重值(输入层到中间层的权重、中间层到输出层的权重));也可以说有三层(即有3层神经元构成)。

之所以名为深度学习是因为:
1、神经网络的层数多;
2、学习深层次的知识。

深度学习强大的原因
1、不需要手动提取特征;
2、可以处理线性不可分问题。

多数情况下神经网络的结构:
李立宗《讲给入门者的深度学习》_第5张图片
神经网络每层的主要作用:
李立宗《讲给入门者的深度学习》_第6张图片
第1层:提取最简单基础的特征,例如:点、线、纹理、边缘等几何特征;
第2层:简单特征的组合特征,例如:曲线、轮廓等;
第3层:相对高级的一些特征,例如:眼睛、鼻子、嘴巴等;
第4层:语义特征。

高级特征通过大量计算,从低级特征中提取出来。

随着训练次数不断增多,提取的特征越来越清晰。
神经网络层数不断加深,数据要一遍一遍处理。

深度学习能够拟合任何连续函数。

三、工作原理

以培育水稻为例,影响水稻生长的因素包括:施肥量、灌溉量、施肥时间、插秧密度等。
我们可以通过寻找到影响生长的参数的最优值,并调整最优参数,实现水稻的高产。

李立宗《讲给入门者的深度学习》_第7张图片
那么我们如何来构造一个系统呢?
首先先设定一个基本参数,让系统运行起来(例如设置施肥量、灌溉量等的初始值);
观察结果如何,然后不断的修改参数(重复这个过程);
达到目标(最优结果),保留参数;
系统可以不断的复用。

李立宗《讲给入门者的深度学习》_第8张图片
反向传播:
1、网络初始化(随机初始化参数值)
2、前向反馈(网络试运行)
3、误差评估(评估结果满意度)
4、根据第3步的值调整参数
5、重复第3步、第4步
李立宗《讲给入门者的深度学习》_第9张图片
神经网络工作的核心:
初始的参数值是随机的
后续参数值的调整是非常科学的(严格的数学公式保证向着最优参数逼近);
如何进行参数的调整,至关重要。
李立宗《讲给入门者的深度学习》_第10张图片
参数的重要性:

假设要进行阅兵,需要选拔一批选手,他们的身高要接近180,体重接近70公斤。
该如何进行选拔?

李立宗《讲给入门者的深度学习》_第11张图片
根据选拔函数,我们可以看到对于身高、体重的权重设置很关键。

学习分类:有监督(数据+标签)、无监督(只有数据,无标签):
李立宗《讲给入门者的深度学习》_第12张图片
图像识别:
9李立宗《讲给入门者的深度学习》_第13张图片
待识别的图像的特征与特征数据库中图中的特征进行比对(计算欧氏距离),来选择距离小的那个图像的标签,即为待识别图像的标签。

流程图:
李立宗《讲给入门者的深度学习》_第14张图片
要解决的问题:特征提取 特征比对

无监督学习:只有数据,没有标签。
李立宗《讲给入门者的深度学习》_第15张图片
通过特征学习,将这些图像分为两类。
李立宗《讲给入门者的深度学习》_第16张图片
下面以6粒豆子分两类为例,来讲述无监督学习的整个过程:
李立宗《讲给入门者的深度学习》_第17张图片
第1步:选取A B两个豆子作为参考豆子(注意随机选取
李立宗《讲给入门者的深度学习》_第18张图片
第2步:计算剩余豆子的直径与豆子A B之间的距离。
根据计算结果,进行分组:
李立宗《讲给入门者的深度学习》_第19张图片
第3步:分别计算上述两组豆子的直径平均值,然后,将各个豆子按照与直径平均值的距离大小划分分组。
李立宗《讲给入门者的深度学习》_第20张图片
分组如下:
李立宗《讲给入门者的深度学习》_第21张图片
第4步:重复第3步,直到分组稳定不再发生变化,认为分组完成。
李立宗《讲给入门者的深度学习》_第22张图片
分组结果:
李立宗《讲给入门者的深度学习》_第23张图片
与上一次分组结果一致,结束分组。
李立宗《讲给入门者的深度学习》_第24张图片
k均值聚类算法:
1、随机选取k个点作为分类的中心点;
2、将每个数据点放入到距离它最近的类别中心点所在类中(使用距离公式);
3、重新计算各个分类数据点的平均值,将该平均值作为新的类中心点;
重复步骤2和3,直到分类稳定。
李立宗《讲给入门者的深度学习》_第25张图片

四、 损失函数

李立宗《讲给入门者的深度学习》_第26张图片
损失函数本质上就是实际值与测试值之间的差值,在实际应用中越小越好。

你可能感兴趣的:(深度学习,人工智能)