注:本文主要详细介绍神经网络与深度学习的含义与所需要的条件,适合刚接触的人了解一下。
废话不多说,我们直接开整!!!
1.什么是神经网络?
简单来说,它就是一种编程范式,可以让计算机从观测数据中进行学习。
2.神经网络需要什么条件才能实现?
在众多神经元模型中,我们以S型神经元为例。在这之前,我先讲一个概念
感知器!!!
什么是感知器?,感知器就是单层的神经网络,也是最简单的神经网络。它将输入的值通过简单的规则来计算输出,这就是感知器干的事情。
讲到感知器,就必须要提一下权重和阈值。
什么是权重?顾名思义就是它的重要性,你可以通过设置因素的权重来做出决定。
阈值,就是一个标准,或者说是一个度。一旦超过这个标准,计算机就要做出相应的改变。
举个简单的例子帮大家理解:周末你要不要去参加别人的婚礼:有3个因素。
如果天气好,则a=1,否则a=0;如果车不限号,则b=2,否则b=1;如果有朋友陪你一起,c=3,否则c=2。我们设置阈值为3。一旦a+b+c超过3,我们去,否则不去。权重越高,则表明它对结果影响越大。如果我们降低阈值,说明你想去。随着权重和阈值的改变,我们可以得到多种决策模型。
相较于阈值,我们引入新的概念:偏置。可以简单理解为它是一种表示让感知器输出1有多容易的估算。对于具有一个很大偏置的感知器来说,输出1相当容易。下面的图可以帮我们更清晰的了解。这里的b就是偏置
感知器的另一种方式是计算基本的逻辑功能,即运算基础,例如‘与’,‘或’,‘与非’
3.神经网络结构
如图所示,神经网络包括最左边的输入层,即输入神经元;中间层没有输入与输出功能,我们叫做隐藏层,隐藏层可以有很多层;最右边我们叫做输出层,即输出神经元。
这种多层网络叫做多层感知器或者MLP。
接下来我们开始介绍代码,上干货!
对于神经网络,我们常用到Numpy的Python库(下载地址:http://www.scipy.org/install.html)
神经网络代码的核心片段是一个Network类。这是我们用来初始化一个Network对象的代码
由于Network对象中的偏置和权重都是被随机初始化的,使用Numpy的np.random.randn函数来生成均值为0,标准差为1的高斯分布。
另外注意,偏置和权重都是以Numpy矩阵列表的形式储存的。例如:net.weights[1]是一个连接第二层和第三层的权重Numpy矩阵。
介绍了神经网络,让我们准备迈入深度学习吧!
什么是深度学习呢?把计算机比作我们小孩子,我们刚出生的时候,对这个世界的事务是懵懂的,是在大人的教导下,我们开始认识这个世界。同样,计算机也需要我们输入代码并进行训练。下面,我以识别手写字符串为例介绍代码
这是我们需要用到的模块
这里首先定义了几个参数
——--datapath 参数,也就是我们训练需要的数据的位置
——batch_size 是用于训练的数据的规格(多少)
——epochs 就是训练次数,1个epoch就是训练一次,它会将所有的数据都读取一遍
——use_cuda 就是表明我们需要用到cuda
这些就是我们训练需要用到的代码。
首先是打开文件,然后规定数据训练后的存储路径。
这里我们要介绍一种新的东西,卷积神经网络。它的作用,我概括一下就是,在数据库很大时,使用卷积网络,可以很大程度上提高运行和训练的速度。对于深度学习来说,非常好用。
进行深度学习,我们需要检测它训练的正确率,也就是评估evaluation,每进行一个epoch,我们都会更新evaluation,最终训练完成时,我们可以直观的看到我们训练的成果,以便进行下一步。
好了,本期博文就到此为止了,希望可以对入门的兄弟有帮助。