经典卷积神经网络之LeNet-5网络模型

上一章节我们讲述了对手写数字识别的网络设计,我们并没有使用卷积神经网络,但是也得到了一个不错的准确率,那我们试想一下,如果将卷积神经网络应用于数字识别,那效果会不会更好呢?好,我们这一节将讲述第一个经典的卷积神经网络,它的名字叫做LeNet-5.

LeNet-5卷积网络模型的结构

​ LeNet-5 是一个专为手写数字识别而设计的最经典的卷积神经网络,被誉为早期卷积神经网络中最有代表性的实验系统之一。LeNet-5 模型由Yann LeCun 教授于 1998 年在其论文《Gradient-Based Learning Appliedto Document Recognition》中提出,这篇论文对于现代卷积神经网络的研究仍具有指导意义,可以说是CNN领域的第一篇经典之作。在MNIST数据集上, Lel、Jet-5 模型可以达到大约99.4%的准确率,基于 此神经网络模型而设计出的手写数字识别系统在 20 世纪 90年代被广泛应用 于美国的多家银行进行支票手写字识别。根据 Yann LeCun 教授公开发表的论文的内容,可知 LeNet-5 模型共有8 层(包括输入层和输出层),下图展示了LeNet-5模型的整体框架结构。
经典卷积神经网络之LeNet-5网络模型_第1张图片

输入:32*32的手写字体图片,这些手写字体包含0~9数字,也就是相当于10个类别的图片

输出:分类结果,0~9之间的一个数

因此我们可以知道,这是一个多分类问题,总共有十个类,因此神经网络的最后输出层必然是SoftMax问题,然后神经元的个数是10个。

输入层:输入为32*32的图片,相当于1024个神经元

C1层:选择6个特征卷积核,然后卷积核大小选择55,这样我们可以得到6个特征图,然后每个特征图的大小为32-5+1=28,也就是神经元的个数为628*28=784。

S2层:这就是下采样层,也就是使用最大池化进行下采样,池化的size,选择(2,2),也就是相当于对C1层2828的图片,进行分块,每个块的大小为22,这样我们可以得到1414个块,然后我们统计每个块中,最大的值作为下采样的新像素,因此我们可以得到S1结果为:1414大小的图片,共有6个这样的图片。

C3层:卷积层,这一层我们选择卷积核的大小依旧为5×5,据此我们可以得到新的图片大小为14-5+1=10,然后我们希望可以得到16张特征图。

S4层:下采样=样层( Subsampling),有16 个5×5 大小的特征图,每个特征图都是由第四层经过一个2×2 的最大池化操作得来,长和宽的步长均为 2。也就是说,S4 层每一个特征图的每一个单元都与C3层对应的特征图中 2x2大小的区域相连。

C5层:卷积层,我们继续用5×5的卷积核进行卷积,然后我们希望得到120个特征图。

OUTPUT 层:输出层,是一个全连接层,共有10个单元,这10个单元分别代表着数字0~9。判断的标准是,如果某个单元输出为0(或越接近),那么该单元在本层中的位置就是网络识别得出的数字。

TensorFlow实现LeNet-5卷积网络

​ 还是以MNIST手写数字识别的数据集为例。
经典卷积神经网络之LeNet-5网络模型_第2张图片
经典卷积神经网络之LeNet-5网络模型_第3张图片
经典卷积神经网络之LeNet-5网络模型_第4张图片
经典卷积神经网络之LeNet-5网络模型_第5张图片

今天的内容就介绍这么多,主要讲述了经典卷积神经网络之LeNet-5网络模型和它的实现,希望大家快来动手操作一下试试看!

关注小鲸融创,一起深度学习金融科技!

你可能感兴趣的:(深度学习,卷积,神经网络,机器学习,深度学习)