caffe学习笔记(二):Mnist手写体数字识别实例

手写体识别基本是caffe入门的必修课,caffe官方教程最为正宗,在此给出官方教程链接:http://caffe.berkeleyvision.org/gathered/examples/mnist.html

另外有大神已经进行了详细翻译,在此附上链接,就不再进行重复编写。https://blog.csdn.net/real_myth/article/details/52743407

另外为了更好的理解LeNet,附上网络结构图如下

caffe学习笔记(二):Mnist手写体数字识别实例_第1张图片 

以上图为例,对经典的LeNet-5做深入分析:

  1. 首先输入图像是单通道的28*28大小的图像,用矩阵表示就是[1,28,28]
  2. 第一个卷积层conv1所用的卷积核尺寸为5*5,滑动步长为1,卷积核数目为20,那么经过该层后图像尺寸变为24,28-5+1=24,输出矩阵为[20,24,24]。
  3. 第一个池化层pool核尺寸为2*2,步长2,这是没有重叠的max pooling,池化操作后,图像尺寸减半,变为12×12,输出矩阵为[20,12,12]。
  4. 第二个卷积层conv2的卷积核尺寸为5*5,步长1,卷积核数目为50,卷积后图像尺寸变为8,这是因为12-5+1=8,输出矩阵为[50,8,8].
  5. 第二个池化层pool2核尺寸为2*2,步长2,这是没有重叠的max pooling,池化操作后,图像尺寸减半,变为4×4,输出矩阵为[50,4,4]。
  6. pool2后面接全连接层fc1,神经元数目为500,再接relu激活函数。
  7. 再接fc2,神经元个数为10,得到10维的特征向量,用于10个数字的分类训练,送入softmaxt分类,得到分类结果的概率output。

caffe学习笔记(二):Mnist手写体数字识别实例_第2张图片 

                                                                        LeNet  立体网络结构图

你可能感兴趣的:(Caffe,Caffe学习笔记)