每天五分钟计算机视觉:搭建手写字体识别的卷积神经网络

本文重点

我们学习了卷积神经网络中的卷积层和池化层,这二者都是卷积神经网络中不可缺少的元素,本例中我们将搭建一个卷积神经网络完成手写字体识别。

卷积和池化的直观体现

每天五分钟计算机视觉:搭建手写字体识别的卷积神经网络_第1张图片

手写字体识别

手写字体的图片大小是32*32*3的,它是一张 RGB 模式的图片,现在我们想识别它是从 0-9 这 10 个字中的哪一个,我们构建一个神经网络来实现这个功能。

第一个卷积层

过滤器大小为 5×5,步幅是 1,padding是 0,过滤器个数为 6,那么输出为 28×28×6。将这层标记为 CONV1,它用了 6 个过滤器,增加了偏差,应用了非线性函数 ReLU,最后输出 CONV1 的结果。

第一个池化层

然后构建一个池化层,使用最大池化的方式。参数 f= 2, s= 2,因为 padding 为 0,表示高度和宽度会减少一半。因此,28×28 变成了 14×14,通道数量保持不变,所以最终输出为 14×14×6,将该输出标记为 POOL1。

第二个卷积层

我们再为它构建一个卷积层,过滤器大小为 5×5,,即 f= 5,步幅是 1,padding 为 0,过滤器 16 个,所以 CONV2 输出为 10×10×16,这是CONV2 层。

你可能感兴趣的:(计算机视觉,计算机视觉,cnn,深度学习,人工智能,神经网络)