【深度学习】运用mnist数据集实例化一个简单的卷积神经网络

卷积神经网络,也叫convnet,是计算机视觉应用几乎都在使用的一种深度学习模型。

文章目录

  • 前言
    • 1、搭建卷积神经网络架构
    • 2、添加分类器
    • 3、训练卷积神经网络


前言

MNIST是一个手写体数字的图片数据集,该数据集来由美国国家标准与技术研究所(National Institute of Standards and Technology (NIST))发起整理,一共统计了来自250个不同的人手写数字图片,其中50%是高中生,50%来自人口普查局的工作人员。该数据集的收集目的是希望通过算法,实现对手写数字的识别。

同样,MNIST数据集作为众多人工智能入门练习的数据集,受众广泛,今天我们搭建一个最简单的卷积神经网络就是运用到MNIST数据集。


1、搭建卷积神经网络架构

MNIST数据集可以通过keras这个高级API进行下载,也可以在官网上手动下载。
MNIST数据集官网:http://yann.lecun.com/exdb/mnist/
这里我们先搭建卷积神经网络的基本架构。

from keras import layers
from keras import models

model = models.Sequential()
model.add(layers.Conv2D(32,(3,3),activation='relu',input_shape=(28,28,1)))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))
model.summary()

注意,卷积神经网络接收形状为(image_height,image_width,img_channels)的输入张量,该例子中卷积神经网络处理大小为(28,28,1),即正好为MNIST图像的格式。我们向第一层传入参数input_shape=(28,28,1)来完成此设置。

来看一下目前的卷积神经网络的架构。
【深度学习】运用mnist数据集实例化一个简单的卷积神经网络_第1张图片
注意,这并不是完整的卷积神经网络架构,要使得网络架构完整,我们还需加入全连接层。

可以看到每个Conv2D层和MaxPooing层的输出都是一个形状为(height,width,channels)的3D张量。宽度和高度两个维度的尺寸通常会随着网络加深而变小,通道数由传入Conv2D层的第一个参数控制(32或64)

下一步是将最后的输出张量输入到一个密集连接分类器网络中,即Dense层的堆叠。我们需要将3D输出展平为1D,然后在上面添加几个Dense层。

2、添加分类器

代码如下(示例):

model.add(layers.Flatten())
model.add(layers.Dense(64,activation='relu'))
model.add(layers.Dense(10,activation='softmax'))
model.summary()

我们将进行10类别分类,最后一层使用带10个输出的softmax激活,现网络结构如下:
【深度学习】运用mnist数据集实例化一个简单的卷积神经网络_第2张图片
如图,在进入两个Dense层之前,形状(3,3,64)的输出被展平为形状(576,)的向量。下面我们开始在MNIST上训练卷积神经网络。

以上就是一个完整的卷积神经网络了,接下来我们将对数据进行预处理,同时将模型代入卷积神经网络中训练,最终来看看训练的效果。

3、训练卷积神经网络

代码如下(示例):

from keras.datasets import mnist
from keras.utils import np_utils

(train_images,train_labels),(test_images,test_labels) = mnist.load_data()

train_images = train_images.reshape((60000,28,28,1))
train_images = train_images.astype('float32')/255

test_images = test_images.reshape((10000,28,28,1))
test_images = test_images.astype('float32')/255

train_labels = np_utils.to_categorical(train_labels)
test_labels = np_utils.to_categorical(test_labels)

model.compile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])

model.fit(train_images,train_labels,epochs=5,batch_size=64)
test_loss,test_acc = model.evaluate(test_images,test_labels)
print(test_acc)

【深度学习】运用mnist数据集实例化一个简单的卷积神经网络_第3张图片

经过5次循环训练之后,测试精度高达98.9%,训练结果相当不错!

以上就是一个最简单的卷积神经网络。全部代码如下:

from keras import layers
from keras import models

model = models.Sequential()
model.add(layers.Conv2D(32,(3,3),activation='relu',input_shape=(28,28,1)))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))

model.add(layers.Flatten())
model.add(layers.Dense(64,activation='relu'))
model.add(layers.Dense(10,activation='softmax'))
model.summary()

from keras.datasets import mnist
from keras.utils import np_utils

(train_images,train_labels),(test_images,test_labels) = mnist.load_data()

train_images = train_images.reshape((60000,28,28,1))
train_images = train_images.astype('float32')/255

test_images = test_images.reshape((10000,28,28,1))
test_images = test_images.astype('float32')/255

train_labels = np_utils.to_categorical(train_labels)
test_labels = np_utils.to_categorical(test_labels)

model.compile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])

model.fit(train_images,train_labels,epochs=5,batch_size=64)
test_loss,test_acc = model.evaluate(test_images,test_labels)
print(test_acc)

你可能感兴趣的:(深度学习,深度学习,cnn,人工智能)