PY_DL_Machine Vision

深度学习在机器视觉上的应用

1.卷积神经网络

卷积神经网络也称convnet,多应用于图像分类问题
卷积神经网络接收形状为 (image_height, image_width, image_channels)
的输入张量(不包括批量维度)。

简单卷积神经网络构成

  • Conv2D层
  • MaxPooling2D层
  • 每个 Conv2D 层和 MaxPooling2D 层的输出都是一个形状为 (height, width, channels) 的 3D 张量
import keras
keras.__version__

from keras import layers
from keras import models

model = models.Sequential() #添加容器
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

model.summary() #显示当前神经网络架构

PY_DL_Machine Vision_第1张图片

高度和宽度两个维度的尺寸都会随着网络加深而变小。

添加分类器

我们将进行 10 类别分类,最后一层使用带 10 个输出的 softmax 激活。现在网络的架构如下:

#添加分类器
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

#再次显示网络架构
model.summary()

PY_DL_Machine Vision_第2张图片

可以看出,在进入两个Dense层之前,形状(3,3,64)的输出被展平为(576,)的向量

1.1 eg:在MNIST图像上训练卷积神经网络

from keras.datasets import mnist
from keras.utils import to_categorical

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5, batch_size=64)

PY_DL_Machine Vision_第3张图片

#在测试数据上对模型进行评估
test_loss, test_acc = model.evaluate(test_images, test_labels)
#测试精度
test_acc

在这里插入图片描述

你可能感兴趣的:(深度学习,深度学习,人工智能,神经网络)