在TensorFlow下,使用tf.Keras构建和训练一个神经网络模型,对服装图像进行分类。
原文链接:基本分类:对服装图像进行分类 | TensorFlow Core
1.导入相关模块
# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras
# Helper libraries
import numpy as np
import matplotlib.pyplot as plt
2.从Tensorflow中导入和加载Fashion MNIST数据,标签与类的对应关系:0 T恤/上衣、 1 裤子, 2 套头衫, 3 连衣裙, 4 外套, 5 凉鞋, 6 衬衫, 7 运动鞋, 8 包, 9 短靴
fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
3.定义标签名称
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat','Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']
4.浏览数据(此部分用于理解数据)
train_images.shape#训练集中有 60000 个图像,每个图像由 28 x 28 的像素表示
len(train_labels)#训练集中有 60,000 个标签
train_labels#每个标签是0-9之间的整数
test_images.shape#测试集中有 10,000 个图像。同样,每个图像都由 28x28 个像素表示
len(test_labels)#测试集包含 10,000 个图像标签
5.预处理数据:训练集和测试集中图像的像素值处于0-255之间,将这些值缩小到0-1之间
train_images = train_images / 255.0
test_images = test_images / 255.0
6.构建模型:该网络的第一层 tf.keras.layers.Flatten 将图像格式从二维数组(28 x 28 像素)转换成一维数组(28 x 28 = 784 像素)。将该层视为图像中未堆叠的像素行并将其排列起来。该层没有要学习的参数,它只会重新格式化数据。展平像素后,网络会包括两tf.keras.layers.Dense 层的序列。它们是密集连接或全连接神经层。第一个 Dense 层有 128 个节点(或神经元)。第二个(也是最后一个)层会返回一个长度为 10 的 logits 数组。每个节点都包含一个得分,用来表示当前图像属于 10 个类中的哪一类。
model = keras.Sequential([
keras.layers.Flatten(input_shape=(28, 28)),
keras.layers.Dense(128, activation='relu'),
keras.layers.Dense(10)
])
7.编译模型:
损失函数 - 用于测量模型在训练期间的准确率(希望最小化此函数)
优化器 - 决定模型如何根据其看到的数据和自身的损失函数进行更新。
指标 - 用于监控训练和测试步骤。
model.compile(optimizer='adam',
loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
metrics=['accuracy'])
8.训练模型
#向模型馈送数据
model.fit(train_images, train_labels, epochs=10)
#评估准确率
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print('\nTest accuracy:', test_acc)
9.预测
#附加一个softmax层,将logits转换成概率
probability_model = tf.keras.Sequential([model,
tf.keras.layers.Softmax()])
predictions = probability_model.predict(test_images)
np.argmax(predictions[0])#置信度最大的标签
test_labels[0]#检查测试标签发现这个分类是正确的
10.使用图表验证预测结果
def plot_image(i, predictions_array, true_label, img):
predictions_array, true_label, img = predictions_array, true_label[i], img[i]
plt.grid(False)
plt.xticks([])
plt.yticks([])
plt.imshow(img, cmap=plt.cm.binary)
predicted_label = np.argmax(predictions_array)
if predicted_label == true_label:
color = 'blue'
else:
color = 'red'
plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
100*np.max(predictions_array),
class_names[true_label]),
color=color)
def plot_value_array(i, predictions_array, true_label):
predictions_array, true_label = predictions_array, true_label[i]
plt.grid(False)
plt.xticks(range(10))
plt.yticks([])
thisplot = plt.bar(range(10), predictions_array, color="#777777")
plt.ylim([0, 1])
predicted_label = np.argmax(predictions_array)
thisplot[predicted_label].set_color('red')
thisplot[true_label].set_color('blue')
#第 0 个图像、预测结果和预测数组。
#正确的预测标签为蓝色,错误的预测标签为红色。数字表示预测标签的百分比(总计为 100)
i = 0
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i], test_labels)
plt.show()
i = 12
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i], test_labels)
plt.show()
11.使用训练好的模型
#使用训练好的模型对单个图像进行预测
img = test_images[8]
img = (np.expand_dims(img,0))#将图像添加到列表中
predictions_single = probability_model.predict(img)#预测这个图像的正确标签
print(predictions_single)
#置信度最大的图像预测
np.argmax(predictions_single[0])