注意:本部分的ppt来源于中国大学mooc网站:https://www.icourse163.org/learn/ZUCC-1206146808?tid=1206445215&from=study#/learn/content?type=detail&id=1211168244&cid=1213754001
#MNIST手写数字识别数据集 import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data import numpy as np import matplotlib.pyplot as plt mnist=input_data.read_data_sets("MNST_data/",one_hot=True) #了解MNIST手写数字识别数据集 print("训练集train数量:",mnist.train.num_examples, ",验证集 validation数量:",mnist.validation.num_examples, ",测试集 test 数量:",mnist.test.num_examples) print("train image shape:",mnist.train.images.shape, "labels shape:",mnist.train.labels.shape)
全部源码:
#MNIST手写数字识别数据集 import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data import numpy as np import matplotlib.pyplot as plt import os #读取相关的数据 mnist=input_data.read_data_sets("MNST_data/",one_hot=True) #定义待输入数据的占位符 #mnist中每张图片共有28*28=784个像素点 x=tf.placeholder(tf.float32,[None,784],name="X") #0-9一共10个数字====》10个类别 y=tf.placeholder(tf.float32,[None,10],name="y") #定义模型变量 ''' 在本案例中,以正态分布的随机数初始化权重W,以常数0初始化偏置b ''' #定义变量 w=tf.Variable(tf.random_normal([784,10]),name="w") b=tf.Variable(tf.zeros([10]),name="b") #用单个神经元构建神经网络 forward=tf.matmul(x,w)+b#前向计算 pred=tf.nn.softmax(forward)#softmax分类 #设置训练参数 train_epochs=100#训练轮数 batch_size=100#单次训练样本数(批次大小) total_batch=int(mnist.train.num_examples/batch_size)#一轮训练有多少批次 display_step=1#显示粒度 learning_rate=0.01#学习率 #定义损失函数(定义交叉商的损失函数) loss_function=tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1)) #梯度下降优化器 optimizer=tf.train.GradientDescentOptimizer(learning_rate).minimize(loss_function) #检查预测类别tf.argmax(ored,1)与实际类别tf.argmax(y,1)的匹配情况 correct_prediction=tf.equal(tf.argmax(pred,1),tf.argmax(y,1)) #准确率,将布尔值转化为浮点数,并计算平均值 accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32)) sess=tf.Session()#声明会话 init=tf.global_variables_initializer()#变量初始化 sess.run(init) #训练模型的保存 #储存模型的粒子 save_step=5 #创建保存模型文件的目录 ckpt_dir="./ckpt_dir/" if not os.path.exists(ckpt_dir): os.makedirs(ckpt_dir) #声明完所有 变量之后,使用tf.train.Saver() saver=tf.train.Saver() #模型训练 #开始训练 for epoch in range(train_epochs): for batch in range(total_batch): xs,ys=mnist.train.next_batch(batch_size)#读取批次数据 sess.run(optimizer,feed_dict={x:xs,y:ys})#执行批次训练 #total_batch个批次训练完成后,使用验证数据计算误差与准确率:验证没有分批 loss,acc=sess.run([loss_function,accuracy],feed_dict={x:mnist.validation.images,y:mnist.validation.labels}) #打印训练过程中的详细信息 if(epoch+1)%display_step==0: print("Train Epoch:",'%02d'%(epoch+1),"Loss=","{:.9}".format(loss),"Accuracy=","{:.4f}".format(acc)) if(epoch+1)%save_step==0: saver.save(sess,os.path.join(ckpt_dir,'mnist_h256_model_{:06d}.ckpt'.format(epoch+1))) print('mnist_h256_model_{:06d}.ckpt'.format(epoch+1)) #对训练的模型进行保存 saver.save(sess,os.path.join(ckpt_dir,'mnist_h256_model_ckpt')) print("Train Finished") #评估模型 #完成训练之后,在测试集上评估模型的准确率 def accu_test(): accu_test=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels}) print("Test Accuracy:",accu_test) def acc_validation(): #完成训练之后在验证集上评估模型的准确率 acc_validation=sess.run(accuracy,feed_dict={x:mnist.validation.images,y:mnist.validation.labels}) print("Validation Accuracy:",acc_validation) def acc_train(): #完成训练之后,在训练集上评估模型的准确率 acc_train=sess.run(accuracy,feed_dict={x:mnist.train.images,y:mnist.train.labels}) print("Train Accuracy:",acc_train) #定义数据可视化 def plot_image_labels_prediction(images,labels,prediction,index,num=10): ''' image:图像列表 labels:标签列表 prediction:预测值列表 index:从第index个开始显示 num:一次显示多少副图片,缺省的话一次显示10个 ''' fig=plt.gcf()#获取当前图表,Get Current Figure fig.set_size_inches(10,12)#1英寸等于1.54cm if num>25: num=25#设置最多显示25个子图 for i in range(0,num): ax=plt.subplot(5,5,i+1)#获取当前要处理的子图 ax.imshow(np.reshape(images[index],(28,28)),cmap="binary") title="label="+str(np.argmax(labels[index]))#构建该图上要显示的title信息 if len(prediction)>0: title+=",predict="+str(prediction[index]) ax.set_title(title,fontsize=10)#显示图上的title信息 ax.set_xticks([])#不显示坐标轴 ax.set_yticks([]) index+=1 plt.show()
独热标码:
#MNIST手写数字识别数据集 import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data import numpy as np import matplotlib.pyplot as plt mnist=input_data.read_data_sets("MNST_data/",one_hot=True) #独热编码如何取值 print(mnist.train.labels[1]) #argmax()取出独热编码中最大值的下标 print(np.argmax(mnist.train.labels[1]))