这段时间在学习Tensorflow,刚刚认识到基于tensorflow的高级框架keras,为我们提供了很方便的网络搭建、训练,模型保存和加载的操作。
于是一直跃跃欲试的我,用它训练了一个3层的BP神经网络,然后自己手绘了一张图片,通过Opencv和numpy的一些处理手段之后,编程网络可以输入的1x784的格式后,输入网络进行测试,结果可喜可贺,终于是我写的什么,就被识别为什么了,那么接下来跟大家分享一下代码:
注意不仅仅安装了tensorflow和Python3.5就可以跑了哦,还需要keras的包,opencv的包,具体的操作都是用pip来安装的:
pip install keras
pip install opencv-contrib-python
整个代码分为两个.py文件,一个是用来训练和保存模型的(keras_mnist_test.py),另一个是用来导入训练好的模型和测试图片去测试的(load_predict.py),大家也可以自己制作一些手写数字图片放进去测试
keras_mnist_test.py内容如下:
import os
from tensorflow.examples.tutorials.mnist import *
from keras.models import *
from keras.layers import *
# 屏蔽waring信息
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
"""----------加载mnist数据集-------------"""
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
trX, trY, teX, teY = mnist.train.images, mnist.train.labels, mnist.test.images, mnist.test.labels
"""----------配置网络模型----------------"""
# 配置网络结构
model=Sequential()
# 第一隐藏层的配置:输入784,输出100
model.add(Dense(100,input_dim=784))
model.add(Activation("relu"))
model.add(Dropout(0.5))
# 第二隐藏层的配置:输入100,输出100
model.add(Dense(100))
model.add(Activation("relu"))
model.add(Dropout(0.5))
# 输出层的配置:输入100,输出10,用了softmax的输出层结构
model.add(Dense(10))
model.add(Activation("softmax"))
# 编译模型,指明代价函数和更新方法
model.compile(loss='categorical_crossentropy',optimizer='adadelta',metrics=['accuracy'])
"""----------训练模型--------------------"""
print("training starts.....")
model.fit(trX,trY,epochs=20,batch_size=20)
"""----------评估模型--------------------"""
# 用测试集去评估模型的准确度
accuracy=model.evaluate(teX,teY,batch_size=20)
print('\nTest accuracy:',accuracy[1])
"""----------模型存储--------------------"""
save_model(model,'my_model')
import os
import cv2
import numpy as np
from keras.models import load_model
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
"""---------载入已经训练好的模型---------"""
new_model = load_model('my_model')
"""---------用opencv载入一张待测图片-----"""
# 载入图片
src = cv2.imread('4.png')
cv2.imshow("待测图片", src)
# 将图片转化为28*28的灰度图
src = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)
dst = cv2.resize(src, (28, 28), interpolation=cv2.INTER_CUBIC)
# 将灰度图转化为1*784的能够输入的网络的数组
picture = np.zeros((1, 784))
for i in range(0, 28):
for j in range(0, 28):
picture[0][28 * i + j] = (255 - dst[i][j])
# 用模型进行预测
y = new_model.predict(picture)
result = np.argmax(y)
print("待测的数字是:", result)
cv2.waitKey(20170731)