Tensorflow入門--Mnist手寫識別

終於下定決心了,我要學Tensorflow!

好比HelloWorld之于編程入門,對於複雜而神秘的Tensorflow世界,Mnist手寫識別問題是一個不錯的入門。訓練所需的數據集不大,算法對計算機性能要求不高,即使是我的三代i3 CPU、4G內存、老舊機械硬盤也可以順利運行。

首先,我們先輸入以下代碼來下載數據集:

#下載MNIST手寫數字訓練數據集
import tensorflow.examples.tutorials.mnist.input_data as input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

本來的話,靠這兩行代碼就可以下載到數據集。然而,TensorFlow是谷歌的……
擋路的我們繞著走。作為墻內的程序員,必須隨時做好**的準備。
將文件%appdata%\Local\Programs\Python\Python35\Lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py的第38行改為:

DEFAULT_SOURCE_URL = 'https://yann.lecun.com/exdb/mnist/' #修改為鏡像地址

試試看,果然可以。速度還是蠻快的。於是可以繼續折騰了。

import tensorflow as tf
x = tf.placeholder(tf.float32, [None, 784]) 

什麼是placeholder?placeholder(佔位符),表示Tensorflow中的任意量。與模型的變量Variable相區別,佔位符的值是從外部輸入的。
在這裡,我們以圖像作為輸入,符號為x。由於圖像的數目是任意的,故張量的行數用“None”來表示。一幅圖像被展開為784維的向量,因此x為784列。

W = tf.Variable(tf.zeros([784, 10])) #權重
b = tf.Variable(tf.zeros([10])) #偏置
y = tf.nn.softmax(tf.matmul(x, W) + b) #機器的預測
y_ = tf.placeholder(tf.float32, [None, 10]) #標準答案
cross_entropy = -tf.reduce_sum(y_ * tf.log(y)) #計算交叉熵

模型很簡單。輸入x與權重W相乘后,加上偏置b,結果經過softmax函數處理就得到了輸出y。(由於我們只識別10種阿拉伯數字,因此對應的權重的列數為10。)很顯然,當輸入一幅圖時,輸出y的尺寸為一行十列。我們認為y中最大值的位置表示機器所識別出的數字。
我們希望能找到一組不錯的權重和偏置,使得模型能準確識別輸入圖像,這里使用梯度下降法。

train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy) #梯度下降
init = tf.initialize_all_variables() #變量一定要初始化后才能使用
sess = tf.Session()
sess.run(init)

通過以上代碼,我們順利定義了模型并初始化。接下來就可以開始訓練了。

for i in range(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100) #每次訓練使用100個樣本
    sess.run(train_step, feed_dict = {x: batch_xs, y_: batch_ys}) #訓練

最後我們可以評估模型。前面說過張量y中最大值的位置即是模型的預測值,我們可以使用argmax函數獲取最大值的位置。令argmax的第二個參數為1,表示在行方向尋找最大值。

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1)) 
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
print("accuracy:%f"%(sess.run(accuracy, feed_dict={x: mnist.test.images, y_:mnist.test.labels})))

由於模型比較簡單,所以準確率並不高,在91%左右。

你可能感兴趣的:(Tensorflow入門--Mnist手寫識別)