Tensorflow入門--Mnist手寫識別

終於下定決心了，我要學Tensorflow！

好比HelloWorld之于編程入門，對於複雜而神秘的Tensorflow世界，Mnist手寫識別問題是一個不錯的入門。訓練所需的數據集不大，算法對計算機性能要求不高，即使是我的三代i3 CPU、4G內存、老舊機械硬盤也可以順利運行。

首先，我們先輸入以下代碼來下載數據集：

#下載MNIST手寫數字訓練數據集
import tensorflow.examples.tutorials.mnist.input_data as input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

本來的話，靠這兩行代碼就可以下載到數據集。然而，TensorFlow是谷歌的……
擋路的墻我們繞著走。作為墻內的程序員，必須隨時做好**的準備。
將文件%appdata%\Local\Programs\Python\Python35\Lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py的第38行改為：

DEFAULT_SOURCE_URL = 'https://yann.lecun.com/exdb/mnist/' #修改為鏡像地址

試試看，果然可以。速度還是蠻快的。於是可以繼續折騰了。

import tensorflow as tf
x = tf.placeholder(tf.float32, [None, 784])

什麼是placeholder？placeholder（佔位符），表示Tensorflow中的任意量。與模型的變量Variable相區別，佔位符的值是從外部輸入的。
在這裡，我們以圖像作為輸入，符號為x。由於圖像的數目是任意的，故張量的行數用“None”來表示。一幅圖像被展開為784維的向量，因此x為784列。

W = tf.Variable(tf.zeros([784, 10])) #權重
b = tf.Variable(tf.zeros([10])) #偏置
y = tf.nn.softmax(tf.matmul(x, W) + b) #機器的預測
y_ = tf.placeholder(tf.float32, [None, 10]) #標準答案
cross_entropy = -tf.reduce_sum(y_ * tf.log(y)) #計算交叉熵

模型很簡單。輸入x與權重W相乘后，加上偏置b，結果經過softmax函數處理就得到了輸出y。（由於我們只識別10種阿拉伯數字，因此對應的權重的列數為10。）很顯然，當輸入一幅圖時，輸出y的尺寸為一行十列。我們認為y中最大值的位置表示機器所識別出的數字。
我們希望能找到一組不錯的權重和偏置，使得模型能準確識別輸入圖像，這里使用梯度下降法。

train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy) #梯度下降
init = tf.initialize_all_variables() #變量一定要初始化后才能使用
sess = tf.Session()
sess.run(init)

通過以上代碼，我們順利定義了模型并初始化。接下來就可以開始訓練了。

for i in range(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100) #每次訓練使用100個樣本
    sess.run(train_step, feed_dict = {x: batch_xs, y_: batch_ys}) #訓練

最後我們可以評估模型。前面說過張量y中最大值的位置即是模型的預測值，我們可以使用argmax函數獲取最大值的位置。令argmax的第二個參數為1，表示在行方向尋找最大值。

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1)) 
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
print("accuracy:%f"%(sess.run(accuracy, feed_dict={x: mnist.test.images, y_:mnist.test.labels})))

由於模型比較簡單，所以準確率並不高，在91%左右。

Tensorflow入門--Mnist手寫識別

終於下定決心了，我要學Tensorflow！

你可能感兴趣的:(Tensorflow入門--Mnist手寫識別)