終於下定決心了,我要學Tensorflow!
好比HelloWorld之于編程入門,對於複雜而神秘的Tensorflow世界,Mnist手寫識別問題是一個不錯的入門。訓練所需的數據集不大,算法對計算機性能要求不高,即使是我的三代i3 CPU、4G內存、老舊機械硬盤也可以順利運行。
首先,我們先輸入以下代碼來下載數據集:
#下載MNIST手寫數字訓練數據集
import tensorflow.examples.tutorials.mnist.input_data as input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
本來的話,靠這兩行代碼就可以下載到數據集。然而,TensorFlow是谷歌的……
擋路的墻我們繞著走。作為墻內的程序員,必須隨時做好**的準備。
將文件%appdata%\Local\Programs\Python\Python35\Lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py的第38行改為:
DEFAULT_SOURCE_URL = 'https://yann.lecun.com/exdb/mnist/' #修改為鏡像地址
試試看,果然可以。速度還是蠻快的。於是可以繼續折騰了。
import tensorflow as tf
x = tf.placeholder(tf.float32, [None, 784])
什麼是placeholder?placeholder(佔位符),表示Tensorflow中的任意量。與模型的變量Variable相區別,佔位符的值是從外部輸入的。
在這裡,我們以圖像作為輸入,符號為x。由於圖像的數目是任意的,故張量的行數用“None”來表示。一幅圖像被展開為784維的向量,因此x為784列。
W = tf.Variable(tf.zeros([784, 10])) #權重
b = tf.Variable(tf.zeros([10])) #偏置
y = tf.nn.softmax(tf.matmul(x, W) + b) #機器的預測
y_ = tf.placeholder(tf.float32, [None, 10]) #標準答案
cross_entropy = -tf.reduce_sum(y_ * tf.log(y)) #計算交叉熵
模型很簡單。輸入x與權重W相乘后,加上偏置b,結果經過softmax函數處理就得到了輸出y。(由於我們只識別10種阿拉伯數字,因此對應的權重的列數為10。)很顯然,當輸入一幅圖時,輸出y的尺寸為一行十列。我們認為y中最大值的位置表示機器所識別出的數字。
我們希望能找到一組不錯的權重和偏置,使得模型能準確識別輸入圖像,這里使用梯度下降法。
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy) #梯度下降
init = tf.initialize_all_variables() #變量一定要初始化后才能使用
sess = tf.Session()
sess.run(init)
通過以上代碼,我們順利定義了模型并初始化。接下來就可以開始訓練了。
for i in range(1000):
batch_xs, batch_ys = mnist.train.next_batch(100) #每次訓練使用100個樣本
sess.run(train_step, feed_dict = {x: batch_xs, y_: batch_ys}) #訓練
最後我們可以評估模型。前面說過張量y中最大值的位置即是模型的預測值,我們可以使用argmax函數獲取最大值的位置。令argmax的第二個參數為1,表示在行方向尋找最大值。
correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
print("accuracy:%f"%(sess.run(accuracy, feed_dict={x: mnist.test.images, y_:mnist.test.labels})))
由於模型比較簡單,所以準確率並不高,在91%左右。