笔记:TensorFlow实现机器学习算法的步骤

核心步骤:

(1)定义算法公式,也就是神经网络前向运行时的计算;

(2)定义loss,选定optimizer,使用优化器优化loss;

比如采用cross_entropy来计算loss,优化器用随机梯度下降:

cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction),
                                              reduction_indices=[1]))       

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

(3)开启迭代的数据训练操作

比如写个for循环,分批次将训练数据灌入。参见下文代码49~55行。

(4)计算准确率,做出评测。

比如下文例子中,我们定义了def compute_accuracy(v_xs, v_ys)。

【例】TensorFlow实现手写数字识别

自己编写的代码,亲测可以运行(2018年10月10日,python3.6+tensorflow),其中写了详尽的注释帮助理解。

网络上关于这个话题有很多博文了,但有些博文中代码可能跑不通,或也是参考《TensorFlow实战》一书中的实例来的。

 
'''python3+tensorflow
用最浅的神经网络实现手写数字的识别'''


import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data  #导入官方提供的数据

# number 1 to 10 data 如果没有会去下载下来
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

def add_layer(inputs, in_size, out_size, activation_function=None,):
    # add one more layer and return the output of this layer
    Weights = tf.Variable(tf.random_normal([in_size, out_size]))
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1,)
    Wx_plus_b = tf.matmul(inputs, Weights) + biases
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b,)
    return outputs

def compute_accuracy(v_xs, v_ys):
    global prediction
    y_pre = sess.run(prediction, feed_dict={xs: v_xs})
    correct_prediction = tf.equal(tf.argmax(y_pre,1), tf.argmax(v_ys,1)) #tf.argmax是寻找一个tensor中最大值的序号
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) #用tf.cast将之前correct_prediction的BOOL强转为float32 再求平均
    result = sess.run(accuracy, feed_dict={xs: v_xs, ys: v_ys})
    return result

# define placeholder for inputs to network
xs = tf.placeholder(tf.float32, [None, 784]) # 规定每一个sample的特征是28x28=784个变量,每个手写字体sample行改写成列
ys = tf.placeholder(tf.float32, [None, 10])

# add output layer 这是一个没有隐含层的最浅的机器学习的神经网络
prediction = add_layer(xs, 784, 10,  activation_function=tf.nn.softmax)
#sofrmax常常用来用来做多分类。

# the error between prediction and real data
# cross_entropy就是它的loss 和softmax搭配的一种loss计算方法
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction),
                                              reduction_indices=[1]))       
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

sess = tf.Session()
# important step
sess.run(tf.initialize_all_variables())

for i in range(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100) #提取出一部分的数据集xs和ys
    #(分批次训练降低计算量,减少耗时,也能避免陷入局部最优 )
    sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys})
    if i % 50 == 0:
        print(compute_accuracy(
            mnist.test.images, mnist.test.labels))

 

你可能感兴趣的:(深度学习)