Tensorflow笔记 3.3 反向传播

概念

反向传播

训练模型参数,在所有参数上使用梯度下降,使NN模型在训练数据上的损失函数最小。

损失函数

预测值与已知答案的差距。

均方误差

    loss = tf.reduce_mean(tf.square(y_-y))

反向传播的训练方法

三种方式,见代码。

学习率

参数更新幅度。

实战loss

#coding:utf-8
#0导入模块,生成模拟数据集。
import tensorflow as tf
import numpy as np
BATCH_SIZE = 8
seed = 23455

#基于seed产生随机数
rng = np.random.RandomState(seed)
#随机数返回32行2列的矩阵 表示32组 体积和重量 作为输入数据集
X = rng.rand(32,2)
#从X这个32行2列的矩阵中 取出一行 判断如果和小于1 给Y赋值1 如果和不小于1 给Y赋值0
#作为输入数据集的标签(正确答案)
Y = [[int(x0 + x1 < 1)] for (x0, x1) in X]
print("X:\n",X)
print("Y:\n",Y)

#1定义神经网络的输入、参数和输出,定义前向传播过程。
x = tf.placeholder(tf.float32, shape=(None, 2))
y_= tf.placeholder(tf.float32, shape=(None, 1))

w1 = tf.Variable(tf.random_normal([2,3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3,1], stddev=1, seed=1))

a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

#2定义损失函数及反向传播方法。
loss = tf.reduce_mean(tf.square(y-y_))
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(loss)
#train_step = tf.train.MomentumOptimizer(0.001,0.9).minimize(loss)
#train_step = tf.train.AdamOptimizer(0.001).minimize(loss)

#3生成会话,训练STEPS轮
with tf.Session() as sess:
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    # 输出目前(未经训练)的参数取值。
    print("w1:\n", sess.run(w1))
    print("w2:\n", sess.run(w2))
    print("\n")

    # 训练模型。
    STEPS = 3000
    for i in range(STEPS):
        start = (i*BATCH_SIZE) % 32
        end = start + BATCH_SIZE
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
        if i % 500 == 0:
            total_loss = sess.run(loss, feed_dict={x: X, y_: Y})
            print("After %d training step(s), loss on all data is %g" % (i, total_loss))

    # 输出训练后的参数取值。
    print("\n")
    print("w1:\n", sess.run(w1))
    print("w2:\n", sess.run(w2))

2500轮:
GradientDescentOptimizer:0.390597
MomentumOptimizer:0.383561
AdamOptimizer:0.383676

20000轮:
GradientDescentOptimizer:0.383561
MomentumOptimizer:0.383561
AdamOptimizer:0.383561

在当前数据下,极限为0.383561,调小学习率无效,MomentumOptimizer运行较快,调到10组数据后,原学习率/2的学习率会震荡,表明学习率过大,学习率再次减小10倍后,21000次左右为最小值,仍震荡,再次减小10倍后,2e5次迭代未出最小值,懒得试了,为0.38377。

你可能感兴趣的:(Tensorflow笔记 3.3 反向传播)