tensorflow 3. 线性回归和优化器

本节例子在这里

本节例子主要计算Y=X*w + b公式里的W和b参数。优化器选用的是GradientDescentOptimizer。

我手工敲了一遍,翻译了注释,如下:

import tensorflow as tf 
import numpy
import matplotlib.pyplot as plt 
rng = numpy.random

# 超参数
learning_rate = 0.01
training_epochs = 1000
display_step = 50

# 训练数据
train_X = numpy.asarray([3.3,4.4,5.5,6.71,6.93,4.168,9.779,6.182,7.59,2.167,
                         7.042,10.791,5.313,7.997,5.654,9.27,3.1])
train_Y = numpy.asarray([1.7,2.76,2.09,3.19,1.694,1.573,3.366,2.596,2.53,1.221,
                         2.827,3.465,1.65,2.904,2.42,2.94,1.3])
n_samples = train_X.shape[0] #参数组数

# 计算图的输入节点
X = tf.placeholder('float')
Y = tf.placeholder('float')

# 初始化模型权重
W = tf.Variable(rng.randn(), name="weight")
b = tf.Variable(rng.randn(), name="bias")

# 构造一个线性模型
pred = tf.add(tf.multiply(X, W), b)

#均方误差
cost = tf.reduce_sum(tf.pow(pred-Y, 2))/(2*n_samples)
#梯度下降
#注意,minimize()将会改变W和b, 变量的trainable属性默认是True
#这里使用梯度下降法来训练参数,学习率由learning_rate指定
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

#初始化变量
init = tf.global_variables_initializer()

#开始训练
with tf.Session() as sess:
    #运行初始化动作
    sess.run(init)

    #载入训练数据
    for epoch in range(training_epochs):
        for (x, y) in zip(train_X, train_Y):
            sess.run(optimizer, feed_dict = {X:x, Y:y})

    #每过一定步数(display_step)就显示日志
    if (epoch+1) %display_step == 0:
        c = sess.run(cost, feed_dict={X:train_X, Y:train_Y})
        print('Epoch:', '%04d'%(epoch+1), 'cost=', '{:.9f}'.format(c), \
            'W=', sess.run(W), 'b=', sess.run(b), '\n')

    print('最优化训练结束')
    training_cost = sess.run(cost, feed_dict={X:train_X, Y:train_Y})
    print('training_cost=', training_cost, 'W=', sess.run(W), 'b=', sess.run(b), '\n')

    #图表显示
    plt.plot(train_X, train_Y, 'ro', label='Original data')
    plt.plot(train_X, sess.run(W)*train_X+sess.run(b), label='Fitted line')
    plt.legend()
    plt.show()

    #测试用例
    #应观众要求,增加了测试用例:https://github.com/aymericdamien/TensorFlow-Examples/issues/2
    test_X = numpy.asarray([6.83, 4.668, 8.9, 7.91, 5.7, 8.7, 3.1, 2.1])
    test_Y = numpy.asarray([1.84, 2.273, 3.2, 2.831, 2.92, 3.24, 1.35, 1.03])

    print("Testing... (Mean square loss Comparison)")
    testing_cost = sess.run(
        tf.reduce_sum(tf.pow(pred - Y, 2))/(2*test_X.shape[0]),
        feed_dict = {X:test_X, Y:test_Y}) #与上面的代价计算使用同样的函数
    print('testing cost=', testing_cost)
    print('Absolute mean square loss difference:', abs(
        training_cost - testing_cost))

    plt.plot(test_X, test_Y, 'bo', label='Testing data')
    plt.plot(train_X, sess.run(W)*train_X+sess.run(b), label='Fitted line')
    plt.legend()
    plt.show()

输出内容为:

Epoch: 1000 cost= 0.082081832 W= 0.289674 b= 0.513132 

最优化训练结束
training_cost= 0.0820818 W= 0.289674 b= 0.513132 

Testing... (Mean square loss Comparison)
testing cost= 0.0768293
Absolute mean square loss difference: 0.00525256

输出图表为: [图片上传中...(image-89f954-1521646069033-1)]

本节的新知识点主要有两块:

  • 优化器
  • matplolab画图

关于优化器这里有篇不错的文章(如何选择优化器 optimizer)

下面是tensorflow中提供的优化器 [图片上传中...(image-26b483-1521646069033-0)]

作者的结论如下:

如何选择?

如果数据是稀疏的,就用自适用方法,即 Adagrad, Adadelta, RMSprop, Adam。

RMSprop, Adadelta, Adam 在很多情况下的效果是相似的。

Adam 就是在 RMSprop 的基础上加了 bias-correction 和 momentum,

随着梯度变的稀疏,Adam 比 RMSprop 效果会好。

整体来讲,Adam 是最好的选择。

作者:不会停的蜗牛
链接:https://www.jianshu.com/p/d99b83f4c1a6
來源:
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

你可能感兴趣的:(tensorflow 3. 线性回归和优化器)