2018-08-06 建造我们的第一个神经网络

一、添加层add_layer

  在 Tensorflow 里定义一个添加层的函数可以很容易的添加神经层,为之后的添加省下不少时间。神经层里常见的参数通常有weights、biases和激励函数。
  定义添加神经层的函数def add_layer(),它有四个参数:输入值、输入的大小、输出的大小和激励函数,我们设定默认的激励函数是None。

def add_layer(inputs, in_size, out_size, activation_function=None):

  接下来是weights和biases。
  因为在生成初始参数时,随机变量(normal distribution)会比全部为0要好很多,所以我们这里的weights为一个in_size行, out_size列的随机变量矩阵。

Weights = tf.Variable(tf.random_normal([in_size, out_size]))

  在机器学习中,biases的推荐值不为0,所以我们这里是在0向量的基础上又加了0.1。

biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)

  下面,我们定义xW_plus_b, 即神经网络未激活的值。其中,tf.matmul()是矩阵的乘法。

xW_plus_b= tf.matmul(inputs, Weights) + biases

  当activation_function——激励函数为None时,输出就是当前的预测值——xW_plus_b,不为None时,就把Wx_plus_b传到activation_function()函数中得到输出。

if activation_function is None:
        outputs = xW_plus_b
    else:
        outputs = activation_function(xW_plus_b)

return outputs

参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-1-add-layer/

二、建造神经网络

  1. 导入数据
      这里的x_data和y_data并不是严格的一元二次函数的关系,因为我们多加了一个noise,这样看起来会更像真实情况。
x_data = np.linspace(-1,1,300, dtype=np.float32)[:, np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)
y_data = np.square(x_data) - 0.5 + noise

  利用占位符定义我们所需的神经网络的输入。 tf.placeholder()就是代表占位符,这里的None代表无论输入有多少都可以,因为输入只有一个特征,所以这里是1。

xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])

  接下来就可以开始定义神经层了。 通常神经层都包括输入层、隐藏层和输出层。这里的输入层只有一个属性, 所以我们就只有一个输入;隐藏层我们可以自己假设,这里我们假设隐藏层有10个神经元; 输出层和输入层的结构是一样的,所以我们的输出层也是只有一层。 所以,我们构建的是——输入层1个、隐藏层10个、输出层1个的神经网络。
  利用之前的add_layer()函数定义隐藏层,这里使用 Tensorflow 自带的激励函数tf.nn.relu。

l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)

  接着,定义输出层。此时的输入就是隐藏层的输出——l1,输入有10个神经元(隐藏层的输出层),输出有1个神经元。

prediction = add_layer(l1, 10, 1, activation_function=None)

  计算预测值prediction和真实值的误差,对二者差的平方取平均。

loss = tf.reduce_mean(tf.square(ys - prediction),
                     reduction_indices=[1])

  接下来,是很关键的一步,如何让机器学习提升它的准确率。tf.train.GradientDescentOptimizer()中的值通常都小于1,这里取的是0.1,代表以0.1的效率来最小化误差loss。

train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

  定义Session,并用 Session 来执行初始化步骤。 (注意:在tensorflow中,只有session.run()才会执行我们定义的运算。)

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
for i in range(1000):
    # training
    sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
    if i % 50 == 0:
        # to see the step improvement
        print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))

参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-2-create-NN/

三、结果可视化

  构建图形,用散点图描述真实数据之间的关系。 (注意:这里是直接在前面的基础上写的代码,需要from matplot import pyplot as plt,plt.ion()表示开启交互模式,用于连续显示。)

# plot the real data
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(x_data, y_data)
plt.ion() #本次运行请注释,全局运行不要注释
plt.show()

  接下来,我们来显示预测数据。每隔50次训练刷新一次图形,用红色、宽度为5的线来显示我们的预测数据和输入之间的关系,并暂停0.1s。

for i in range(1000):
    # training
    sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
    if i % 50 == 0:
        # to visualize the result and improvement
        try:
            ax.lines.remove(lines[0])
        except Exception:
            pass
        prediction_value = sess.run(prediction, feed_dict={xs: x_data})
        # plot the prediction
        lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
        plt.pause(0.1)

参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-3-visualize-result/

四、优化器

  Tensorflow 中的优化器会有很多不同的种类。最基本, 也是最常用的一种就是GradientDescentOptimizer。一般比较常用的是MomentumOptimizer和AdamOptimizer。另外,Alpha Go使用的优化器是RMSPropOptimizer。


https://www.tensorflow.org/versions/r0.11/api_docs/python/train.html

你可能感兴趣的:(2018-08-06 建造我们的第一个神经网络)