TensorFlow实现多层感知机

多层感知机

算法简介:

多层感知机是基于反向人工神经网络(feedforwardartificial neural network)。多层感知机含有多层节点,每层节点与网络的下一层节点完全连接。输入层的节点代表输入数据,其他层的节点通过将输入数据与层上节点的权重w以及偏差b线性组合且应用一个激活函数,得到该层输出。多层感知机通过方向传播来学习模型,其中我们使用逻辑损失函数以及L-BFGS。K+1层多层感知机分类器可以写成矩阵形式如下:

  • Sigmoid函数

Sigmoid函数在ReLU函数未出现前一直作为神经网络的激活函数,Sigmoid具有限制性,输出数值在0~1之间,最符合概率的定义。非线性的Sigmoid函数在信号的特征空间映射上,对中央区信号的增益较大,对两侧区的信号增益较小。

  • Sigmoid函数方程:


  • ReLU函数

相对于Sigmoid函数优势有:
- 单侧抑制
- 相对宽阔的兴奋边界
- 稀疏的激活性

多层感知机示例

#coding:utf-8
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf

#数据集加载
mnist = input_data.read_data_sets('MNIST_data/',one_hot = True)
sess = tf.InteractiveSession()

# 定义算法公式
in_units = 784
h1_units = 300
W1 = tf.Variable(tf.truncated_normal([in_units,h1_units],stddev = 0.1))
b1 = tf.Variable(tf.zeros([h1_units]))
W2 = tf.Variable(tf.zeros([h1_units,10]))
b2 = tf.Variable(tf.zeros([10]))

x = tf.placeholder(tf.float32,[None,in_units])
keep_prob = tf.placeholder(tf.float32)

hidden1 = tf.nn.relu(tf.matmul(x,W1)+b1)
hidden1_drop = tf.nn.dropout(hidden1,keep_prob)
y = tf.nn.softmax(tf.matmul(hidden1_drop,W2)+b2)

#定义损失函数和选择优化器来优化loss
y_ = tf.placeholder(tf.float32,[None,10])
cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_*tf.log(y),reduction_indices = [1]))
train_step = tf.train.AdagradOptimizer(0.3).minimize(cross_entropy)

#训练,加入keep_prop作为计算图输入,并在训练时设为0.75,保留75%的节点
tf.global_variables_initializer().run()
for i in range(3000):
    batch_xs,batch_ys = mnist.train.next_batch(100)
    train_step.run({x:batch_xs,y_:batch_ys,keep_prob:0.75})

#对模型进行评测
correnct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correnct_prediction,tf.float32))

print (accuracy.eval({x:mnist.test.images,y_:mnist.test.labels,keep_prob:1.0}))

你可能感兴趣的:(TensorFlow实现多层感知机)