————————————————————————————
原文发表于夏木青 | JoselynZhao Blog,欢迎访问博文原文。
————————————————————————————
Github源码
深度学习 | 绪论
深度学习 | 线性代数基础
深度学习 | 机器学习基础
深度学习 | 实践方法论
深度学习 | 应用
深度学习 | 安装conda、opencv、pycharm以及相关问题
深度学习 | 工具及实践(TensorFlow)
深度学习 | TensorFlow 命名机制和变量共享、变量赋值与模型封装
深度学习 | TFSlim介绍
深度学习 | TensorFlow可视化
深度学习 | 训练及优化方法
深度学习 | 模型评估与梯度下降优化
深度学习 | 物体检测
深度学习| 实战1-python基本操作
深度学习 | 实战2-TensorFlow基础
深度学习 | 实战3-设计变量共享网络进行MNIST分类
深度学习 | 实战4-将LENET封装为class,并进行分类
深度学习 | 实战5-用slim 定义Lenet网络,并训练测试
深度学习 | 实战6-利用tensorboard实现卷积可视化
深度学习 | 实战7- 连体网络MINIST优化
深度学习 | 实战8 - 梯度截断
深度学习 | 实战9- 参数正则化
设计变量共享网络进行MNIST分类:
网络结构如图所示:
其将图片样本分为上下两半X1,X2;分别送入input1,input2。后续的两个路径的线性加权模块 X_W=X*W 共享一个变量 name=‘w’
整个分类模型可描述为 softmax( X_W(X1)+X_W(X2)+b)
模型及流程可以参考我们课件part1上最后的那个一层全连接分MNIST的代码例子
要求:1. 线性加权模块 X_W需定义为一个函数,在此函数中创建并共享变量W name=‘w’
函数X_W(X)只有一个输入参数X
W必须在X_W(X)中用get_variable定义
def X_W(X)
...
return tf.matmul(X,W)
预期结果:
训练精度大概最后在0.85左右
共享变量可视化:
提交:1. 文档(训练过程截图,训练、测试精度等)。2. 代码
X_W函数定义
图 1
返回W是为了后面获得W的可视化图像。
共迭代了10000轮,每500轮输出一次准确率结果。
W的图像输出 测试了很多种排版,最后选择了5*2,这样子看起来比较清晰直观。
if __name__ =="__main__":
mnist = input_data.read_data_sets('../../../data/mnist', one_hot=True)
tf.logging.set_verbosity(old_v)
def X_W(x):
with tf.variable_scope("X_W",reuse = tf.AUTO_REUSE):
W = tf.get_variable("w",[392,10])
y = tf.matmul(x,W)
return W,y
input1 = tf.placeholder(dtype='float',shape=[None,392])
input2 = tf.placeholder(dtype='float',shape=[None,392])
# x = tf.placeholder(dtype='float',shape=[None,784])
# w = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
_,y1 = X_W(input1)
weight,y2 = X_W(input2)
y = tf.nn.softmax(y1+y2+b)
y_ = tf.placeholder(dtype='float',shape=[None,10])
cross_entropy = -tf.reduce_sum(y_ * tf.log(y))
train_step = tf.train.GradientDescentOptimizer(learning_rate=0.005).minimize(cross_entropy)
#准确率
correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, 'float'))
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
step = 10000
batch_size = 64
# loss_list = []
for i in range(step):
batch_xs,batch_ys = mnist.train.next_batch(batch_size)
_,loss,w= sess.run([train_step,cross_entropy,weight],feed_dict={input1:batch_xs[:,0:392],input2:batch_xs[:,392:784],y_:batch_ys})
if i % 500 ==1:
acc = sess.run(accuracy,feed_dict={input1:mnist.test.images[:,0:392],input2:mnist.test.images[:,392:784],y_:mnist.test.labels})
print("%5d: accuracy is: %4f" % (i, acc))
print('[accuracy,loss]:',sess.run([accuracy,cross_entropy],feed_dict={input1:mnist.test.images[:, 0:392],input2:mnist.test.images[:, 392:784],y_:mnist.test.labels}))
w = np.array(w)
font1 = {'family': 'Times New Roman',
'weight': 'normal',
'size': 7,}
matplotlib.rc('font', **font1)
plt.figure()
for i in range(10):
weight = w[:,i]
weight = np.reshape(weight,[14,28])
plt.subplot(5,2,i)
plt.title(i)
plt.imshow(weight)
plt.savefig('./save/weight.png')
plt.show()