3、mini-batch based SGD:其实是上两个的折中办法,实际中常用。
https://zhuanlan.zhihu.com/p/23932714 https://www.cnblogs.com/Anita9002/p/9296014.html
PS C:\Users\jp\Desktop> nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:04_Central_Daylight_Time_2018
Cuda compilation tools, release 10.0, V10.0.130
PS C:\Users\jp\Desktop> python
>>> import tensorflow as tf
>>> print(sess.run(hello))
anaconda:no module named cv2
只能自己去官网 https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv
然后放进 D:\CUDA\anaconda\Lib\site-packages
打开Anaconda Prompt命令行进行安装pip install xxx.whl 即可。
这个网页我觉得博主写得很好:https://www.cnblogs.com/wanyu416/category/1289418.html 建议大家去看。
我是跟着他写的过程边看边操作边想的,特别是这一篇 https://www.cnblogs.com/wanyu416/p/9009985.html
Created on Tue Sep 3 14:15:55 2019
@author: jp
import tensorflow as tf
#const and tensor declaration
#init variables
#create session
#op and tensor can only return results only in session
with tf.Session() as sess:
#a +1 for 5 times
with tf.Session() as sess:
for i in range(5):
#run more than one ops
input1 = tf.constant(3.0)
input2 = tf.constant(2.0)
input3 = tf.constant(5.0)
add = tf.add(input2,input3)
mul = tf.multiply(input1,add)
with tf.Session() as sess:
result = sess.run([mul,add])#顺序对结果是有关系的
result2 = sess.run([add,mul])
input1 = tf.placeholder(tf.float32) # 使用placeholder()占位,需要提供类型
input2 = tf.placeholder(tf.float32)
output = tf.multiply(input1,input2)
# 以字典形式输入feed_dict
with tf.Session() as sess:
# 表示生成正态分布随机数,形状两行三列,标准差是2,均值是0,随机种子是1
w=tf.Variable(tf.random_normal([2,3],stddev=2, mean=0, seed=1))
w=tf.Variable(tf.Truncated_normal([2,3],stddev=2, mean=0, seed=1))
# 表示从一个均匀分布[minval maxval)中随机采样,产生的数是均匀分布的,
#注意定义域是左闭右开,即包含 minval,不包含 maxval。
allzero=tf.zeros([3,2],tf.int32) # 表示生成[[0,0],[0,0],[0,0]]
allone=tf.ones([3,2],tf.int32) # 表示生成[[1,1],[1,1],[1,1]
all6=tf.fill([3,2],6) # 表示生成[[6,6],[6,6],[6,6]]
constvalues=tf.constant([3,2,1]) # 表示生成[3,2,1]
#用placeholder 实现输入定义(sess.run 中喂入一组数据)的情况,特征有体积和重量
# placeholder占位,首先要指定数据类型,然后可以指定形状,因为我们现在只需要占一组数据,且有两个特征值,所以shape为(1,2)
x = tf.placeholder(tf.float32,shape=(1,2))
w1 = tf.Variable(tf.random_normal([2,3],stddev=1,seed=1)) # 生成权重
w2 = tf.Variable(tf.random_normal([3,1],stddev=1,seed=1))
a = tf.matmul(x,w1) # 矩阵乘法op
y = tf.matmul(a,w2)
with tf.Session() as sess:
init = tf.global_variables_initializer() # 初始化以后就放在这里,不容易忘记
print("y is",sess.run(y,feed_dict={x:[[0.7,0.5]]}))
# 以字典形式给feed_dict赋值,赋的是一个一行两列的矩阵,注意张量的阶数。
#用 placeholder 实现输入定义(sess.run 中喂入多组数据)的情况
x=tf.placeholder(tf.float32,shape=(None,2)) # 这里占位因为不知道要输入多少组数据,但还是两个特征,所以shape=(None,2),注意大小写
with tf.Session() as sess:
print("y is:",sess.run(y,feed_dict={x:[[0.7,0.5],
[0.4,0.5]]})) # 输入数据,4行2列的矩阵
# =============================================================================
# 反向传播训练方法: 以减小 loss 值为优化目标。
# 一般有梯度下降、 momentum 优化器、 adam 优化器等优化方法。这三种优化方法用 tensorflow 的函数可以表示为:
# train_step=tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)
# train_step=tf.train.MomentumOptimizer(learning_rate, momentum).minimize(loss)
# train_step=tf.train.AdamOptimizer(learning_rate).minimize(loss)
# =============================================================================
#训练 3000 轮,每 500 轮输出一次损失函数
BATCH_SIZE = 8 # 一次输入网络的数据,称为batch。一次不能喂太多数据
SEED = 23455 # 产生统一的随机数
# 基于seed产生随机数,这是根据随机种子产生随机数的一种常用方法,要熟练运用
rdm = np.random.RandomState(SEED)
# 随机数返回32行2列的矩阵 表示32组 体积和重量 作为输入数据集。因为这里没用真实的数据集,所以这样操作。
X = rdm.rand(32, 2)
# 从X这个32行2列的矩阵中 取出一行 判断如果和小于1 给Y赋值1 如果和不小于1 给Y赋值0 (这里只是人为的定义),作为输入数据集的标签(正确答案)
Y_ = [[int(x0 + x1 < 1)] for (x0, x1) in X]
print("X:\n", X)
# 1定义神经网络的输入、参数和输出,定义前向传播过程。
x = tf.placeholder(tf.float32, shape=(None, 2))
y_ = tf.placeholder(tf.float32, shape=(None, 1))
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)
# 2定义损失函数及反向传播方法。
loss = tf.reduce_mean(tf.square(y - y_))
train_step = tf.train.GradientDescentOptimizer(0.001).minimize(loss) # 三种优化方法选择一个就可以
# train_step = tf.train.MomentumOptimizer(0.001,0.9).minimize(loss_mse)
# train_step = tf.train.AdamOptimizer(0.001).minimize(loss_mse)
# 3生成会话,训练STEPS轮
with tf.Session() as sess:
init = tf.global_variables_initializer()
# 输出目前(未经训练)的参数取值。
print("w1:\n", sess.run(w1))
print("w2:\n", sess.run(w2))
# 训练模型。
STEPS = 3000
for i in range(STEPS): #0-2999
start = (i * BATCH_SIZE) % 32 #i=0,start=0,end=8;i=1,start=8,end=16;i=2,start=16,end=24;i=3,start=24,end=32;i=4,start=0,end=8。也就是说每次训练8组数据,一共训练3000次。
end = start + BATCH_SIZE
sess.run(train_step, feed_dict={x: X[start:end], y_: Y_[start:end]})
if i % 500 == 0:
total_loss = sess.run(loss, feed_dict={x: X, y_: Y_})
print("After %d training step(s), loss on all data is %g"%(i,total_loss))
# 输出训练好的参数。
print("w1:\n", sess.run(w1))
print("w2:\n", sess.run(w2))
特别是 https://www.cnblogs.com/wanyu416/p/9012405.html 非常推荐,可惜后面再没有继续更新了。很佩服这个博主,讲解得很好。