TensorFlow 是谷歌开源的机器学习框架,相对于其它现有框架来说,其具有比较好的扩展性,但是也牺牲了它的速度。
下面介绍Tensorflow 的基本使用:
import tensorflow as tf
import numpy as np
a = tf.placeholder("float") # 创建符号变量
b = tf.placeholder("float")
y = tf.mul(a, b) # 乘法操作,作用在符号变量上。
sess = tf.Session() # 创建会话,计算符号变量表达式
a1 = 4
b1 = 5
print "%f + %f = %f"%(4, 5, sess.run(y, feed_dict={a: a1, b: b1})
模型:
# 生成训练数据 + 噪声,下面为了拟合 $$ Y = 2X $$
trX = np.linspace(-1, 1, 101)
trY = 2 * trX + np.random.randn(*trX.shape) * 0.33 # y=2x,但是加入了噪声
X = tf.placeholder("float") #输入输出符号变量
Y = tf.placeholder("float")
# 定义模型
def model(X, w):
return tf.mul(X, w) # 线性回归只需要调用乘法操作即可。
# 模型权重 W 用变量表示
w = tf.Variable(0.0, name="weights") # 共享变量
y_model = model(X, w)
# 定义损失函数
cost = (tf.pow(Y-y_model, 2)) # 平方损失函数
# 构建优化器,最小化损失函数。
train_op = tf.train.GradientDescentOptimizer(0.01).minimize(cost)
# 构建会话
sess = tf.Session()
# 初始化所有的符号共享变量
init = tf.initialize_all_variables()
# 运行会话
sess.run(init)
# 迭代训练
for i in range(100):
for (x, y) in zip(trX, trY):
sess.run(train_op, feed_dict={X: x, Y: y})
# 打印权重w
print(sess.run(w))
模型:
# 初始化权重w
def init_weights(shape):
return tf.Variable(tf.random_normal(shape, stddev=0.01))
# 定义模型
def model(X, w):
return tf.matmul(X, w)
# 获取mnist 数据
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
trX, trY, teX, teY = mnist.train.images, mnist.train.labels, mnist.test.images, mnist.test.labels
# 定义占位符变量
X = tf.placeholder("float", [None, 784])
Y = tf.placeholder("float", [None, 10])
w = init_weights([784, 10])
py_x = model(X, w)
# 定义损失函数,交叉熵损失函数
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(py_x, Y))
# 训练操作,最小化损失函数
train_op = tf.train.GradientDescentOptimizer(0.05).minimize(cost)
# 预测操作,
predict_op = tf.argmax(py_x, 1)
# 定义会话
sess = tf.Session()
init = tf.initialize_all_variables()
sess.run(init)
# 调用多次梯度下降
for i in range(100):
# 训练,每个batch,
for start, end in zip(range(0, len(trX), 128), range(128, len(trX), 128)):
sess.run(train_op, feed_dict={X: trX[start:end], Y: trY[start:end]})
# 测试,每个epoch
print i, np.mean(np.argmax(teY, axis=1) ==
sess.run(predict_op, feed_dict={X: teX, Y: teY}))
参考:
Tensorflow基本教程[https://github.com/nlintz/TensorFlow-Tutorials]