去年8月13日,谷歌宣布 “TensorFlow 2.0 is coming”,
最近几天,谷歌 TensorFlow 团队刚刚发布了 TensorFlow 2.0 Preview 版,
可以来这里查看:
现在还不是最终版本,而且可能还不太稳定,不过大家都可以开始尝试,并提出建议和反馈,请查看如何提交报告:
本文结构:
tf_upgrade_v2
,项目地址:用法举例:
!tf_upgrade_v2
# 选择 input file,输出 output file
tf_upgrade_v2 --infile foo.py --outfile foo-upgraded.py
# 将整个目录进行变换
tf_upgrade_v2 --intree coolcode --outtree coolcode-upgraded
转换后的结果会保存在 report.txt
# 创建一个名为 python36 的 Python3.6 环境
conda create -n python36 python=3.6
# 进入环境
source activate python36
# 使用 pip 安装 TensorFlow 2.0 Preview:
pip install tf-nightly-2.0-preview
# 安装 GPU 版本
pip install tf-nightly-gpu-2.0-preview
目前有三个练习,
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》这本书大家应该都知道,它的作者 Aurélien Géron 对这个原因以及有哪些变化做了详细的讲解:https://www.youtube.com/watch?v=WTNH0tcscqo&t=304s
去年 3 月,Andrej Karpathy 发了一条 twitter,画出了机器学习论文中涉及的深度学习工具:
可以看到:
Caffe, Theano and Torch 趋势下降,
MXNet, CNTK and Chainer 依然很低,
TensorFlow and Keras 上升很快,
因为大多数 Keras 用户使用 TensorFlow 作为后端,所以 TensorFlow 的曲线可能会更高。
同时 PyTorch 也在上升,
1. 因为 TensorFlow 的代码比较麻烦
例如要计算 1 + ½ + ¼ + ⅛ + … ,使用 PyTorch 的代码明显比 TensorFlow 简单:
2. TensorFlow 不容易 debug
例如当得到一个错误的结果时,NaN 或异常,它不会告诉你问题的来源,
当有很多操作时,调试起来会很棘手,
虽然有一个专门的调试器,但并不易使用。
3. graph 模式很难描述
还是上图代码的例子,可以轻松测量 z 的计算时间,但不会告诉你计算 x 和 y 花了多少时间
。
后来从 TensorFlow 1.4 开始,可以使用 eager 模式。
可以发现和 PyTorch 一样简单,简化了编码,调试和分析,
没有 construction phase, execution phase, graphs,sessions,
tf.layers → tf.keras.layers
tf.train → tf.keras.optimizers
tf.losses → tf.keras.losses
前面说 graph 模式很难描述,但 graph mode 的好处也很多:
二者一起使用的方法有:
with
块中,它以 graph 运行:defun
:这里面包含一个循环,当 autograph 将这个函数转换成 TensorFlow 版本时,它知道当它在图形模式下运行时,应该创建一个使用 TensorFlow 的 while_loop()
操作的 graph。
以前构建多个模型时,可能会遇到各种名称冲突,需要依赖于 tf.variable_scope()和tf.get_variable()
,比较难理解,而且非常复杂,
在 TensorFlow 2.0 将完全放弃这种方法,避免依赖于全局状态等等。
而且更加面向对象,TF 2.0 将非常依赖 Keras API,共享变量更容易
以前训练模型,创建了一个优化器,要减少损失,但 TensorFlow 如何知道它应该按什么顺序来调整哪些变量?
它需要查找 trainable_variables()
列表才能知道。
这种设计并不理想,它依赖于附加到图表的一组 collections,并且在程序中使用全局状态是不好的。
所以 TensorFlow 2.0 将弃用 collections,代码会更清晰。
如果使用 tf.keras,则每个层都会处理自己的变量,如果需要获取可训练变量的列表,可以直接查询每个层:
删除 Variable_scopes
,必须以面向对象的方式处理变量共享
tf.get_variable()
也被删除,应该使用对象来处理变量
必须传递变量列表给优化器的 “minimize()” 方法
tf.assign(a,b)
将被删除,应该使用 a.assign(b)
之前 TensorFlow 包含很多重复的 API 或者不推荐使用的 API,杂乱无章,
例如,可以使用 tf.layers 或 tf.keras.layers 创建图层,这样会造成很多重复和混乱的代码。
TensorFlow 2.0 正在摆脱 tf.layers,应该使用 Keras 层,
keras loss 和 keras metrics 也将基于 tf.losses 和 tf.metrics。,
tf.contrib 的各种项目也已经被合并到 Keras 等核心 API 中,或者移动到单独的项目中,还有一些将被删除。
TensorFlow 2.0 会更好地组织 API,使编码更简洁。
x_train_ = tf.convert_to_tensor(train_inputs_of_numpy)
y_train_ = tf.convert_to_tensor(train_labels_of_numpy)
# Logistic regression model
model = tf.keras.layers.Dense(output_size, activation="sigmoid")
# loss function
def loss_fn(model, x, y):
predict_y = model(x)
# return shape is (x.shape[0], ) ; each element is each data's loss.
return tf.keras.losses.binary_crossentropy(y, predict_y)
def accuracy_fn(model, x, y):
predict_y = model(x)
# return shape is (x.shape[0], ) ; each element is 1 or 0.(If y[i] == y_pre[i], the i th element is 1).
return tf.keras.metrics.binary_accuracy(y, predict_y)
# optimizer
optimizer = tf.keras.optimizers.SGD(learning_rate=learning_rate)
for epoch in range(num_epochs):
with tf.GradientTape() as tape:
loss = loss_fn(model, x_train_, y_train_)
grads = tape.gradient(loss, model.variables)
accuracy = accuracy_fn(model=model, x=x_train_, y=y_train_)
if (epoch+1) % 5 == 0:
print(
"loss: {:0.3f}, acc: {}".format(
tf.reduce_sum(loss).numpy(), # using TF function or numpy method
accuracy.numpy().mean() # both of ok.
)
)
# update prameters using grads
optimizer.apply_gradients(zip(grads, model.variables))
TensorFlow 2.0 的代码简洁易懂了很多,更容易上手实践,性能提高,有 Keras,Data API,TF Hub,Google 的 TPU 等等资源,还有公开设计审核流程,相信 TensorFlow 2.0 会越来越好玩的。
Enjoy!
学习资料:
https://www.hellocybernetics.tech/entry/2019/01/12/155900
https://qiita.com/tomo_makes/items/9c22f306f1b781e8a7c2
https://www.youtube.com/watch?v=WTNH0tcscqo&t=304s