41TensorFlow 2 深度学习入门与实践--TensorFlow 2 基础概念语法

TensorFlow 2 基础概念语法

TensorFlow 2 简介

TensorFlow 是由谷歌在 2015 年 11 月发布的深度学习开源工具，我们可以用它来快速构建深度神经网络，并训练深度学习模型。运用 TensorFlow 及其他开源框架的主要目的，就是为我们提供一个更利于搭建深度学习网络的模块工具箱，使开发时能够简化代码，最终呈现出的模型更加简洁易懂。

2019 年，TensorFlow 推出了 2.0 版本，也意味着 TensorFlow 从 1.x 正式过度到 2.x 时代。根据 TensorFlow 官方介绍内容显示，2.0 版本将专注于简洁性和易用性的改善，主要升级方向包括：
使用 Keras 和 Eager Execution 轻松构建模型。
在任意平台上实现稳健的生产环境模型部署。
为研究提供强大的实验工具。
通过清理废弃的 API 和减少重复来简化 API。

张量

张量的概念贯穿于物理学和数学中，如果你去看它的很多理论描述，可能并不那么浅显易懂。例如，下面有两种关于张量的定：
通常定义张量的物理学或传统数学方法，是把张量看成一个多维数组，当变换坐标或变换基底时，其分量会按照一定规则进行变换，这些规则有两种：即协变或逆变转换。
通常现代数学中的方法，是把张量定义成某个矢量空间或其对偶空间上的多重线性映射，这矢量空间在需要引入基底之前不固定任何坐标系统。例如协变矢量，可以描述为 1-形式，或者作为逆变矢量的对偶空间的元素。

上面的定义不知道你看懂了没有？估计会有点困难。下面，我们进行通俗易懂的说明：
首先，你应该知道什么是向量和矩阵。先前的介绍中，我们把1维的数组称之为向量，2维的数组称之为矩阵。那么，现在告诉你张量其实代表着更大的范围，你也可以把其看作是N维数组。
所以，如果现在重新描述向量和矩阵，就可以是：一阶张量为向量，二阶张量为矩阵。当然，零阶张量也就是标量，而更重要的是N阶张量，也就是N维数组。

image.png

所以，张量并不是什么晦涩难懂的概念。如果不严谨的讲，张量就是 NN 维数组。前面提到的向量、矩阵，也是张量。
你即将学习到的大多数深度学习框架都会使用张量的概念，这样做的好处是统一对数据的定义。NumPy 中，数据都使用 Ndarray 多维数组进行定义，TensorFlow 中，数据都会用张量进行表述。
下面就来学习 TensorFlow 中对张量的定义。在 TensorFlow 中，每一个 Tensor 都具备两个基础属性：数据类型（默认：float32）和形状。

其中，数据类型大致如下表所示：

image.png

另外，TensorFlow 通过三种符号约定来描述张量维度：阶，形状和维数。三者之间的关系如下：

image.png

值得注意的是，上表中的示例都是形容张量的形状。例如 [3, 4] 指的张量的形状为 [3, 4]，而不是张量 [3, 4]。

根据不同的用途，TensorFlow 中主要有 2 种张量类型，分别是：
tf.Variable ：变量 Tensor，需要指定初始值，常用于定义可变参数，例如神经网络的权重。
tf.constant ：常量 Tensor，需要指定初始值，定义不变化的张量。

我们可以通过传入列表或 NumPy 数组来新建变量和常量类型的张量：

import tensorflow as tf

tf.__version__

v = tf.Variable([[1, 2], [3, 4]])  # 形状为 (2, 2) 的二维变量
v

c = tf.constant([[1, 2], [3, 4]])  # 形状为 (2, 2) 的二维常量
c

仔细观察，你会发现输出包含了张量的 3 部分属性，分别是形状 shape，数据类型 dtype，以及对应的 NumPy 数组。
你还可以直接通过 .numpy() 输出张量的 NumPy 数组。

c.numpy()

上面我们已经介绍了常量张量，这里再列举几个经常会用到的新建特殊常量张量的方法：
tf.zeros：新建指定形状且全为 0 的常量 Tensor
tf.zeros_like：参考某种形状，新建全为 0 的常量 Tensor
tf.ones：新建指定形状且全为 1 的常量 Tensor
tf.ones_like：参考某种形状，新建全为 1 的常量 Tensor
tf.fill：新建一个指定形状且全为某个标量值的常量 Tensor

c = tf.zeros([3, 3])  # 3x3 全为 0 的常量 Tensor
c

tf.ones_like(c)  # 与 c 形状一致全为 1 的常量 Tensor

tf.fill([2, 3], 6)  # 2x3 全为 6 的常量 Tensor

除此之外，我们还可以创建一些序列，例如：
tf.linspace：创建一个等间隔序列。
tf.range：创建一个数字序列。

tf.linspace(1.0, 10.0, 5, name="linspace")

tf.range(start=1, limit=10, delta=2)

实际上，如果你熟悉 NumPy 的话，你会发现这与 NumPy 中创建各式各样的多维数组方法大同小异。数据类型是一切的基础，了解完张量我们就可以继续学习张量的运算了。

Eager Execution

TensorFlow 2 带来的最大改变之一是将 1.x 的 Graph Execution（图与会话机制）更改为 Eager Execution（动态图机制）。在 1.x 版本中，低级别 TensorFlow API 首先需要定义数据流图，然后再创建 TensorFlow 会话，这一点在 2.0 中被完全舍弃。TensorFlow 2 中的 Eager Execution 是一种命令式编程环境，可立即评估操作，无需构建图。
所以说，TensorFlow 的张量运算过程可以像 NumPy 一样直观且自然了。接下来，我们以最简单的加法运算为例：

c + c  # 加法计算

如果你接触过 1.x 版本的 TensorFlow，你要知道一个加法运算过程十分复杂。我们需要初始化全局变量 → 建立会话 → 执行计算，最终才能打印出张量的运算结果。

init_op = tf.global_variables_initializer()  # 初始化全局变量
with tf.Session() as sess:  # 启动会话
    sess.run(init_op)
    print(sess.run(c + c))  # 执行计算

Eager Execution 带来的好处显而易见，其进一步降低了 TensorFlow 的入门门槛。之前的 Graph Execution 模式，实际上让很多人在入门时都很郁闷，因为完全不符合正常思维习惯。
TensorFlow 中提供的数学计算，包括线性代数计算方面的方法也是应有尽有，十分丰富。下面，我们再列举一个示例。

a = tf.constant([1., 2., 3., 4., 5., 6.], shape=[2, 3])
b = tf.constant([7., 8., 9., 10., 11., 12.], shape=[3, 2])

c = tf.linalg.matmul(a, b)  # 矩阵乘法
c

tf.linalg.matrix_transpose(c)  # 转置矩阵

你应该能够感觉到，这些常用 API 都能在 NumPy 中找到对应的方法，这也就是课程需要你预先熟悉 NumPy 的原因。由于函数实在太多太多。一般来讲，除了自己经常使用到的，都会在需要某种运算的时候，查阅官方文档。
所以说，你可以把 TensorFlow 理解成为 TensorFlow 式的 NumPy + 为搭建神经网络而生的 API。

自动微分

在数学中，微分是对函数的局部变化率的一种线性描述。虽然微分和导数是两个不同的概念。但是，对一元函数来说，可微与可导是完全等价的。如果你熟悉神经网络的搭建过程，应该明白梯度的重要性。而对于复杂函数的微分过程是及其麻烦的，为了提高应用效率，大部分深度学习框架都有自动微分机制。
TensorFlow 中，你可以使用 tf.GradientTape 跟踪全部运算过程，以便在必要的时候计算梯度。

w = tf.Variable([1.0])  # 新建张量

with tf.GradientTape() as tape:  # 追踪梯度
    loss = w * w

grad = tape.gradient(loss, w)  # 计算梯度
grad

上面，我们演示了一个自动微分过程，它的数学求导过程如下：

image.png

所以，当w等于 1 时，计算结果为 2。
tf.GradientTape 会像磁带一样记录下计算图中的梯度信息，然后使用 .gradient 即可回溯计算出任意梯度，这对于使用 TensorFlow 低阶 API 构建神经网络时更新参数非常重要。

常用模块

上面，我们已经学习了 TensorFlow 核心知识，接下来将对 TensorFlow API 中的常用模块进行简单的功能介绍。对于框架的使用，实际上就是灵活运用各种封装好的类和函数。由于 TensorFlow API 数量太多，迭代太快，所以大家要养成随时查阅官方文档的习惯。
tf.：包含了张量定义，变换等常用函数和类。
tf.data：输入数据处理模块，提供了像 tf.data.Dataset 等类用于封装输入数据，指定批量大小等。
tf.image：图像处理模块，提供了像图像裁剪，变换，编码，解码等类。
tf.keras：原 Keras 框架高阶 API。包含原 tf.layers 中高阶神经网络层。
tf.linalg：线性代数模块，提供了大量线性代数计算方法和类。
tf.losses：损失函数模块，用于方便神经网络定义损失函数。
tf.math：数学计算模块，提供了大量数学计算函数。
tf.saved_model：模型保存模块，可用于模型的保存和恢复。
tf.train：提供用于训练的组件，例如优化器，学习率衰减策略等。
tf.nn：提供用于构建神经网络的底层函数，以帮助实现深度神经网络各类功能层。
tf.estimator：高阶 API，提供了预创建的 Estimator 或自定义组件。

在构建深度神经网络时，TensorFlow 可以说提供了你一切想要的组件，从不同形状的张量、激活函数、神经网络层，到优化器、数据集等，一应俱全。

导数计算和自动微分实现

导数计算

Sigmoid 函数是机器学习中会经常看到的一个函数，它是逻辑回归的基础也可以充当神经网络的激活函数。Sigmoid 函数如下所示：

image.png

请参考上方的公式，使用 TensorFlow 2 提供的数学计算方法实现 Sigmoid 函数 sigmoid(x)。你可能需要借助于搜索引擎和 TensorFlow 官方文档来查找一些适用的函数。

import tensorflow as tf
tf.__version__

def sigmoid(x):
    s = 1 / (1 + tf.math.exp(-x))
    return s

接下来，请使用 TensorFlow 2 提供的方法初始化一组 [-10, 10][−10,10] 之间等间隔的 100 个值，并作为 Sigmoid 函数的输入。最终，使用 Matplotlib 绘制出 Sigmoid 函数的曲线。同样，你只能使用 TensorFlow 2 提供的相关方法。

from matplotlib import pyplot as plt
%matplotlib inline

x = tf.linspace(-10.0, 10.0, 100)
plt.plot(x, sigmoid(x))

image.png

接下来，请对 Sigmoid 函数求导，并实现 Sigmoid 导数函数 sigmoid_derivative(x)：

def sigmoid_derivative(x):
    d_s = sigmoid(x) * (1 - sigmoid(x))
    return d_s

同样，使用上面初始化好的x值，绘制 Sigmoid 函数导数的变化曲线。

plt.plot(x, sigmoid_derivative(x))

image.png

自动微分

TensorFlow 中，你可以使用 tf.GradientTape 跟踪全部运算过程，以便在必要的时候计算梯度。当然，对于上方 Sigmoid 一元函数而言，也就是自动求导过程。
接下来，请使用在实验中学习到的方法，使用 tf.GradientTape 完成自动微分。同样，你需要传入前面生成的等间距x并绘制出导数的变化曲线。

x = tf.Variable(x)

with tf.GradientTape() as tape:  # 追踪梯度
    s = 1 / (1 + tf.math.exp(-x))


grad = tape.gradient(s, x)  # 计算梯度
grad

plt.plot(x.numpy(), grad.numpy())  # 绘制 sigmoid 导数变化曲线

image.png

可以发现，借助于自动微分机制，我们只需要书写计算过程即可得到关于任意变量的微分结果。

41TensorFlow 2 深度学习入门与实践--TensorFlow 2 基础概念语法

TensorFlow 2 基础概念语法

TensorFlow 2 简介

张量

Eager Execution

自动微分

常用模块

导数计算和自动微分实现

导数计算

自动微分

你可能感兴趣的:(41TensorFlow 2 深度学习入门与实践--TensorFlow 2 基础概念语法)