TensorFlow笔记(1)——TensorFlow中的相关基本概念

前言

Tensorflow 是一个编程系统,使用图(graph)来表示计算任务,图(graph)中的节点称之为 op (operation),一个 op 获得 0 个或多个 Tensor,执行计算,产生 0 个或多个 Tensor。Tensor 看作是一个 n 维的数组或列表。图必须在会话(Session)里被启动。

基本概念

  • 使用图(Graph)来表示计算任务
  • 在被称为会话(Session)的上下文(context)中执行图
  • 使用tensor表示数据
  • 通过变量(Variable)维护状态
  • 使用feed和fetch可以为任意的操作赋值或者从中获取数据

下图显示了Session、Graph、Tensor、Variable之间的关系


关系图

图(Graph)

在TensorFlow的官方文档中,Graph 被定义为“一些 Operation 和 Tensor 的集合”。例如我们表达如下的一个计算的 python代码,

a = tf.placeholder(tf.float32)
b = tf.placeholder(tf.float32)
c = tf.placeholder(tf.float32)
d = a*b+c
e = d*2

就会生成相应的一张图,在Tensorboard中看到的图大概如下这样。其中每一个圆圈表示一个Operation(输入处为Placeholder),椭圆到椭圆的边为Tensor,箭头的指向表示了这张图Operation 输入输出 Tensor 的传递关系。


图(Graph)

会话(Session)

会话(Session)是TensorFlow中的一个非常重要的概念。上面提到了,在TensorFlow中的所有计算都构建在一张计算图(Graph)中,这是一种对数学运算过程的可视化方法。而会话(Session)就是负责让这个图运算起来,会话(Session)持有并管理TensorFlow程序运行时的所有资源,例如CPU或者GPU的分配。

使用会话(Session)的两种方式

方式一:明确的调用会话的生成函数和关闭会话函数

# 创建一个会话
sess = tf.Session()

# 使用该会话执行一个结果
sess.run(...)

# 关闭会话,释放内存
sess.close()

调用这种方式时,要明确调用Session.close(),以释放资源。当程序异常退出时,关闭函数就不能被执行,从而导致资源泄露。

方式二:上下文管理机制自动释放所有资源
利用with结构将需要执行的代码包裹住,创建会话,并通过上下文机制管理器管理该会话

with tf.Session() as sess:
    sess.run(...)
# 不需要再调用"Session.close()"
# 在退出with statement时,会话关闭和资源释放已自动完成

Tips:一般情况下推荐使用方式二使用会话

张量(Tensor)

TensorFlow用张量这种数据结构来表示所有的数据.你可以把一个张量想象成一个n维的数组或列表.一个张量有一个静态类型和动态类型的维数.张量可以在图中的节点之间流通

在TensorFlow系统中,张量的维数来被描述为阶.但是张量的阶和矩阵的阶并不是同一个概念.张量的阶(有时是关于如顺序或度数或者是n维)是张量维数的一个数量描述.比如,下面的张量(使用Python中list定义的)就是2阶.

t = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

你可以认为一个二阶张量就是我们平常所说的矩阵,一阶张量可以认为是一个向量.对于一个二阶张量你可以用语句t[i, j]来访问其中的任何元素.而对于三阶张量你可以用't[i, j, k]'来访问其中的任何元素.

数学实例 Python 例子
0 纯量 (只有大小) s = 483
1 向量(大小和方向) v = [1.1, 2.2, 3.3]
2 矩阵(数据表) m = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
3 3阶张量 (数据立体) t = [[[2], [4], [6]], [[8], [10], [12]], [[14], [16], [18]]]
n n阶 (自己想想看) ....

张量是所有深度学习框架中最核心的组件,因为后续的所有运算和优化算法都是基于张量进行的。几何代数中定义的张量是基于向量和矩阵的推广,通俗一点理解的话,我们可以将标量视为零阶张量,矢量视为一阶张量,那么矩阵就是二阶张量。

变量(Variable)

本质也是一个tensor张量,但variable主要用于数据存储(可以理解为Java中的全局变量)
Variable 用于构建一个变量,在计算图的运算过程中,其值会一直保存到程序运行结束,而一般的tensor张量在tensorflow运行过程中只是在计算图中流过,并不会保存下来。
因此Varibale主要用来保存tensorflow构建的一些结构中的参数,这些参数才不会随着运算的消失而消失,才能最终得到一个模型。

Tips: 所有和varible有关的操作在计算的时候都要使用session会话来控制,包括计算,打印等等。

# 2.2变量
import tensorflow as tf

# 定义一个变量 X
X=tf.Variable([1,2])
# 定义一个常量 a
a=tf.constant([3,3])

# 增加一个减法op
sub=tf.subtract(X,a)
# 增加一个加法op
add=tf.add(X,sub)

# 初始化所有变量
init=tf.global_variables_initializer()

# 定义一段会话
with tf.Session() as sess:
    # 在会话中执行
    sess.run(init)
    print(sess.run(sub))
    print(sess.run(add))

# 创建一个变量,初始化为0
state=tf.Variable(0,name='counter')
# 创建一个op,作用是使state加1
new_value=tf.add(state,1)
# 赋值op
update=tf.assign(state,new_value)
# 变量初始化
init=tf.global_variables_initializer()
# 创建一个会话
with tf.Session() as sess:
    # 利用会话执行初始化操作
    sess.run(init)
    print(sess.run(state))
    for _ in range(5):
        sess.run(update)
        print(sess.run(state))

feed和fetch

1.fetch

会话运行完成之后,如果我们想查看会话运行的结果,可以使用fetch来实现

import tensorflow as tf

# Fetch
# 创建三个常量
input1 = tf.constant(3.0)
input2 = tf.constant(2.0)
input3 = tf.constant(5.0)

# 执行加法和乘法操作
add=tf.add(input2,input3)
mul=tf.multiply(input1,add)

# 创建会话执行
with tf.Session() as sess:
    result=sess.run([mul,add])
    print(result)

运行结果为:

[21.0, 7.0]

2.feed与占位符(placeholder)

当我们构建一个模型的时候,有时候我们需要在运行时候输入一些初始数据,这个时候定义模型数据输入在tensorflow中就是用placeholder(占位符)来完成。它的定义如下:

def placeholder(dtype, shape=None, name=None):

其中dtype表示数据类型,shape表示维度,name表示名称。它支持单个数值与任意维度的数组输入。
1. 单个数值占位符定义

a = tf.placeholder(tf.float32)
b = tf.placeholder(tf.float32)
c = tf.add(a, b)

当我们需要执行得到c的运行结果时候我们就需要在会话运行时候,通过feed来插入a与b对应的值,代码演示如下:

with tf.Session() as sess:
    result = sess.run(c, feed_dict={a:3, b:4})
    print(result)

其中 feed_dict就是完成了feed数据功能,feed中文有喂饭的意思,这里还是很形象的,对定义的模型来说,数据就是最好的食物,所以就通过feed_dict来实现。

2. 多维数据
同样对于模型需要多维数据的情况下通过feed一样可以完成,定义二维数据的占位符,然后相加,代码如下:

_x = tf.placeholder(shape=[None, 2], dtype=tf.float32, name="x")
_y = tf.placeholder(shape=[None, 2], dtype=tf.float32, name="y")
z = tf.add(_x, _y);

运行时候需要feed二维数组,实现如下:

with tf.Session() as sess:
    result = sess.run(z, feed_dict={_x:[[3, 4], [1, 2]], _y:[[8, 8],[9, 9]]})
    print(result)

下面给出示例代码:

import tensorflow as tf

# Feed
# 常见占位符
input4=tf.placeholder(tf.float32)
input5=tf.placeholder(tf.float32)
output=tf.multiply(input4,input5)

with tf.Session() as sess:
    # feed的数据以字典的形式传入
    print(sess.run(output,feed_dict={input4:2.0,input5:45.2}))

执行结果为:

90.4

3. feed和fetch

总结下,feed和fetch的作用就和他的意思是一样的,fetch用于从session中获取结果数据,feed是用于将数据喂给operation,然后用session执行。

你可能感兴趣的:(TensorFlow笔记(1)——TensorFlow中的相关基本概念)