tensorFlow中的session和graph

前言：

学习用FTensorFlow搭建NN框架以来，一直习惯逐层叠加的方式。最近在做udacity的作业的时候，发现一种新的语句tf.Graph().as_default()。该文尝试分析两者的关系

tf.Session()

tf.Session()使我们初学者的最多的构建TensorFlow的graph然后执行的方式如：

input = tf.placeholder(tf.float32, shape=(None,1024, 1024))
output = tf.nn.conv2d(input, filter, strides, padding)
output = tf.nn.relu(output)
.......

#按照网络结构，一层一层的叠加上去, 最后使用```sess.run()```执行.
with tf.Session() as sess:
  sess.run(....)
  ......
  print(...)
# Close the Session when we're done.
sess.close()

释放Tensorflow暂用内存：sess.close()

对于一个session，tf会一直hold所占用的内存，DL的input一般都非常大，所以在进行完一次实验之后，尤其是interactive模式中，务必要把session关闭，再进行下一次实验，否则内存很有可能会爆掉。
之前在AWS运行完一个graph，然后打开另一个graph运行的时候，一直OMM错误。无奈每次都要stop一个instance然后重新start。后来才知道sess.close()这一释放内存的神奇命令，就方便多了。

tf.Graph()

Tensorflow是基于Graph计算的，我们用上面的一层层叠加的方式建立起来的网络，全部构建在tf的默认graph中，可以通过g= tf.get_default_graph()获得其句柄，可以对比下面两句的输出结果：

c = tf.constant(4.0)
print(c.graph) 
print(tf.get_default_graph())

如果需要显示声明graph，可以使用tf.Graph().as_default() 来进行显式graph声明一个default graph:

with tf.Graph().as_default() as g:
  c = tf.constant(5.0)
  print(c.graph) 
  print(g)

这里tf.Graph().as_default() 是一个上下文管理器（context manager)，它能够在这个上下文里面覆盖默认的图。

import tensorflow as tf
import numpy as np

c=tf.constant(value=1)
#print(assert c.graph is tf.get_default_graph())
print(c.graph)
print(tf.get_default_graph())

g=tf.Graph()
print("g:",g)
with g.as_default():
    d=tf.constant(value=2)
    print(d.graph)
    #print(g)

g2=tf.Graph()
print("g2:",g2)
g2.as_default()
e=tf.constant(value=15)
print(e.graph)

我们发现，通过g=tf.Graph()用来创建一个Graph并获得句柄g。当我们需要在这个新创建的Graph中建立、添加或修改结构的时候，需要先用g.as_default()将其设置为当前（默认）Graph, 如：

# Create the graph object
graph = tf.Graph()
# Add nodes to the graph
with graph.as_default()
      inputs_ = tf.placeholder(tf.int32, [None, None], name='inputs')
      labels_ = tf.placeholder(tf.int32, [None, None], name='labels')
      keep_prob = tf.placeholder(tf.float32, name='keep_prob')
  ...

Why？？？？

这么做有一个好处，我们可以将一个巨大的复杂的网络分割成多个小的网络，每个网络对应一个graph，如经典的Faster RCNN结构，大概可以分为features network (标准的CNN结构，负责特征学习，如VGG16， Resnet)，RPN（region proposal network）和最终负责classification以及bounding box regression的task network。其训练过程是迭代的方式：每次只有一个被训练，其它的freeze。这时候我们只需要获取它对应的graph，并用sess执行即可：

with tf.Session(graph=graph) as sess:
    sess.run()

每一个部分都能单独控制，非常方便。如果向我们之前所有的东西都堆叠在一个graph（默认）中，我们就需要写额外的代码控制哪个阶段，哪些网络层会被训练到，哪些没有，复杂而容易出错。另外，我们也可以对任意一个graph进行修改，即使出错也容易定位到。

希望本文对您有所帮助，如果错误欢迎讨论指出。

tensorFlow中的session和graph

前言：

tf.Session()

tf.Graph()

Why？？？？

你可能感兴趣的:(tensorFlow中的session和graph)