介绍
计算图本身是一个有向无环图,它主要由一组节点(Node,抽象表示一个Op函数执行)与表示节点之间相互依赖的边(Edge,表示Nodes之间的输入、输出或次序控制依赖关系)组成。
本节当中我们将详细分析Tensorflow里面节点与边的一些实现。
节点
以下为Node class在Tensorflow里面的定义。详见:tensorflow/core/graph/graph.h。我们将在其代码中逐个分析其不同的属性与方法。
- 基本方法与属性
class Node {
public:
string DebugString() const;
int id() const { return id_; } // 每个节点都会分配这么一个固定的id,同一副图里面的不同Node有着其唯一的标识id
int cost_id() const { return cost_id_; } // 此处主要标明Node 内存分配相关的id,有些Node为ref类型Node,可能其实现当中并不实际分配内存而只是引用其它Node节点里面分配的内存;这样它们将拥有相同的cost_id,它在对图的内存分配优化及优先级策略上有指导、帮助的意义
const string& name() const;
const string& type_string() const; // 显示不同的type,如有的为Conv,有的为Multmul,还有则为Send或Recv等
const NodeDef& def() const; //输出Node的protocol buffer definition
const OpDef& op_def() const; //输出此Node相关联的Op的protocol buffer definition
/* 以下主要为Node的输入、输出Tensor类型、数量及其引用等,容易理解 */
// input and output types
int32 num_inputs() const;
DataType input_type(int32 i) const;
const DataTypeVector& input_types() const;
int32 num_outputs() const;
DataType output_type(int32 o) const;
const DataTypeVector& output_types() const;
/* 用户可指定或查询某Node节点执行所用的device,但其在真正执行时,executor只是参考此建议,最终真正所用的device还是由executor综合考虑后决定 */
// The device requested by the user. For the actual assigned device,
// use assigned_device_name() below.
const string& requested_device() const;
// This changes the user requested device but not necessarily the device that
// on which the operation will run.
void set_requested_device(const string& device);
// 以下一组函数可用来查询/添加/删除此Node所具有的属性
// Read only access to attributes
AttrSlice attrs() const;
template
void AddAttr(const string& name, const T& val) {
SetAttrValue(val, AddAttrHelper(name));
}
void ClearAttr(const string& name);
// Inputs requested by the NodeDef. For the actual inputs, use in_edges.
const protobuf::RepeatedPtrField& requested_inputs() const;
//以下为一组功能函数,具体来查询输入、输出的Edges/Nodes,并使用不同的数据结构返回,因为此类操作在Tensorflow中使用非常频繁,因此需要考虑数据结构的效率、内存使用等特点
// Get the neighboring nodes via edges either in or out of this node. This
// includes control edges.
gtl::iterator_range in_nodes() const;
gtl::iterator_range out_nodes() const;
const EdgeSet& in_edges() const { return in_edges_; }
const EdgeSet& out_edges() const { return out_edges_; }
// Returns into '*n' the node that has an output connected to the
// 'idx' input of this Node.
Status input_node(int idx, const Node** n) const;
Status input_node(int idx, Node** n) const;
private:
friend class Graph; //Graph与Node经常会相互调用彼此函数,这里设为友类
Node();
NodeProperties* properties() const { return props_.get(); }
void Initialize(int id, int cost_id, std::shared_ptr props);
// Releases memory from props_, in addition to restoring *this to its
// uninitialized state.
void Clear();
};
- 节点类型
Tensorflow的程序设计当中,一切计算、控制操作都会由节点来表示。因此不只像传统意义上大家认为构成主要模型的Conv/Relu/Matmul/FC等计算操作被表示为节点,其它像变量初始化(VARIABLE),常量赋值等操作都会有相应的Node节点存在在图中。然后由Session统一驱动执行。这就是静态图构建与执行的基本原理。
以下为所有的节点类型。我们平时说的Conv/Relu/Matmul/BN等计算节点都被归于NC_OTHER里面。。而其它在这里有名有姓的则为图上的控制节点,也称为特殊节点。
// A set of mutually exclusive classes for different kinds of nodes,
// class_ is initialized in the Node::Initialize routine based on the
// node's type_string().
enum NodeClass {
NC_UNINITIALIZED,
NC_SWITCH,
NC_MERGE,
NC_ENTER,
NC_EXIT,
NC_NEXT_ITERATION,
NC_LOOP_COND,
NC_CONTROL_TRIGGER,
NC_SEND,
NC_HOST_SEND,
NC_RECV,
NC_HOST_RECV,
NC_CONSTANT,
NC_VARIABLE,
NC_IDENTITY,
NC_GET_SESSION_HANDLE,
NC_GET_SESSION_TENSOR,
NC_DELETE_SESSION_TENSOR,
NC_METADATA,
NC_SCOPED_ALLOCATOR,
NC_COLLECTIVE,
NC_OTHER // Not a special kind of node
};
- 节点输入/输出
以下两个结构分别抽象表示Node的输入、输出张量(Tensor),本质上Tensorflow图上流动的正是如此一个个Input/Output tensors。
// Represents an input of a node, i.e., the `index`-th input to `node`.
struct InputTensor {
const Node* node;
int index;
InputTensor(const Node* n, int i) : node(n), index(i) {}
InputTensor() : node(nullptr), index(0) {}
};
// Represents an output of a node, i.e., the `index`-th output of `node`. Note
// that a single `OutputTensor` can correspond to multiple `Edge`s if the output
// is consumed by multiple destination nodes.
struct OutputTensor {
const Node* node;
int index;
OutputTensor(const Node* n, int i) : node(n), index(i) {}
OutputTensor() : node(nullptr), index(0) {}
};
- 节点属性
tf中每个节点的属性包含其输入、输出Tensors的类型以及此节点的protocol定义NodeDef及其所关联的Op的定义OpDef。
class NodeProperties {
public:
NodeProperties(const OpDef* op_def, const NodeDef& node_def,
const DataTypeSlice inputs, const DataTypeSlice outputs)
: op_def(op_def),
node_def(node_def),
input_types(inputs.begin(), inputs.end()),
output_types(outputs.begin(), outputs.end()) {}
const OpDef* op_def; // not owned
NodeDef node_def;
const DataTypeVector input_types;
const DataTypeVector output_types;
};
边
在下面我们从class Edge的代码里来分析下TF中边的实现。详细可见:tensorflow/core/graph/graph.h
class Edge {
public:
//我们介绍过边表示Nodes之间的依赖关系,此处即为dst节点执行所需的某个输入依赖于来自src节点的某个输出或者作为控制边要求src节点的执行先于节点dst完成
Node* src() const { return src_; }
Node* dst() const { return dst_; }
int id() const { return id_; } //TF Graph当中与Node一样,每个边也有其唯一的标识id
// Return the index of the source output that produces the data
// carried by this edge. The special value kControlSlot is used
// for control dependencies.
int src_output() const { return src_output_; }
// Return the index of the destination input that consumes the data
// carried by this edge. The special value kControlSlot is used
// for control dependencies.
int dst_input() const { return dst_input_; }
// Return true iff this is an edge that indicates a control-flow
// (as opposed to a data-flow) dependency.
bool IsControlEdge() const;
string DebugString() const;
private:
Edge() {}
friend class EdgeSetTest;
friend class Graph;
Node* src_;
Node* dst_;
int id_;
int src_output_;
int dst_input_;
};
参考文献
- https://github.com/tensorflow