使用Tensorflow构建LSTM模型所需要使用到的API

前言

在使用tensorflow编写LSTM代码的时候Tensorflow使用LSTM实现中文文本分类(二),使用到很多新的函数,在此将用到的新函数整理一下做一个笔记。

重要方法

tf.random_uniform_initializer()

功能:生成具有均匀分布的张量的初始化器
参数:

  • minval:一个 python 标量或一个标量张量.要生成的随机值范围的下限
  • maxval:一个 python 标量或一个标量张量.要生成的随机值范围的上限.对于浮点类型默认为1
  • seed:一个 Python 整数.用于创建随机种子.查看 tf.set_random_seed 的行为
  • dtype:数据类型
tf.variable_scope()

参考博客:tf.variable_scope 参数
参数:返回一个用于定义创建variable层的op的上下文管理器
参数(不常用的没有写):

  • name_or_scope:string或VariableScope:要打开的范围。
  • default_name:如果name_or_scope参数为None,则将使用默认名称,此名称将被唯一。 如果提供了name_or_scope,它将不会被使用,因此它不是必需的,可以是None。
    值:传递给op函数的Tensor参数列表。
  • initializer:此范围内的变量的默认初始化程序。
  • dtype:在此范围中创建的变量类型(默认为传递范围中的类型,或从父范围继承)

tf.nn.embedding_lookup()

参考博客:tf.nn.embedding_lookup函数的用法
功能:选取一个张量里面按照索引对应的元素。
参数:

  • params 可以是tensor,也可以是数组
  • ids 传入 对应的 索引

tf.contrib.rnn.BasicLSTMCell()

参考博客:记录tf.contrib.rnn.BasicLSTMCell
功能:创建一个LSTM层
参数:

  • num_uints:神经元数量
  • forget_bias:遗忘的偏置0-1,0全忘记,1全记得
  • state_is_tuple:是否返回元组,最好是true,返回元组。
  • activation:激活函数,默认tanh

tf.contrib.rnn.MultiRNNCell()

参考博客:tf.nn.embedding_lookup函数的用法
功能:对RNN进行堆叠。即:将每个单层LSTM穿联在一起形成一个多层LSTM。经过转化过的层,可以当做单层LSTM来操作,很方便。
参数:

  • cells:run cell 的 list
  • state_is_tuple:同上,非必须、

tf.contrib.rnn.MultiRNNCell.zero_state(batch_size, tf.float32)

功能:通过该函数获得一个全零的初始状态。
参数:

  • batch_size:batch大小
  • dtype:数据类型

tf.nn.dynamic_rnn()

博客参考:tf.nn.dynamic_rnn返回值详解
功能:使用该函数相当于调用了n次call函数,即通过{h0, x1, x2, x3…xn}直接得到{h1, h2, h3, h4, … hn}
参数:

  • cell:通过tf.contrib.rnn.MultiRNNCell()堆叠的多层RNN,或者 单层的lstmcell也可以。
  • inputs:需要 传入的 训练数据
  • initial_state:初始状态(一般可以是零矩阵)

需要特别强调一下该函数的返回

  • outputs:time_step步里所有的输出,他到shape为(batch_size, time_steps, cell.output_size)
  • state:最后一步的隐状态,形态为(batch_size, cell,state_size)

tf.clip_by_global_norm()

博客参考:tf.clip_by_norm 梯度裁剪
功能:梯度裁剪的最直接目的就是防止梯度爆炸,手段就是控制梯度的最大范式。
参数:

  • t_list:梯度列表
  • clip_norm:裁剪率
    返回值:
  • list_clipped:裁剪后的梯度列表
  • global_norm:全局的规约数

tf.gradients()

博客参考:Tensorflow:tf.gradient()用法以及参数stop_gradient理解
功能:进行梯度计算
参数:

  • ys:类似于目标函数,即需要被微分的函数
  • xs:被微分的对象/变量,需要求导的参数

返回:

  • 该函数返回 xs 中每个 x 的 sum(dy/dx) 的列表.

tf.train.AdamOptimizer( learning_rate ).apply_gradients()

博客参考:tensorflow API:梯度修剪apply_gradients和compute_gradients
功能:把梯度“应用”到变量上去。这是minimize()函数的第二个步骤,返回一个应用的操作。
参数:

  • grads_and_vars:compute_gradients()函数返回的(gradient, variable)对儿的列表。
  • global_step:可选变量,在变量跟新后会自增一。

你可能感兴趣的:(tensorflow,Tensorflow学习笔记)