InvalidArgumentError: seq_lens() > input.dims()[[Node: hidden/bidirectional_rnn/bw/ReverseSequence

报错信息:

InvalidArgumentError: seq_lens() > input.dims()[[Node: hidden/bidirectional_rnn/bw/ReverseSequence_第1张图片

Google了一下没有找到对应的解决方案,看了bidrection_rrn源码,发现问题出现在一个tf.reverse_sequence函数中。

https://www.tensorflow.org/api_docs/python/tf/reverse_sequence

错误的主要原因是在对seq进行反转时,

InvalidArgumentError: seq_lens() > input.dims()[[Node: hidden/bidirectional_rnn/bw/ReverseSequence_第2张图片

没有满足以下条件:

The elements of seq_lengths must obey seq_lengths[i] <= input.dims[seq_dim], and seq_lengths must be a vector of length input.dims[batch_dim]

看函数tf.reverse_sequence()中对seq_lengths表示要反转的seq长度。错误信息表示传入该函数的seq_lengths即要反转的长度超过了input本身的长度。

我检查了代码,发现在限制文本最长长度是400后,矩阵维度为(?,400,hidden_size),但是保留每句话长度的数组seq_lengths忘记400的最大限制,依然保存了超过400的seq长度。这样在双向lstm执行reverse_sequence()时报错。

 

错误原因,传入的seq_lengths(要反转的长度)超过了seq本身长度。

解决办法:

H, _ = tf.nn.bidirectional_dynamic_rnn( cell_fw, cell_bw, input_embed, self.s_len, dtype=tf.float32)

将self.s_len这个数组中最大值限制到400(限制句子的最大长度).

你可能感兴趣的:(tensorflow)