举例说明tf中LSTMCell的cell、num_unit是什么意思

文章目录

    • 1. 对于cell的解释
    • 2. 对num_units参数的解释
    • 3. LSTM的每个cell参数共享

1. 对于cell的解释

举例说明tf中LSTMCell的cell、num_unit是什么意思_第1张图片
LSTM一般都会一连串的小团团,这一个个小团团就表示一个cell。如上图所示。

2. 对num_units参数的解释

举例说明tf中LSTMCell的cell、num_unit是什么意思_第2张图片
上图中,我们很多步计算中都有用到W, 其实num_units就表示线性层的隐藏节点个数,也即输出的维度。
例如:
num_units = 128, 就表示我们输出的维度是[128, 1](也有可能是[1, 128],看具体需要,两者只差一个转置,没有太大的本质区别)。
我们的输入xt的维度为[28, 1], 那么 [ h t − 1 , x t ] = [ 128 + 28 , 1 ] = [ 156 , 1 ] [h_{t-1},x_t]=[128+28, 1]=[156,1] [ht1,xt]=[128+28,1]=[156,1],所以我们的W的维度为[128, 156]

总之,参数num_units = 128,就表示每一个cell的输出维度为[128, 1] 或 [1, 128]

3. LSTM的每个cell参数共享

下图非常明白的展示了LSTM其实也只有一个cell,权重也共享
举例说明tf中LSTMCell的cell、num_unit是什么意思_第3张图片

你可能感兴趣的:(深度学习,深度学习,lstm,人工智能)