李宏毅:Gated RNN and Sequence generation

1、RNN with gated machanism

(1)RNN

李宏毅:Gated RNN and Sequence generation_第1张图片

(2)deep RNN

李宏毅:Gated RNN and Sequence generation_第2张图片

(3)Bidirectional RNN

李宏毅:Gated RNN and Sequence generation_第3张图片

(4)Naive RNN

李宏毅:Gated RNN and Sequence generation_第4张图片

(5)LSTM

因为LSTM中的input c变化是很慢的,所以它能够记得很久之前的内容,不会有太大的变化。

李宏毅:Gated RNN and Sequence generation_第5张图片

h(t-1)和c(t-1)是上一个LSTM的output。

李宏毅:Gated RNN and Sequence generation_第6张图片

可以把c(t-1)也放进去。

李宏毅:Gated RNN and Sequence generation_第7张图片

z(i)决定z这个information能不能够被拿进来使用。z(f)就是决定c(t-1)的information要不要在接下来的output中使用(c(t-1)其实是memory,代表过去的information)。z(o)决定最终的output能不能够出来。

李宏毅:Gated RNN and Sequence generation_第8张图片

李宏毅:Gated RNN and Sequence generation_第9张图片

(6)GRU

GRU相比于LSTM,好处是参数比较少。一个是reset gate(r),一个是update gate(z),z有点像forget gate和input gate的角色。GRU中的h类似于LSTM中的c,h的变化是比较小的。GRU里的input gate和forget gate是联动的,一定要有新的东西进来,才会忘掉东西,当你忘掉东西的时候,就会有新的东西进来。

李宏毅:Gated RNN and Sequence generation_第10张图片

李宏毅:Gated RNN and Sequence generation_第11张图片

2、sequence generation

(1)generation

李宏毅:Gated RNN and Sequence generation_第12张图片

李宏毅:Gated RNN and Sequence generation_第13张图片

李宏毅:Gated RNN and Sequence generation_第14张图片

李宏毅:Gated RNN and Sequence generation_第15张图片

(2)condition generation

李宏毅:Gated RNN and Sequence generation_第16张图片

(1)seq-to-seq

李宏毅:Gated RNN and Sequence generation_第17张图片

(2)dynamic conditional generation(等价于Attention-based model

李宏毅:Gated RNN and Sequence generation_第18张图片

α是一个score,表示h和z(key 关键字)有多match,match这个function是由你自己设计。李宏毅:Gated RNN and Sequence generation_第19张图片

经softmax后,前两个字的attention weight是0.5,说明此时machine比较关注前两个字。

李宏毅:Gated RNN and Sequence generation_第20张图片

李宏毅:Gated RNN and Sequence generation_第21张图片

李宏毅:Gated RNN and Sequence generation_第22张图片

直到出现就结束。

李宏毅:Gated RNN and Sequence generation_第23张图片

(3)tips for generation

用α代表attention的weight,上标代表attend在哪一个component(组件)上,下标表示是在产生第几个word的时候的weight。但是有时候这样的attention并不好,你需要加给weight加一个regularization。

李宏毅:Gated RNN and Sequence generation_第24张图片

 

 

 

你可能感兴趣的:(学习笔记)