【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记

Recurrent Neural Network(RNN)

Example Application

Slot Filling
智慧订票系统:
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第1张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第2张图片
How to represent each word as a vector?
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第3张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第4张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第5张图片
但是光这样,feedforward Network是无法solve这一问题的,因为他无法区别是leave Taipei还是arrive Taipei。
那我们就希望这个neuron network是有记忆的,即看到过arrive/leave这个词。
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第6张图片
这种有记忆的network就叫做 recurrent neural network(rnn)
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第7张图片

举例:

我们假设所有的w=1,没有bias;所有的激活函数都是线性的;
要给memory(每一个时间点都会被洗掉)一个初始值,我们假设给0
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第8张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第9张图片
接下来2被存到memory中
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第10张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第11张图片
rnn会考虑input sequence的order
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第12张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第13张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第14张图片

of course it can be deep…

【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第15张图片

Elman Network & Jordan Network

【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第16张图片

Bidirectional RNN

同时train 一个正向的rnn和逆向的rnn
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第17张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第18张图片

Long Short-term Memory(LSTM)

Input/Output/Forget Gate何时打开/关闭 是需要网络自己学的
LSTM有三个操控信号,一个输入信号
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第19张图片
“-”为什么放在short-term之间,而不是long short之间?
因为他只是比较长的short term。是否遗忘取决于forget gate,关闭时代表遗忘
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第20张图片
假设在四个z输入之前,cell中存了一个“c”
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第21张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第22张图片
如果选择不遗忘c(由f(zf)决定),则需要再加起来即c‘
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第23张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第24张图片

LSTM-Example

【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第25张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第26张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第27张图片
original network
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第28张图片
LSTM 直接将neurons替换成LSTM的cell即可
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第29张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第30张图片

【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第31张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第32张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第33张图片

【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第34张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第35张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第36张图片
GRU是LSTM的simple版本,他只有两个gate,参数较少,所以比较不容易overfitting。simpleRNN指最原始的RNN,下图是目前标准的RNN。
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第37张图片

Learning Target

【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第38张图片
RNN 用 Gradient Descent是可以train的
Backpropagation through time(BPTT) 基于时间的反向传播算法。
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第39张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第40张图片
Why?
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第41张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第42张图片
如何解决?
Clipping.
裁剪,当梯度过大时候进行裁剪。
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第43张图片
为什么rnn会有这种奇特的特性呢?
sigmoid function? no
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第44张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第45张图片
有什么样的技巧可以帮助我们解决这个问题呢?
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第46张图片
可以让你的error surface不要那么崎岖, 在做LSTM时,你可以放心的把learning rate设置的特别小。

为什么我们要把RNN换成LSTM? LSTM可以handle gradient vanishing的问题。

为什么可以handle gradient vanishing的问题?
一旦你的weight,可以对memory的值发生影响时,这个影响会一直存在,除非forget gate关闭。不像rnn,其在每一个时间的会被forget掉。
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第47张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第48张图片

Application

【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第49张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第50张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第51张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第52张图片
如何解决?
CTC
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第53张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第54张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第55张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第56张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第57张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第58张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第59张图片
句法解析
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第60张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第61张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第62张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第63张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第64张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第65张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第66张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第67张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第68张图片

Attention-based Model

可以想成RNN的进阶版本
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第69张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第70张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第71张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第72张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第73张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第74张图片
在这里插入图片描述
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第75张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第76张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第77张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第78张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第79张图片

Deep&Structured

【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第80张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第81张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第82张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第83张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第84张图片
【Recurrent Neural Network(RNN)】循环神经网络——李宏毅机器学习阅读笔记_第85张图片

你可能感兴趣的:(李宏毅机器学习笔记,rnn,人工智能)