长短期记忆网络(LSTM)

概念

三个门:遗忘门、输入门、输出门

长短期记忆网络(LSTM)_第1张图片

候选记忆单元

长短期记忆网络(LSTM)_第2张图片
长短期记忆网络(LSTM)_第3张图片

记忆单元

长短期记忆网络(LSTM)_第4张图片

长短期记忆网络(LSTM)_第5张图片

隐状态

长短期记忆网络(LSTM)_第6张图片
ot 控制是否让输出,是否要进行重置。
长短期记忆网络(LSTM)_第7张图片

总结

长短期记忆网络(LSTM)_第8张图片

代码实现

import torch
from torch import nn
from d2l import torch as d2l

batch_size,num_steps = 32,35
train_iter,vocab = d2l.load_data_time_machine(batch_size,num_steps)
vocab_size, num_hiddens, device = len(vocab), 256, d2l.try_gpu()
num_inputs = vocab_size
lstm_layer = nn.LSTM(num_inputs, num_hiddens)
model = d2l.RNNModel(lstm_layer, len(vocab))
model = model.to(device)
num_epochs, lr = 500, 1
d2l.train_ch8(model, train_iter, vocab, lr, num_epochs, device)

长短期记忆网络(LSTM)_第9张图片

你可能感兴趣的:(深度学习入门,深度学习,lstm,深度学习,人工智能)