pytorch 搭建LSTM模型

两部分重要内容:1、数据各部分(模型输入、LSTM输入、LSTM输出、模型输出)维度的说明 :注:一定要清楚每个环节输入数据以及输出数据的维度,还有每个维度代表的含义(特别是 batch _size、seq_len、feature_size, timestep, embedding_size 这些变量代表什么。

一、参数配置

下面是本项目需要使用的参数以及相关变量,为了方便我们将所有参数封装到一个类中,也可以使用 argparse 参数解析方式。为了说明数据各个阶段的维度变化,特此定义了如下变量大小,小伙伴需要记住下面变量的值一遍理解下文说明各个阶段的维度大小。
 

class Config():
    data_path = '../data/wind_dataset.csv'
    timestep = 1  # 时间步长,就是利用多少时间窗口
    batch_size = 32  # 批次大小
    feature_size = 1  # 每个步长对应的特征数量,这里只使用1维,每天的风速
    hidden_size = 256  # 隐层大小
    output_size = 1  # 由于是单输出任务,最终输出层大小为1,预测未来1天风速
    num_layers = 2  # lstm的层数
    epochs = 10 # 迭代轮数
    best_loss = 0 # 记录损失
    learning_rate = 0.0003 # 学习率
    model_name = 'lstm' # 模型名称
    save_path = './{}.pth'.format(model_name) # 最优模型保存路径

config = Config()

pytorch 搭建LSTM模型_第1张图片

pytorch 搭建LSTM模型_第2张图片

 

for index in range(len(data) - timestep):
    dataX.append(data[index: index + timestep][:, 0])
    dataY.append(data[index + timestep][0])

dataX = np.array(dataX)
dataY = np.array(dataY)

例如,data[0:1]选择数据数组的第一行作为二维子数组,data[:1]是等效的。类似地,data[:,0:1]选择数据数组的第一列作为二维子数组。

这段代码的理解:data[index: index + timestep] 选择了一个连续的时间步数段,其起始索引为 index,结束索引为 index + timestep,这里 timestep 是一个预定义的变量。注意,这里的 index 可能是时间序列的起始位置,而 timestep 是所选时间步数段的长度。这段时间步数段的所有列都将包括在所选的子数组中。

 

你可能感兴趣的:(pytorch,lstm,深度学习)