在前面的两篇文章TensorFlow搭建LSTM实现时间序列预测(负荷预测)和TensorFlow搭建LSTM实现多变量时间序列预测(负荷预测)中,我们利用LSTM分别实现了单变量单步长时间序列预测和多变量单步长时间序列预测。
本篇文章主要考虑用PyTorch搭建LSTM实现多变量多步长时间序列预测。
系列文章:
数据集为某个地区某段时间内的电力负荷数据,除了负荷以外,还包括温度、湿度等信息。
本文中,我们根据前24个时刻的负荷以及该时刻的环境变量来预测接下来12个时刻的负荷(步长可调)。
任意输出其中一条数据:
(<tf.Tensor: shape=(24, 7), dtype=float32, numpy=
array([[0.36147627, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.3429366 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.34939995, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.35257494, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.39485145, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.38066387, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.44114256, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.4603167 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.45330796, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.47912365, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.46706894, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.5081953 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.4452976 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.4360156 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.4917237 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.4723147 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.47849187, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.524864 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.52128404, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.47682068, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.4345901 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.39052632, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.33869517, 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244],
[0.3025095 , 0. , 0.90909094, 0. , 0.8333333 ,
0.3255814 , 0.24390244]], dtype=float32)>, <tf.Tensor: shape=(12,), dtype=float32, numpy=
array([0.37805316, 0.34055534, 0.32864106, 0.32987487, 0.32875174,
0.31902698, 0.37937066, 0.3773944 , 0.4436723 , 0.4644258 ,
0.46383727, 0.46949607], dtype=float32)>)
数据格式为(X, Y)。其中X一共24行,表示前24个时刻的负荷值和该时刻的环境变量。Y一共12个值,表示需要预测的12个负荷值。需要注意的是,此时input_size=7,output_size=12。
这里采用了TensorFlow搭建LSTM实现时间序列预测(负荷预测)中的模型:
class LSTM(keras.Model):
def __init__(self, args):
super(LSTM, self).__init__()
self.lstm = Sequential()
for i in range(args.num_layers):
self.lstm.add(layers.LSTM(units=args.hidden_size, input_shape=(args.seq_len, args.input_size),
activation='tanh', return_sequences=True))
self.fc1 = layers.Dense(64, activation='relu')
self.fc2 = layers.Dense(args.output_size)
def call(self, data, training=None, mask=None):
x = self.lstm(data)
x = self.fc1(x)
x = self.fc2(x)
return x[:, -1:, :]
训练和预测代码和前几篇都差不多,只是需要注意input_size和output_size的大小。
训练了30轮,利用前24个时刻的负荷值和其余变量预测接下来12个时刻的负荷值,MAPE为:11.34%。
后面将陆续公开~