在本文中,我们将使用神经网络,特别是LSTM模型来预测时间序列数据的行为。需要解决的问题是经典的股市预测。所有使用的数据和代码都可以私信我。
虽然这是一个老问题,但直到今天仍未解决。事实很简单:股价是由几个因素决定的,历史股价只是其中的一小部分。因此,预测价格行为是一个非常棘手的问题。
摘要
首先,我将介绍一些数据可视化的数据集。然后,我将简要讨论使用移动平均算法预测股票市场行为的难易程度及其局限性。接下来,简要介绍递归神经网络和LSTM的概念,并以LSTM为例对单个公司的股价进行了预测。最后,我将展示用于同时预测4家公司价格的LSTM,并比较结果,看看随着我们同时使用更多公司,预测是否有所改善。
数据可视化
数据集是从Yahoo Finance以CSV格式下载的。它具有4个公司的股票价格在01/08/2010至01/07/2019期间。我们将它们称为公司A,B,C和D.
基本步骤是使用Pandas打开CSV文件。首先看看数据:
df_A = pd.read_csv(‘data/company_A.csv’)df_A[‘Date’] = pd.to_datetime(df_A[‘Date’])df_A.tail()
Plt.figure(figsize = (15,10))plt.plot(df_A['Date'], df_A['Close'], label='Company A')plt.plot(df_B['Date'], df_B['Close'], label='Company B')plt.plot(df_C['Date'], df_C['Close'], label='Company C')plt.plot(df_D['Date'], df_D['Close'], label='Company D')plt.legend(loc='best')plt.show()
移动平均线
在这个问题中使用的一个经典算法是移动平均线(MA)。它包括计算m过去观察天数的平均值,并用这个结果作为第二天的预测。为了证明这一点,这里有一个移动平均线的例子,使用m作为公司收盘价的10和20天。
df['MA_window_10'] = df['Close'].rolling(10).mean().shift() #shift so the day we want to predict won't be useddf['MA_window_20'] = df['Close'].rolling(20).mean().shift()
当我们尝试使用移动平均线预测未来10天的收盘价时,结果如下:
每条红线代表基于过去10天的预测。因此,红线是不连续的。
使用指数移动平均线(EMA),我们实现了一些小的改进:
对比MA和EMA:
这种方法很简单。我们真正想要的是提前n天预测股票的未来走势,MA和EMA都无法完成这项任务。
递归神经网络(RNN)
要了解LSTM网络,我们首先需要了解递归神经网络。当过去的结果对当前结果有影响时,这种网络用于识别模式。RNN使用的一个例子是时间序列函数,其中数据顺序非常重要。
在这种网络架构中,神经元不仅使用常规输入(前一层输出)作为输入,还使用其先前状态作为输入。
要注意H代表神经元状态。因此,当处于状态H_1时,神经元使用参数X_1和H_0(其先前状态)作为输入。该模型的主要问题是记忆丧失。旧的状态很快就会被遗忘。在我们需要记住刚刚过去的序列中,RNN无法记住。
LSTM网络
LSTM网络起源于RNN。但它可以通过改变神经元架构来解决记忆丧失。
新神经元有3个门,每个门都有不同的目标。门是:
LSTM神经元仍然接收其先前状态作为输入:
LSTM预测单个公司
最后,让我们使用LSTM来预测公司A的行为。
但首先,考虑以下参数。我们希望预测未来n天(foward_days)输入过去观察到的m天(look_back)。所以,如果我们有过去m天的输入,网络输出将是未来n天的预测。我们将在Train和Test中对数据进行拆分。测试将由k个周期(num_period)组成,其中每个周期都是一系列的n天预测。
look_back = 40forward_days = 10num_periods = 20
现在,我们用Pandas打开CSV文件,只保留我们将使用的列,即日期和收盘价。A公司的初始收盘价图表是:
plt.figure(figsize = (15,10))plt.plot(df)plt.show()
按照顺序,我们对输入进行缩放,在Train/Validation和Test中对数据进行拆分,并将其格式化以提供模型。
现在,我们构建并训练模型。
NUM_NEURONS_FirstLayer = 128NUM_NEURONS_SecondLayer = 64EPOCHS = 220#Build the modelmodel = Sequential()model.add(LSTM(NUM_NEURONS_FirstLayer,input_shape=(look_back,1), return_sequences=True))model.add(LSTM(NUM_NEURONS_SecondLayer,input_shape=(NUM_NEURONS_FirstLayer,1)))model.add(Dense(foward_days))model.compile(loss='mean_squared_error', optimizer='adam')history = model.fit(X_train,y_train,epochs=EPOCHS,validation_data=(X_validate,y_validate),shuffle=True,batch_size=2, verbose=2)
得到的结果是:
仔细观察测试集:
请注意,每条红线表示一个基于过去40天(look_back)的10天预测(forward - days)。有20条红线,因为我们选择在20个周期(num_periods)上进行测试。这就是为什么红色的预测线是不连续的。
通过对所有公司重复相同的过程,测试集上的最佳结果是对公司C的预测:
尽管这是最好的模型,但结果并不是很好。可能导致这一结果的原因很多。其中一些可能是:
LSTM预测4家公司
最后,我们将使用LSTM模型预测所有4家公司的行为,A,B,C和D,并与单一的LSTM公司结果形成对比。目的是分析使用来自多家公司的数据是否可以改善每家公司的个人预测。
需要指出的是,所有4个csv都有相同的日期。这样,网络就不会收到来自一家公司的未来信息来预测另一家公司的价值。
初始数据是:
对模型进行数据归一化和格式化之后,对模型进行训练:
NUM_NEURONS_FirstLayer = 100NUM_NEURONS_SecondLayer = 50EPOCHS = 200#Build the modelmodel = Sequential()model.add(LSTM(NUM_NEURONS_FirstLayer,input_shape=(look_back,num_companies), return_sequences=True))model.add(LSTM(NUM_NEURONS_SecondLayer,input_shape=(NUM_NEURONS_FirstLayer,1)))model.add(Dense(foward_days * num_companies))model.compile(loss='mean_squared_error', optimizer='adam')history = model.fit(X_train,y_train,epochs=EPOCHS,validation_data=(X_validate,y_validate),shuffle=True,batch_size=1, verbose=2)
结果是:
仔细观察测试集:
是时候对比结果了。单个公司LSTM的结果显示在左侧,4个公司LSTM的结果显示在右侧。第一行显示测试集中的预测,第二行显示所有数据集中的预测。
结论
仅仅用历史价格来预测股票市场的行为是不可能的。LSTM的预测是不可接受的。即使使用几家公司的历史价格,预测也变得更糟。