lstm需要优化的参数_1-基于LSTM-GA 的股票价格涨跌预测模型

摘要

如何准确地进行股票预测一直是量化金融领域的重要问题。长短期记忆细胞神经网络(LSTM)的出现较好地解决了股票预测这类的复杂序列化数据学习的问题。然而前期研究结果表明单一使用该方法仍存在预测不平衡、陷入局部极值导致能力不佳的问题。基于上述问题,文中利用将遗传算法(GA)解决调参问题来保证模型预测的平衡性,由此构建了新型股票预测模型。该模型分为三部分,首先利用 LSTM 网络进行收盘价的预测,再利用基于遗传算法的判别机制,最终获取下一刻股票的涨跌信号。这一模型不同于先前的研究,主要针对 LSTM 模型的输出模块进行了改进。文中使用了中证500的日内分钟数据进行测试验证。实验得出,改进模型的各方面指标均优于单独的 LSTM 模型。

1 引言

股票市场的预测一直备受关注,然而由于其固有的噪声环境和相对于市场趋势的较大波动性,其掣肘因素特别多,因此该过程非常复杂。以往股票市场预测技术大致可分为基于预测的技术和基于聚类的技术两大类。本文主要讨论基于预测技术的股票价格预测问题。目前针对股票价格预测的研究有人工神经网络(ANN)、支 持向量机(SVM)、时 间序列模型、基于模糊的技术和随机性来优化定价模型等方法。

在前人工作中,人工神经网络(ANN)已被证实善于处理复杂关系问题,但是神经网络的测试和训练速度较慢。此外,过度拟合、陷入局部极小值和黑盒技术是神经网络的缺点。SVM 的特征选择方法无法指出所需的最优特征数量,严重影响了系统精度,因 此 该 研 究 不 易 拓 展。Krauss将 随机森林方法应用到了股 票 预 测 问 题 上,取得了较好成绩。Fischer等评价,随机森林可以 作 为 任 何 创 新 机 器 学 习 模 型 的强大基准。GARCH 是 经 典 的 时 间 序 列 模 型,广 泛 应 用 于 时 间 序列的预测,但它们都假设时间序列的值是一个线性生成过程。然而,市场特征是非线性的,与政治和经济条件及其经营者的期望相互作用,使得 GARCH 假 设 不 适 用 于 许 多 金 融 时 间 序列应用。长短期记忆网络(LSTM)是一种时间递归神经网络,适合处理和预测时间序列中间隔和延迟相对较长的重要事件。这一技 术 特 征 与 股 票 预 测 问 题 有 着 很 高 的 契 合 度,LSTM 弥补了 GARCH 受限于线 性 模 型 的 问 题,极有可能为股票预测问 题 提 供 一 个 解 决 方 案。Fischer等 基于 S&P500数据通过 LSTM 模型进行收益率的预测。实验表明,收益率预测准确率在51%~54% 左 右,要 优 于 随 机 森 林 和 DNN 模型。这样的预测结果并不令人满意,导致准确率不理想的原因有很多,比如模型结构不佳、特 征 样 本 不 适 合、神经网络通病———陷入局部极值。在该问题的讨论中,有研究者调整了模型参数,结合多维度数据处理特征样本等。

延续以往的研究,本 文 基 于 中 国 中证500 股票数据提出了一种基于 LSTM 网络的机器学习方法来预测未来价格,而后又在 LSTM 模型基础上改进为股票涨跌的预测,该方法采用遗传算法改进调参模型,从而提升了预测效果,弥补了单一应用 LSTM 网络的不足。

总体框架设计

股票预测模型分为两部分,由 LSTM 网络和涨跌决策模块组成,如图所示。我们设计了 LSTM 网络,用来学习股票历史数据规律,预测 出 下 一 时 刻 的 股 票 收 盘 价。涨跌决策模块用来将收盘价数据转换成涨跌信号。我们根据具体实验设计了两套算法,一是传统的阈值方式来定义涨跌;另一种是结合股票历史数据来自适应地调整阈值大小定义涨跌。

lstm需要优化的参数_1-基于LSTM-GA 的股票价格涨跌预测模型_第1张图片

遗传算法原理

遗传算法(GA)是一种常用的求解方法,通常用于优化工程、计算机科学、经济管理等领域的问题。与蚁群算法和模拟退火算法等进化算法不同,GA 通过选择、交叉 和 突 变 个 体 来选择最佳物种进行生物繁殖。其模拟生物的进化来解决优化问题,程序化流程如图 所示。GA 算 法 的 核 心 在 于 将 实 际问题编码以便模拟生物的进化过程。为了模拟生态的进化过程,比较常见的方式是 引 入 基 因 链 的 概 念。经过编码把一个物种转换成一条基因链,两条基因链的部分基因进行交换重组,获得新的基因链,这样就完成一次物种进化。GA 算法成熟的编码方式有很多,如二进制编码、格雷码编码、排列编码等。我们选用二进制编 码 方 式 来 描 述 实 际 问 题,完成交叉变异过程。

lstm需要优化的参数_1-基于LSTM-GA 的股票价格涨跌预测模型_第2张图片

结束语

金 融 市 场 预 测 问 题 一 直 是 金 融 领 域 的 核 心 问题。随着机器学习技术 的 进 步,研 究 人 员 开 始 尝 试 将 机 器 学习模型应用到金融领 域 来 解 决 实 际 问 题。借 鉴 之 前 的 研 究,我们从 LSTM 神经网络入手,构建了用于预测股票收盘价 格的神经网络 模 型。 结 合 实 际 应 用 场 景,结 合 LSTM 模 型 和GA 算法来实现 股 票 价 格 的 涨 跌 预 测。通 过 实 验 分 析 发 现,LSTM 的预测在小幅变化 的 价 格 变 动 中 表 现 良 好,但 在 大 幅价格变化时表现 出 滞 后 的 现 象。 结 合 LSTM 和 GA 的 涨 跌预测模型能较为准确地预测市场的涨跌情况,对投资有一定的参考价值。

你可能感兴趣的:(lstm需要优化的参数)