股票预测_机器学习预测股票

2. 机器学习技术综述

集成多种人工智能系统的机器学习技术尝试通过对历史数据的学习提取数据模式,这一过程被称为训练或学习,其目的在于实现后续基于新数据的预测(Xiao, Xiao, Lu, and Wang, 2013, pp. 99–100)。使用机器学习方法的实证研究通常分为两个主要阶段。第一个阶段选择与预测相关的变量和模型,从整体的数据集中分别分离出一部分,各用于模型的训练和验证,从而对模型进行优化。第二个阶段将优化后的模型应用到用于测试数据上,从而评估预测的表现。文献中使用到的基本技术包括人工神经网络(ANNs)、支持向量机(SVMs)和随机森林算法(RFs)。

一般来说,神经网络的模型是模仿生物过程建立的。(Adya and Collopy, 1998, p.481),尤其是人类学习和识别模式的过程(Tsaih, Hsu, and Lai, 1998, p.162)。这些神经网络的基本单元——神经元,模仿的正是人体的神经元。神经元通过树突接受输入的变量,并产生输出值(Laboissiere, Fernandes, and Lage, 2015, pp. 67–68)。这些输出可以作为其他神经元的输入。神经网络的基本处理单元的层与层相互连接,每个连接被分配以权重(Lahmiri, 2014a, p. 1450008-5),这些权重会在神经网络学习的过程中进行调整(Kumar and Thenmozhi, 2014, p. 291),这也就是上一段落中提到的第一个训练阶段。这个阶段不仅优化了不同层神经元之间的相互连接,还优化了层与层之间的传递函数的参数,从而最小化误差。最后,神经网络的最后一层负责把来自上一层的所有信号聚集起来形成一个输出信号,这就是整个网络对于某一特定输入数据集的输出。

神经网络尝试通过训练来最小化实证数据的误差,而支持向量机尝试做的是最小化分类误差的上阈值(Huang, Nakamori, and Wang, 2005, p. 2514)。为此,支持向量机接收训练数据,把这些数据从其原始的维度空间转移到维度更高的空间中,并在这个空间中用超平面实现近似于实际分类的线性分隔(Kara, Boy- acioglu, and Baykan, 2011, p. 5314)。该算法通常用于基于模型的输入变量进行的数据分类。在训练阶段尝试最小化超平面距离。数据从原始维度的空间到进行分类的空间的转移是在核函数的帮助下,通过模型训练中的预估参数化完成的,这一过程被Pai和Lin详细描述(2005, pp. 498–499)。

正如Barak, Arjmand 和Ortobelli指出(2017, p. 91),与人工神经网络(ANN)和支持向量机(SVM)一样,决策树也经常出现在与机器学习相关的的文献中。该方法将数据分为包含不同输入变量的子集,直到取得符合训练集数据的基本分类单元。预测结果最准确的分类树被合并为一个森林。这就是Breiman(2001)提出的随机森林算法(RF)。正如Krauss,Do,和Huck (2017),Kumar et al. (2016),Ballings,den Poel,Hespeel

和 Gryp (2015),Patel,Shah,Thakkar,和 Kotecha (2015)以及 Kumar和Thenmozhi (2014)等人所指出的,这种把决策树合并为随机森林的技巧可用于回归和分类。它能够出色地对金融市场进行预测。

5. 文献综述

5.1 被引用最多的文章

根据本文第四节中的文献调查,在被引用最多的文章中,Malkiel和Fama(1970)的经典作品值得关注,因为它提出了有效市场假说(EMH)。根据这个理论,金融市场会立即对可用信息迅速产生响应并做出调整,预测市场的未来走势是不可能的。弱视有效市场假说认为可用信息仅包括资产的历史价格(Malkiel and Fama, 1970, p. 388)。半强式有效市场假说把可用信息的范围扩大到其它公开信息,例如年度报告和新股的发行。强式有效市场假说对应的是某些投资者垄断内部信息的情况。Malkiel和Fama(1970)的理论对于金融市场的预测至关重要,因为建立可持续盈利的系统很可能意味着存在与EMH理论相反的证据(Timmermann and Granger, 2004, p. 16)。

在表12中列出的Engle(1982)和Bollerslev(1986)的几篇文章介绍了用于金融市场预测的重要计量经济学模型。Engle(1982)使用了一种名为自回归条件异方差(ARCH)的模型对时间序列进行建模。在这个模型中,当前的条件方差由之前的误差决定,非条件方差保持恒定。而Bollerslev(1986)则对ARCH模型进行了泛化,认为其自身的方差视属于自回归的过程,从而提出了广义自回归条件异方差模型(GARCH)。尽管ARCH模型和GARCH模型被广泛运用于时间序列的预测,但是它们都把时间序列数据的生成视为一种线性的过程(Cavalcante et al., 2016, p. 197)。然而,非线性是市场的特点,它会与政治、经济以及运营者的期望相互作用(Göçken et al., 2016, p. 320),这就使得GARCH模型无法适用于很多金融时间序列(Lahmiri and Boukadoum, 2015, p. 1550 0 01-2)。因此,又有其他的方法被提出,例如Elman(1990)的方法。Elman提出了一个与某些未来的神经网络模型有相似之处的的预测网络。而坎贝尔测试图Campbell(1987)则尝试了记录用来预测两个不同时期内股票收益的变量。然而,Campbell(1987, p. 393)的最终结论是,不存在能够预测股票收益的所有变化情况的简单模型。

在4节列出的文章中,在Scopus数据库中被引用次数最多的文章是Kim(2003)撰写的文章。如表11所示,这篇文章在Scopus数据库中被引用了546次,平均每年被引用39次。Kim(2003)使用技术技术分析(TA)指标作为预测变量,提出了支持使用向量机(SVM)对韩国股市指数(KOSPI)走向进行分类,并将结果与使用神经网络或案例式推理(CBR)得到的结果进行了比较。在预测的准确性方面,支持向量机(SVM)表现更好。然而,使用Kim(2003)的文章作为参考时要多加谨慎,因为它的结果包含数据透视偏差,即作者是根据测试准确率这一指标来选择最佳的支持向量机参数的。文章使用的测试数据并不是实证数据,并且它们对于模型来说是未知的,而机器学习模型的参数选择应该基于使用真实历史数据进行的训练,因为这正是模型所试图预测的。和Kim(2003)的推理思路相同,表12中包含的Huang等人的文章(2005)也使用了支持向量机对市场的走向进行了分类,并将其模型的表现和线性判别分析(LDA)、二次判别分析(QDA)及Elman反向传播神经网络(EBNN)进行了对比。然而,这些作者们是基于训练数据来选择模型参数的。结果表明,无论是单独使用支持向量机(SVM),还是和其他方法结合起来使用,预测的准确率都会更高。测试使用每周报价来预测日本市场指数(NIKKEI 225)。另一方面,表12中Pai和Lin(2005)的研究也使用了支持向量机(SVM)作为预测方法,不像Kim(2003)和Huang等人(2005)对价格的走向进行预测,Pai和Lin预测的是股票的价格。此外,Pai和Lin(2005)将支持向量机(SVM)和自回归整合移动平均值(ARIMA)结合起来形成的一个混合系统,这一系统比单独使用这些模型可以得到更小的误差。

支持向量机(SVM)分类模型可以被改造为回归模型来预测金融时间序列中的值。这种模型被称为支持向量回归(SVR)。例如,在Huang和Tsai(2009)的作品中就使用了这个模型。作者们将支持向量回归(SVR)和自组织特征映射网络(SOFM)分两个阶段进行结合,来预测台湾市场的某一指数(台股指数)。自组织特征映射网络(SOFM)是一种根据训练样本的相似性对其进行空间映射的方法(Huang 和Tsai, 2009, p. 1531)。模型的输入是技术分析(TA)的指标,它们由自组织特征映射网络(SOFM)根据相似性分组为不同的簇,然后这些簇被输入到支持向量回归(SVR)模型中。Huang和Tsai(2009)提出的混合模型所得到的结果优于那些仅仅使用支持向量回归机(SVR)作为预测模型所得到的结果。在Yu,Chen,Wang和Lai(2009)的模型中(文章见表12),作者使用了一种支持向量机的衍生体,即最小二乘支持向量机(LSSVM),它的计算成本比原始的支持向量机(SVM)低,并且具有很好的泛化能力(Yu et al., 2009, p. 88)。作者们提出了一种使用遗传算法(GA)改进后的最小二乘支持向量机(LSSVM)。遗传算法是一种为每一代选择最佳值的算法(Yu et al., 2009, p. 88)。因此,Yu等人在从技术分析(TA)指标和基本面分析指标中选择变量时,以及在优化最小二乘支持向量机(LSSVM)参数的过程中,都使用了遗传算法(GA)。他们的算法得到的结果优于普通的支持向量机、ARIMA、LDA和使用了反向传播的神经网络。值得注意的是,作者们使用了McNemar检验来认真比较了各个模型的表现。并不是所有研究都会走这么远。

从表11和表12可以看出,在与市场预测相关的被引用最多的文章中,大多数都使用了神经网络的变体。然而,在文本预测中也另外一种算法也经常出现,那就是支持向量机,也即表11中被引用最多的文章(Kim, 2003)中使用的算法。表11中Kara等人(2001)文章就比较了支持向量机(SVM)和人工神经网络(ANN)这两种基本模型对土耳其市场的每日走向的预测能力。除了使用新兴市场的指数值作为数据之外,Kara等人(2011)的作品也值得注意。这些方面还包括,他们在模型的参数化过程中考虑到了市场整个十年间的每日价格,以确保模型尽可能地具有通用性,在训练模型时,也使用了所有十年间的数据样本。作者们的结论是,人工神经网络(ANNs)在由作者所明确的条件下具有预测方面的优势。然而,Kara等人(2001)使用技术收盘时的价格计算出技术分析(TA)指标,再将这些指标作为模型的输入来预测每日价格在收盘时的走势。显然,收盘价格只有在市场收盘后才能得到,而这时市场走势已经确定了。因此,在市场收盘后使用当前收盘价格作为技术分析(TA)指标,并将其输入给机器学习算法,通过机器学习来预测当前价格走势,是没有现实意义的。但是这种方法可以更直观地对模型进行比较。

在表12中列出的文章中,最早较有效地解决股票价格预测问题的是Yoon,Swales Jr和Margavio(1993)的研究。作者们将神经网络应用到预测股票相对于市场的表现中。这篇的文章基于一篇较早的论文(Yoon et al., 1993, p. 51)之上,在这篇较早文章中已经取得了较好的预测成果。Yoon等人的文章表明,与判别分析相比,神经网络预测表现更好。神经网络作为一种基于人类神经系统的模型(Göçken et al., 2016, p. 322),已经被广泛应用于预测(Göçken et al., 2016, p. 320)。表13中列出了该学科中被引用次数最多的文章,包括来自Hornik,Stinch- combe和White(1989)以及Hornik(1991)的研究。这些文章为机器学习的广泛应用奠定了基础,并严谨地证明了神经网络可以对数学函数进行具有一定准确度的逼近。在Abu-Mostafa和Atiya(1996)的文章中,作者对神经网络的这种逼近能力进行了探讨。该文章在提出基于神经网络和线索的系统之前,提出了金融市场预测的初步方法。这些线索就是将训练数据和已有知识结合在一起进行学习的过程。比如说,任何一种金融资产的已知属性(Abu- Mostafa 和Atiya, 1996, p. 209)就是一种已有知识。然而Abu-Mostafa和Atiya(1996)在“线索”一词的正式定义和验证上最终仍然还是含糊不清的。

在表11和表12中列出的文章也是探索神经网络的。其中尤其值得注意的是Adya和Collopy(1998)提出的综述文献,该综述旨在总结用于评估神经网络预测表现的标准。作者们提出的标准包括使用测试数据(除样本之外的)进行验证、模型的泛化能力和稳定性。在表12中列出的另一篇综述由Zhang,Patuwo和Hu(1998)发表,是一篇关于在金融市场预测中使用神经网络的研究。作者们选择人工神经网络(ANNs)作为预测模型,对以往文献的结果进行了评论,最终总结出,神经网络适合应用于金融市场预测,这是因为其适应能力和在处理时间序列时表现出的处理非线性数据的能力(Zhang et al., 1998, p. 55),等等。

从表11和表12中所列出的文章中可以看出,有关金融市场预测的文献涉及到许多基于神经网络的模型的使用。例如,Kamstra和Donaldson(1996)的文章将人工神经网络(ANNs)和对发达市场指数的预测结合到一起,这些指数包括美国标准普尔500指数、NIKKEI、TSEC和 FTSE。美国标准普尔500指数也被Tsaih等人(1998)用来检验他们提出的混合预测模型。作者们将技术分析(TA)中的变量和专家和学者们提出的规则作为输入喂给人工神经网络(ANNs)模型,并用其预测该指数的方向。他们给案例打上“明显”和“不明显”的标签,并明确定义“明显”和“不明显”的含义。股票回报的走势也是表11中Fernandez-Rodrıguez、Gonzalez-Martel和Sosvilla- Rivero在使用的因变量。作者们将人工神经网络(ANNs)应用于马德里的市场指数,将九天前的的收益作为自变量。结果表明,在几乎所有的测试中,神经网络的预测结果都优于买入-持有策略(Fernandez-Rodrıguez et al., 2000, p. 93)。买入-持有策略是指在给定的一段时间内购买和持久一定的资产(Chiang et al., 2016, p. 201),从而使得资产暴露于市场价格的变化之中。Fernandez-Rodrıguez等人(2000)的研究的显著特征是,使用滞后收益作为神经网络的输入,而不是传统的技术技术分析(TA)指标。然而,作者们并没有提供这两种方法之间的对比。

作为表11和表12中的重要文章,Leung,Daouk和Chen(2000)也将人工神经网络(ANNs)和其他的模型进行了对比。作者们使用神经网络、LDA和回归方法对比了S&P500,FTSE和NIKKEI指数的每月走势和预测结果。模型中使用的输入变量包括:利率、工业生产指数、消费者价格指数、以往收益。该项研究得到的主要结论是,用于方向性预测的模型的表现优于用于预测具体数值的模型(Leung et al., 2000, p. 188)。得出这一结论的原因不仅在于预测的成功,也在于经营策略所获得的回报。在表11和表12中的另一篇重要研究中,Chen,Leung和Daouk(2003)用人工神经网络(ANNs)预测股市回报。作者们使用概率神经网络(PNN)对台湾这一新兴市场进行了预测。这些网络使用了贝叶斯概率,能够更好地处理离群值,并且能够更快地学习(Chen et al., 2003, p. 906)。Kim和Han(2000)的文章讨论了通过遗传算法(GA)获得人工神经网络(ANNs)的输入变量时对变量进行的降维。该算法用来离散化技术分析(TA)指标的连续值,并优化网络连接中的权重,从而优化网络预测性能。表11中Leigh,Purvis和Ragusa(2002)的文章也讨论了遗传算法(GAs)在神经网络优化中的使用,并将它们的预测性能与一种称为“bull flag”的技术分析(TA)可视化模型进行比较。尽管这一模型由Leigh(2002)等人定义,但其最终形式可能会根据其他研究人员为模式识别工具构建模板方式的不同而有所不同。这也是技术分析(TA)可视化模型识别的一大挑战,因为它们通常基于松散的或者模棱两可的定义。

表12中的Thawornwong和Enke(2004)以及Enke和Thawornwong(2005)的文章研究了神经网络的预测结果如何根据输入变量选择的不同而变化。为此,他们根据模型使用的过程中有多少信息被添加,提出了衡量每个输入变量相关性的手段。作者们得出的结论是,随着时间发展而动态选择变量的模型盈利更多且风险更低(Thawornwong和Enke, 2004, pp. 226–227)。而Armano,Marchesi和Murru(2005)则提出,在神经网络预测变量的各层之前,添加一个用来选择预测变量的层,它以技术分析(TA)的指标作为输入。只有最佳的预测变量会被遗传算法选择。尽管使用的技术分析(TA)指标数量有限,即使考虑到交易成本,其结果也优于买入-持有策略。这是Armano等人工作的一个不同之处(2005)。Hassan,Nath和Kirley(2007)也使用了遗传算法(GA), 不过它被用来优化一个隐藏的马尔可夫模型的参数,而模型中大部分参数的调整则通过人工神经网络(ANN)来实现。隐马尔可夫模型(HMM)建立在预测中经常使用的的过渡矩阵和概率的基础之上,例如DNA测序和语音识别等(Hassan et al., 2007, p. 171)。Hassan等人(2007)提出了一种同时结合了人工神经网络(ANN)、遗传算法(GA)和隐马尔可夫模型(HMM)的模型,并通过对第二天收盘价格的预测对其进行了测试。然而,这他们的测试对象仅限于三只计算机领域的股票,其预测结果非常接近ARIMA模型。同时,他们使用的历史数据也十分有限,仅包括大约两年的每日股票价格。

表12中Atsalakis和Valavanis(2009)的文章对关于神经网络在金融市场预测中应用的研究做出了一个很好的回顾。值得注意的是,这篇文章同时也是本文第4部分的书目调查中表11中列出的文章中被引用最多的文章之一。此外,如表14所示,Atsalakis和Valavanis(2009)的文章也出现在耦合最强的文章列表中,并且,根据第3部分中介绍的方法,它是关于金融市场预测的主要文献的一部分。这篇重要文献分析了100篇文章,并根据文章所分析的市场、每种模型的输入变量、样本大小、模型表现和是否有不同的模型间的比较对它们进行了分类。在文章的发现中值得我们注意的有:平均使用的变量个数为4到10个;大约共有30%的文章预测了收盘价; 20%使用技术分析(TA)指标作为输入变量(Atsalakis和Valavanis,2009,pp.5933–5936)。然而,大多数文章都采取了将技术指标和基本面分析指标结合起来作为其模型的输入的方法(Atsalakis and Valavanis, 2009, p. 5936)。

除了人工神经网络(ANNs)和支持向量机(SVMs)外,在第4部分中被引用最多的文章还涉及一些其他的预测方法。表12中Chiu(1994)的文章使用模糊逻辑对数据进行分组和分类。分组的目的是创建更大的组,从而能够代表整个系统的行为(Chiu, 1994, p. 267)。Chiu(1994)的文章没有对金融市场进行分类,但是他的方法可用于预测股票价格和指数的方向。Wang(2002)也在台湾市场的预测系统的构建过程中使用了模糊逻辑。如Schumaker和Chen的文章指出的,预测股票价值的另外一种方法是将表示算法和新闻的文本相关性与机器学习结合起来(2009, p. 20)。这些作者们报告的预测结果优于Pai和Lin(2005)使用支持向量机(SVM)和ARIMA混合得到的预测结果。

5.2 文献耦合度最高的文章

如5.1部分中研究的文章所示,神经网络是应用于金融市场价格和走势预测的主要机器学习方法。例如Thawornwong,Enke和Dagli(2003)使用技术分析(TA)指标作为输入,仅使用神经网络算法就预测了三只美国股票的每日走势。结果表明,技术分析(TA)指标在短期趋势的预测中可能会出现前后不一致,而使用神经网络及其指标可以提高预测表现(Thawornwong et al., 2003, p. 323)。此外,使用技术分析(TA)指标和神经网络比买入-持有能产生更好的策略(Thawornwong et al., 2003, pp. 320–321),这不仅反映在预测准确性上的,也反映在模拟的盈利性上。另外一个例子是是Rodríguez-González,García-Crespo,Colomo-Palacios,Iglesias和Gómez-Berbís(2011)的文章。他们将神经网络应用到相对强度指标(RSI)上。与单独使用该指标相比,神经网络的预测表现更好。在研究神经网络对发展中市场的预测效果时,Cao,Leggio和Schniederjans(2005)将单变量和多元的人工神经网络(ANN)应用到了中国股票上,并通过平均绝对百分比误差(MAPE)来衡量模型的表现。作者们的结论是,神经网络已经超越了线性模型的预测能力,例如资本资产定价模型(CAPM)。该模型假设资产的收益与其风险有线性关系(Cao et al., 2005, p. 2501)。作者在文章结论中指出,神经网络可能在发展中市场价格的预测中表现更好。

神经网络也已经被应用于混合模型。Wang等人(2012)将能够捕获时间序列线性特征的指数平滑模型(ESM)、ARIMA以及BPNN(一种用于解决这些序列非线性特征的神经网络)相结合来进行预测。通过预测中国SZII指数的每月收盘价格和美国DJIA指数的每月开盘价格进行测试。作者们得出结论:混合模型比单个模型预测表现更好。此外。Wang等人(2012)可以明确地指出哪些变量是用来作为输入的,并且可以简短地证明,选择一个指数的开盘价格和选择另一个指数的收盘价格这一行为是合理的。Kumar和Thenmozhi(2014)也将混合模型应用在新兴市场上。他们结合了ARIMA、人工神经网络(ANN,支持向量机(SVM)和随机森林算法(RF)来预测印度市场某指数的每日回报。作者们认为,金融行业的时间序列并不是绝对线性或者是绝对非线性的(Kumar and Thenmozhi, 2014, p. 288),这也证明了将这两种预测模型组合在一起的合理性。这篇文章指出,使用ARIMA和支持向量机(SVM)的混合模型可以得到更好的预测结果和盈利。除了传统的误差度量指标,例如平均绝对误差和均方根误差,他们还对混合模型进行了收益、波动率、最大跌幅和上下波动百分比的比较。这些指标可以在将来的文章中衡量模型的表现。

Tsai和Hsiao(2010)的文章使用了在处理数据之前选择变量的方法,然后再使用人工神经网络(ANN)处理数据来预测价格的走向。主成分分析(PCA)、遗传算法(GA)、决策树及它们的组合也被用到。这一研究表明提前选择变量可以提高神经网络的预测性能。主成分分析(PCA)是一种多变量统计方法,该方法可以从原始变量中提取出数量更少但且高度相关的因素或组成部分(Tsai and Hsiao, 2010, p. 260)。这种方法有多种变体,其中一些在Zhong和Enke(2017)的文章中被研究。这项研究出现在选择变量的过程,在将变量应用于人工神经网络(ANN)之前。尽管得出了在选择变量的过程中进行预处理可以提高神经网络的预测性能的结论,Zhong和Enke(2017,p.137)的研究工作表明,相对于将主成分分析(PCA)和人工神经网络(ANN)的变体结合的方法,传统的主成分分析(PCA)是一种更简单且更有效的方法。Tsai和Hsiao(2010)以及Zhong和Enke(2017)分别通过t-检验来确保各自模型的性能指标差异具有统计学意义,从而确保其预测结果更具有鲁棒性。同样,Chiang等人(2016)在将变量应用到人工神经网络(ANN)之前,也根据每个变量贡献信息的能力进行了选择。在Chiang等人(2016)的研究中,研究者在比Tsai和Hsiao(2010)以及Zhong和Enke(2017)更小的集合中选择变量,但是他们通过小波变换平滑数据来对结果进行了增强。

Li和Kuo(2008)也探索了在应用神经网络之前,使用小波函数对数据进行预处理的方法。他们使用了一种称为离散小波变换(DWT)的技术,该技术能够将数字信号分解成它们的分量。然后,这些分类会被一类名为自组装图(SOM)的特殊神经网络处理,来生成短期和长期的买入和卖出信号。Li 和 Kuo(2008)的文章的卓越性在于其对长期和短期交易信号的模式标识方法,以及其定义明确、可复制并且可盈利的交易策略。Chang和Fan(2008)也使用了小波变换进行数据预处理,但是他们根据数据的不同将其分为映射到不同模糊逻辑规则多个簇。接下来,Chang和Fan(2008)应用了一个系统用来解释预测中的这些规则,并使用了K近邻算法(KNN)来减少误差。尽管仅使用了台湾某指数两年的每日价格这一小数据集,作者们还是强调指出,其结果是优于其他模型(比如BPNN)的。小波变换也被用来减少指数价格的短期噪声。例如,在Chiang等人(2016)的文章中,作者们指出,在应用于神经网络之前,使用小波变换对数据进行平滑处理,模型将带来更多的回报。这和前文所说的相符。

广泛应用于时间序列问题的模糊逻辑通过人类语言形式进行阐释(Chen et al., 2014, p. 330)。比如,在 Chen等人的研究就在时间序列问题中使用了模糊逻辑,其目的是克服其他模型(比如ARIMA和GARCH)所包含的线性假设的限制。在一个更早的研究中,Ang和Quek(2006)将神经网络和模糊逻辑相结合,得到的模型比其他传统的神经网络模型能更好地预测股票每日价格。Ang和Quek(2006)提出的系统还具有规则的可解释性,这是传统的人工神经网络(ANN)和支持向量机(SVM)模型都不具备的特性(Al Nasseri, Tucker, & de Cesare, 2015; Yu et al., 2009)。

5.1部分中列出的文章表明,许多文章都通过各种方法对预测结果进行比较。例如,表14中Ballings等人(2015)的文章比较了多个分类器的组合,其中就包括人工神经网络(ANN)、支持向量机(SVM)和随机森林算法(RF)。结果表明,使用随机森林算法(RF)预测得到的年度股票价格走势的准确率更高(Ballings et al., 2015, p. 7051)。Ballings等人的研究的明显特征是,作者们选择了很多种分类器和很多种输入变量,这些变量平均来自5.767个欧洲公司的基础数据。因此,作者们的预测仅限于年度预测,因为这是一种非常低频率的数据,通常按月或者按年发布。Gorenc Novak和Velušček(2016, p. 793)研究了第二天的股票价格的预测,但它们仅使用了支持向量机(SVM)。他们的研究之所以能够在众多论文中脱颖而出,是因为他们使用了每日资产的最高价值,而不是传统的收盘价格。Gorenc Novak和Velušček(2016, p. 793)观察到,最高价的波动幅度比传统的收盘时的收盘价格的波动性要小。因此,如作者们所说,预测每天的最大值是更简单的。

最后,在表14中列出的使用文本分析来进行金融市场预测的文章值得被着重介绍。Hájek,Olej和Myskova(2013)分析了公司年度报告中的情感,处理了其中包含的会对资产价格会产生正面或负面影响的词语。公司报告是公司与投资者之间沟通交流的工具,其中包含了大量的描述性词语(Hájek et al., 2013, p. 294)。作者们首先通过之前构建好的词典对这些词语进行处理,然后将所得到的的分类信息输入到神经网络和支持向量回归机(SVR)模型中。他们提出的方法被证明能够预测比测试所使用的数据的晚一年的收益。Al Nasseri等人(2015)也进行了情感分析,但他们使用的文本来自一个专门研究股票市场的博客。作者们得出的结论是,博客文章中使用的词语的变化能够预测出美国DJIA指数的走向趋势。

5.3 具有更多共引关系的文章

Kimoto,Asakawa,Yoda和Takeoka(1990)的研究使用了组合神经网络来对日本股市指数每周买入或卖出做出单一的预测。他们将六个经济指标输入给一个基本的的人工神经网络(ANN),其结果比简单的买入-持有策略更能获利。Kimoto等人(1990)的重大创新在于他们指出了,预测的规则必须随着时间,改变市场状况。因此,随着时间的流逝,神经网络会通过固定滑动窗口的方式重新训练。需要定义一个预测周期,它会随着新数据的到来向前移动。Chang,Liu,Lin,Fan和Ng(2009)也使用了经典的神经网络模型,然而,他们通过将CBR与预测结果相结合,提高了模拟场景中获得的回报。作者们还使用了基于各个公司财务状况指标的股票选择模型。对于所有9个文章中选择的股票,Chang等人(2009)将人工神经网络(ANN)和CBR组合的模型获得的收益要大于每种模型单独使用获得的收益。这篇论文的创新之处包括,预先选择有可能盈利的股票,并且仅仅重新使用系统之前取得成功的价格模型案例。

与Kimoto等人(1990)和Chang等人(2009)使用的模型相反,Tay和Cao(2001)的文章通过使用支持向量机(SVM)获得了更好的预测结果。作者们将他们的结果和使用神经网络的结果进行了比较,其结论为,支持向量机(SVM)之所以能够取得最佳的表现是在于:最小化的结构风险,因为使用支持向量机(SVM)优化的参数的数量更少;神经网络可能会取得局部性结果,即在局部收敛,没有获得全局的最优解(Tay and Cao, 2001, p. 316)。最后,表15中Box,Jenkins,Reinsel和Ljung(2015)的书对时间序列预测的综合应用做出了详尽的介绍,其内容不仅限于金融时间序列。这本书解释了线性技术、相关性、滑动平均以及自回归模型。作为关于时间序列理论的基础纲要,Box等人的作品(2015)并不仅限于机器学习领域,尽管如此,它仍然是本研究调查得出的的参考文献中被引用次数最多的文献之一。

你可能感兴趣的:(股票预测)