量化投资时间序列篇:基础理论篇

数学、统计学或者机器学习如何能够帮助我们提升交易分析的效率?——智能投研。

这个问题比寄希望于让人工智能来代替我们交易会更有意义,至少目前是这样。在很多领域,深度学习似乎做得不错,但无论是学习的效率,还是学习的本质,AI较人类还差得太远太远,更不用说,投资这种人类本身都说不清楚是科学还是艺术的事情。

投资里,我们最常见的数据是交易的时间序列,最常见的数据集是日线OHLCV数据。

时间序列分析属于统计学的范畴,无论是一维的时间序列还是多元时间序列分析,都在统计系的范围以内。但由于与经济学关联很深,一般作为计量经济学的重要组成基础。

Quant本身可以分两大类:

金融与计量经济领域的quant偏向于时间序列分析——需要的数据量相对较少,所以一般量化投资从时间序列分析开始。

机器学习是另一种做quant的手段,与时间序列分析是并列的一种手段。

时间序列有两种模式,一是均值回归; 二是趋势跟随(动量效应)。

均值回归:如果时间序列是平稳的,有一个均值,产品价格围绕均值操作。如果时间序列是随机游走,下一刻的状态没法根据过往判断,与过往价格是独立的,那就没法在证券市场构建统计模型赚钱。单只股票的价格很可能就是随机游走的。但是一个股票组合,可能不是随机游走(平稳)的,也就有了研究的必要。——可以通过统计方式,构建一个“平稳”的“套利”投资组合。

时间序列里,有趋势、周期、自相关性,剩下就是随机游走。

平稳性(stationarity)是时间序列分析的基础。严格平衡,说白了就是收益率来自于同一个概率分布:对于所有的  ,  的概率分布都是一样的、不随时间变化。这样的时间序列  就是(严格)平稳的。但这个条件太严格了,一般我们关注弱平稳,即均值与方差具备(二阶)平稳性。但即便是弱平稳,金融时间序列要达到标准也不容易。因此,我们需要把时间跨度缩短或者通过更复杂的非线性模型对波动率进行建模(比如 GARCH)。

更加高级的时间序列模型来对自相关性建模。在这方面,自回归模型(AR)和滑动平均模型(MA),以及它们二者的组合 —— 自回归滑动平均模型(ARMA) —— 都是非常有力的工具。

P阶自回归,很好理解,就是当期收益率,使用过去P期来线性拟合:

ARIMA模型是在ARMA模型的基础上解决非平稳序列的模型,因此在模型中会对原序列进行差分。

基于时间序列的分析应用于量化投资符合直觉。因为我们首先获得的就是时间序列相关数据,技术分析的金融基本假设也是历史可以重演,就是历史中含有未来可以重现的模式,若是如此,则时间序列的分析模型会很有用。

但事实在,不要指望一个指标或者模型直接解决问题,而是帮我们更好地理解数据。

比如历史收益率只是一个方面,那么结合估值情况呢?结合RSRS指标呢。

(公众号: 七年实现财富自由(ailabx),思想者,行动派;用数字说基金,用基金做投资组合,践行财富自由之路)

你可能感兴趣的:(量化投资时间序列篇:基础理论篇)