统计套利

利用相关系数来进行套利,看到价差并不为平稳序列,回测结果也就不是很好,所以想到利用协整关系来构建股票的线性组合,使得股价差为平稳序列,从而在真正意义上构建一个套利策略。看到有其他小伙伴也做过类似研究,但是都是以样本内得到的结果去回测样本内的数据,所以会有一定的不真实性。此研究以14年到15年数据作为样本来检验协整性,当然协整关系是一个动态过程,所以检验出来的协整性只能在统计意义上满足样本内数据,但我们假设这个协整性还继续保持,以16年数据来进行回测来看看实际效果如何。

之前我们谈到了利用两只股票之间的相关系数进行配对交易,但我们能通过两只相关性较高的股票对之间的差价图看出,相关性高他们之间的价差并不一定会是一个平稳序列,简单来说我们无法利用这个不收敛的价差来进行套利。那么要进行真正统计意义上的套利得需要什么样的条件呢,那么就引出了我们的协整关系。首先谈协整我们得先知道平稳这一个概念,一个平稳序列是指数据的期望不会随时间改变,数据的方差与协方差不会随时间而改变,并且固定一个时间,往前与往后进行回归都是相同的。所以平稳的股票是有很多统计上的好性质,可以进行套利操作,当股价达到一定高度时就要卖出,当股价低于一定数值时就需要买入,也就是俗称的低买高卖。但是一般在现实生活中不存在平稳的股票,所以很难去预测他在什么地方是高点什么地方是低点,这也就解释了为什么这么多人都是买高卖低了。

虽然一般不存在平稳的股票,但是几支股票的线性组合就可能是一个平稳序列,这就是我们一般意义上提到的协整关系,通过一些股票的组合来构造平稳的序列来进行套利。但是这个平稳性也是在一定时间段来说的,我们只能根据以往的数据来判断在这段时间内是协整的,但是无法断言在之后交易的时段也是协整的。

我们来只管看一下一个平稳的序列长什么样,最简单的一个噪声序列他就是一个平稳的序列。

上图构建了一个以100为均值的噪声序列,可以看出这个序列的期望与方差协方差均不随时间而改变。我们来看看两个序列本身是非平稳的序列是怎么样的。

可以看出期望是随时间递减的,明显不是平稳序列,我们通过差分来看看是否能构造平稳序列。

通过差分我们得到的就是一个跟噪声序列长的一样的平稳序列了。那么一般股票序列是非平稳的我们怎么去找协整关系构建平稳的序列呢。

从选出的股票里挑选p值最低的,也就是我们认为最符合协整关系的来看看他们之间的股价走势是怎么样的.

要利用这组股票对进行配对交易,就得看看他们之间的存在什么样的线性关系。这里我们通过股价进行最小残差平方和(OLS)方法来进行回归。

r-squred为0.978,说明我们拟合的参数解释了97.8%的样本数据,说明拟合结果比较好,AIC与BIC检验较小说明回归效果好,再来看看系数是否统计显著,const的系数的绝对值除标准误差std err明显大于自由度为465的t统计量,说明统计显著。至此,我们能认为我们回归得到的结果是比较好的了。

接下来我们看看线性组合的价差是否是在均值周围波动。

至此,我们完成了配对交易的准备步骤,找到了协整股票对之间的线性关系以及股价差满足的模型,我们以'601818.XSHG'的股价减去拟合的系数0.6319倍'601988.XSHG'的股价,线性组合价差服从均值为0.9328标准误差为0.072的正态分布。根据这样的线性关系,我们构建这么一个简单的配对交易策略:组合价差超过均值+1倍标准误差即卖出601818,买入601988;低于均值1倍标准误差即买入601818,卖出601988.

米筐量化交易平台:http://www.ricequant.com

量化炒股QQ群:484490463 群内大神每日在线讲解代码,用Python自动赚钱!


你可能感兴趣的:(统计套利)