今天开始我们侧重于介绍P-Quant,也就是量化交易策略。很多人一开始接触,尤其是看了很多书之后往往会被搞晕,因为貌似量化交易包含的内容好广,有最简单的选股、择时,也有对冲基金用的最多的统计套利策略,还有次贷危机之后比较火的算法交易和高频交易。那么大家不禁要问了,到底量化交易包含哪些内容呢?接下来我们就系统性的介绍一下,当然大家也可以根据这个框架自己发散出去。(这是我自己的理解,欢迎大家轻点拍砖)
有一个最简单的理解:一个人在投资过程中会遇到哪些问题,如果这些问题都是用数学模型、计算机的方法来进行解决的话,这些就都是量化方法。那么好了,大家闭上眼睛跟我来细细走一遍,自己做投资的时候,有哪些比较头疼的事情呢?
如何赚钱?——alpha模型
接下来我们会引入alpha模型讨论如何赚钱的问题。
这是最现实的问题,也是我们之所以会做投资的根本原因。之所以叫做alpha模型主要是因为现在做量化交易的主要是对冲基金和大型金融机构里的自营交易部门,那么对于基金经理的考验并不是赚取和市场指数相同的收益,而是要实现超额收益alpha。
其实追求alpha的策略本质上就是要做投资组合的资产配置决策以及择时决策(即买卖什么证券、买卖多少、何时买)。这类策略是大家最愿意讨论的,最常见的是:
(1). 基于历史价格相关数据的策略
用最简单的方式说,这类量化策略大体分为两种:momentum和mean-reversion。
Momentum(趋势跟随策略):过去涨的我赌他涨,过去跌的我赌他跌。
这种策略背后的经济学原理可以这样解释,市场参与者需要慢慢形成对金融产品价值的共识。比如如果市场上参与者认为通胀开始失去控制并将引发诸多经济问题,市场就开始走熊,对这个形势最早做出判断的交易者可能就早早卖空股票和债券。随着越来越多的信息和数据支持这个判断,越来越多的市场参与者将逐渐加入卖空阵营,推动股票市场和债券市场价格下跌,但是这个过程需要一定的时间,所以给了momentum投资者一定的跟随空间。
当然关于趋势还有另外一个解释,就是基于投资者心理来解释的,有时被我们称为“博傻理论”。主要意思是说投资者本身相信存在趋势,所以会倾向于追涨杀跌,而这种交易力量形成了趋势,关键是你能不能找到一个更傻的人从你手上接走“烫手山芋”,而不要成为最后一个傻瓜你就赢了。其实投资者这个心理也可以解释为什么会有趋势的形成。
mean-reversion(均值复归策略):过去跌的我赌他涨,过去涨的我赌他跌。
均值复归的基本理念认为资产价格总是会有一个合理价值或者是均衡价值,而短期市场可能会出现超买或超卖的现象,比如A股被纳入MSCI全球指数,那么会驱使一些跟踪指数的基金买入A股被纳入的股票,但是短期内愿意在原有价格上卖出股票的交易者不足,于是价格就上涨,但是一旦买方的超额需求出现退缩,价格又会下跌。
最著名的均值复归策略就是统计套利,他指的是相似的两只股票的价差可能会出现偏离,但是终究会收敛回去。
就好像科斯托拉尼提出的遛狗理论:“一个人带着狗在街上散步,狗先跑到前面,再回到主人身边。接着又跑到前面,看自己太远又折回来。整个过程,狗就这样反反复复。”当然科斯托拉尼主要是比喻经济基本面和股市,但我们可以把人和狗想象成两只股票,他们之间有紧密的关联,就是那跟遛狗绳,但是他们之间的距离会远远近近,不断变化,但是这种变化不会超过一定范围,所以具备稳定性。
均值复归的例子
假设我们现在找到了这样一个股票A和B的序列,他们的差价大于平均值时,说明价格低的股票比平时更低,价格高的股票比平时更高,那么我们买入价格低的股票,卖出价格高的股票,等到两者之间的价差收敛时,我们再进行反向操作,把价格低的股票卖出,然后买入价格高的股票,把头寸平掉。
当然实际在操作时要经过更加严格的统计证明才可以,找到何时适合买入,何时适合卖出。比如我们要对股票A和B的价差序列经过统计学的cointegration test(协整检验)证明具备稳定性,比如过去6个月内,A股票和B股票的价差序列为平稳序列,均值为10,标准差为1,我们设定门槛值为2个标准差,那么平稳区间就是 8-12 当A-B 12时,我们买入B, 卖出A, 当A-B8的时候,我们买入A, 卖出B。等到回归到平稳区间平仓。这种做法就是最简单的配对交易(pairs trading),这种策略也可以应用在债券市场上,主要是假设债券的利差(spread)也是均值复归的。
大家能够看得出来,统计套利策略需要市场volatility比较大,就好像人遛狗的例子一样,如果狗始终在人的周围的稳定距离内,没有扩大和收敛,统计套利就没有机会,如果狗跟人之间的距离不断远离然后又收敛,统计套利交易者的机会就会更多一些。
(2). 基于基本面数据的策略(多因子模型)
这些策略几乎都是基于Fama-French的三因子模型所进行的变形。
在Fama-French之前,资本资产定价模型(CAPM)是量化金融界的真谛,CAPM认为股票的收益率主要取决于一个风险——系统性风险beta(市场风险),但是法玛(Fama)和弗伦奇(French)以1936-1990年为样本期发现,往往小盘股的收益率是大于大盘股的收益率的,价值型股票的收益率是大于成长型股票的,所以Fama和French认为股票的收益率取决于三个因素:一个是市场平均收益率,相当于把整个市场搅成一锅粥,这部分取决于个股和市场之间的关系,即系统性风险的大小;第二个因素是规模,也就是在市场平均收益的基础上,往往小盘股的收益更高,所以小盘股会有一个溢价;第三个因素是价值,它是在市场平均收益的基础上,给价值型股票一个溢价。
后来又有人在Fama-French的模型上加入了另外一个因子——动量(momentum)。因为研究发现,处于跌势中的股票往往比理论跌幅(基于利润等基本面因素计算得出的)跌得深,而处于涨势中的股票也会比理论上的涨幅涨得多,那就意味着我们可以追随趋势,往往以前在涨的股票,预期将来的收益率也会更高。
当然多因子模型发展到现在,你可以加入任何你认为股价有影响的因素,当然也可以利用一些统计方法找到最重要的影响因素(比如主成分分析),让模型更加简单和可操作一些。比如你在挑选股票的时候可以看下面这几个方面:
第一,看公司财务指标,包括PE、PB是多少,对比同行业同类的公司;
第二,看卖方研究员的研究报告;
第三,看市场情绪,也就是K线图,交易量和价格等指标;
第四,看该股票被关注的程度,比如看百度搜索,甚至看大家在讨论这支股票时是更多的采用正面的语言还是负面的语言。那么你选定的这些因子也可以给他们一定的系数,代表在选股过程中的重要程度,然后拿到一只新的股票就可以对他打分,然后来评判是否进行投资。