目录
1. 量化交易系统框架
2. 阿尔法模型
2.1 阿尔法模型的定义
2.2 阿尔法模型的分类
2.2.1 理论驱动型阿尔法模型
2.2.2 数据驱动型阿尔法模型
2.3 实施策略的方式
下图简要描述了量化交易系统框架的主要组成部分。
量化交易系统主要包括三个模块,即阿尔法模型(alpha model)、风险模型(risk model)和交易成本模型(transaction cost model)。这三个模型构成了投资组合构建模型(portofolio construction model)的输入,最后输出的投资组合被传递到执行模型,并通过研究被不断优化。
其中,阿尔法模型旨在推测宽客所考虑交易的金融产品的未来趋势以及盈利的可能。风险模型旨在帮助宽客控制不太可能带来收益但会造成损失的敞口规模。交易成本模型用于帮助确定从目前的投资组合迁移到新的投资组合的交易成本。
投资组合构建模型将前三者作为输入变量,在追求利润、控制风险和成本间进行平衡,从而确定最佳投资组合。构建模型输出决策之后,执行模型将目前的投资组合与目标投资组合进行比较,根据两者之间的差异来执行所需要的交易。
最后,数据和研究也是量化交易系统不可忽略的两个重要部分,贯穿了整个交易系统的每一个部分。
通常来说,阿尔法是指扣除市场基准回报之后的投资回报率,可以理解为是仅由投资策略带来的收益,用希腊字母α表示。由于市场本身因素带来的回报率,即与投资者的投资策略无关的这一部分收益,被称为贝塔收益,用希腊字母β表示。因此,阿尔法模型就是为了增加阿尔法收益,在投资过程中所使用的一系列技巧和策略。在书中给出了阿尔法模型的一种非常规定义,即“在交易中关于买卖时机把握和持有头寸选择的技巧”。
阿尔法模型主要可以划分为理论驱动型和数据驱动型。此外,混合型阿尔法模型将两种或多种阿尔法模型结合起来,试图通过综合考虑多种模型的预测结果以提升预测效果。
经验性科学家通过观察市场的变化,试图总结出一般性的规律和普适性的理论来解释市场行为,并通过过市场数据来验证他们的想法和理论。这样得到的就是理论驱动型阿尔法模型。
另一部分人则认为,即使不对市场行为进行理论性的解释,通过过合理使用技术性的手段,我们也可以挖掘出隐藏在海量数据中的模式和规律,以及它们与市场行为之间的对应关系。这样仅仅通过数据分析方法,而不上升到理论层面而得到的就是数据驱动型阿尔法模型。
根据策略所依赖的数据类型,理论驱动型阿尔法模型可以进一步划分为依赖于价格数据的趋势型策略和均值回复型策略,以及依赖于基本面数据的价值型/收益型、成长型和品质型。最后比较特殊的一类是技术情绪型策略。
2.2.1.1 基于价格数据的交易策略
价格数据包括金融产品价格以及其他可以从交易行为中提取到的信息,比如交易时间和交易量。试图预测价格数据并从中获利的宽客,通常是在分析以下两种现象之一。一是已有的趋势是否会继续延续下去,二是目前的趋势是否会反转。前者称为趋势跟随策略(trend following)或者动量策略(momentum),后者称为均值回复策略(mean reversion)。
趋势跟随策略的基本假设是“在一定时间内市场通常是朝着同一方向变化”。其基本经济学原理支撑是市场均衡理论。趋势跟随者试图寻找某种金融产品价格在预期方向上的显著变化,因此其绝大部分风险在于市场上价格的快速上下波动。
移动平均线交叉指标(moving average crossover indicator)是定义趋势的一种重要方法。当短期均线位于长期均线之下时,认为市场处于下跌趋势;反之则认为市场处于上涨趋势。
与趋势跟随策略相反,均值回复策略认为“价格终将会沿着已有趋势的反方向运动”,而不可能一直延续已有趋势。市场供需间的短期不均衡,比如超买和超卖现象,在一定程度上可以解释均值回复策略的合理性。统计套利策略是均值回复策略最著名的应用之一。
趋势跟随策略和均值回复策略虽然在理论上是完全相反的,但是在实际应用中都能奏效。我们不需要在同一投资期限内构建这两种投资策略。一般来说,趋势通常在较长的投资期限上延续,而均值回复通常适用于短期投资期限。
技术情绪类策略主要通过追踪投资者情绪相关指标来预测预期回报。这些指标通常包括交易价格、交易量以及波动性指标。因此也可以被认为是基于价格数据的一类交易策略。
2.2.1.2 基于基本面数据的交易策略
基本面数据泛指除了价格数据以外的其他所有的有用信息。依赖于基本面数据的策略主要包括价值型/收益型(value/yield)、成长型(growth)和品质型(quality)。
价值型策略的基本理念是“收益率越高,价格越低”。通常价值型策略被认为就是低价买入的策略,实际上,价值性投资策略认为,市场倾向于高估高风险资产的风险,而低估低风险资产的风险。因此,在合适的时机买入高风险资产或卖出低风险资产,可以获得收益。
宽客用于度量资产价值的指标绝大部分是一些基本面数据与资产价格的比率或者它们的倒数。比如市盈率(P/E)的倒数,又称之为盈利收益率(earnings yield),又比如股息收益率(dividend yield),以及税息折旧及摊销前利润(EBITDA)对企业价值(EV)的比率。利差交易(carry trade)是价值型/收益型策略的重要应用之一。通过买入估值过低的证券并卖出估值过高的证券,投资者可以从中获利。
成长型策略试图通过对所考虑资产以往的增长水平进行分析进而对未来的走势进行预测。成长性策略认为,在其他条件都相同的情况下,“应该买入价格正在快速上涨的产品而卖出价格涨幅较慢甚至负增长的产品”。常用的成长性的度量指标比如市盈率相对盈利增长比率(PEG)。PEG越低,股价被低估的可能性越大。
使用品质型策略的交易者认为,在其他条件都相同的情况下,应该买入或持有“高品质”的产品而做空或减少持有“低品质”的产品。品质型策略看重的是资金的安全性。
一般地,衡量资产品质的指标可以分为五大类。第一类是杠杆比率(leverage),比如债务股本比。第二类指标是收入来源的多样性,比如公司收入的波动率(volatility of revenue)。第三类是公司领导团队的管理水平(management quality)。第四类指标是欺诈风险(fraud risk),比如量化股票多空策略中的收益质量。最后一类是有关投资者对产品发行方实力的情绪性策略,通常关注于与以上四类指标相关的前瞻性评估。
与理论驱动型策略相比,数据驱动型阿尔法模型具有两大优势。一是由于数据挖掘的技术挑战性,进入门槛较高,因此市场上少有竞争者。二是数据驱动型策略可以发掘出一些市场行为,即使目前尚未有成型的理论能够对它们进行解释。
基本上,使用数据挖掘策略的宽客都是首先观察目前的市场环境,然后在历史数据中寻找类似的环境,来衡量市场接下类的几种走势的出现概率。在这一过程中,需要搞清楚的主要有如下问题:
如何定义“目前的市场环境”?
如何定义“相似”?
如何确定历史数据的回溯时间段?
使用什么搜索算法寻找“相似”模式?
算法采用什么方法来给出未来各种可能情况的概率?
此外,一般地,由于样本量越大,结论越可靠,但是计算量也越大;越近期的数据越相关,同时波动性也可能越大,等等。因此,需要权衡的因素也很多。
虽然重要的阿尔法模型数量并不太多,但是宽客实施其策略的方式却多种个多样。主要值得关注的方面包括预测目标、投资期限、投注结构、投资范围、模型设定以及运行频率等。
阿尔法模型可用于预测方向(上升或下降)、幅度、运动的持续时间,甚至预测目标的概率和置信度。信号强度(signal strength)是量化模型的一个重要指标,可以定义为预期收益与置信度的乘积。
阿尔法模型实施的第二个关键因素是投资期限。在不同的投资期限上采用相同的策略,有可能产生截然不同甚至完全相反的效果。通常,较短投资期限上的收益差别要大于较长投资期限的情形。这主要是因为短期投资期限上交易的频率往往很高。
阿尔法模型即可以预测金融产品自身的信息,也可以预测相对于其他产品的信息。在进行相对预测时,可以选择预测小类,比如配对金融产品,也可以选择预测大类,比如依据市场板块对股票进行分类或分组。
宽客对投资范围的第一个选择是地理范围(geography)。一个适用于美国股市的策略不一定适合香港股市。第二个是资产种类(asset class)。宽客必须确定每个策略适用的资产种类,比如外汇、股指。第三个是产品类别(instrument class)。不同产品的参与者性质和流动性特质都各不相同。
关于模型设定,很重要的一点是模型参数设定。比如趋势策略中移动平均方法中天数的选择,又比如对模型进行调整(refitting)的频率。很多宽客在模型中使用条件变量,比如止损和止盈策略。
运行频率(run frequency)是指模型寻找新的交易机会的频率。提高运行频率意味着更多的交易机会,同时也意味着更高的交易成本。另一方面,低频率的大宗交易会对市场既有结构造成很大的冲击,同时也容易错失良机。
最后,对于某一种策略,按照两种预测目标(方向和振幅)、四种投资期限(高频、短线、中线和长线)、两种投注结构(绝对型和相对型)、四种资产类型(股票、债券、货币和商品),就可以得到64中不同的策略实施组合。
Reference:
《打开量化投资的黑箱》,Rishi K. Narang