量化投资在国内未来预期
在大数据背景下,量化投资可以 借助于计算机技术和数学模型,同时跟踪并处理具有海量样本和高维变量的金融数据,利用计算机系统快速执行交易。在股票市场,经常需要面对上千只股票的特征信息,包括宏观经济变量、市场结构变量、股票估值因子、股票成长因子、股票盈利因子、市场情绪等众多变量的数据信息,量化投资能够从海量样本中捕捉到更多更好的投资机会。
量化投资能够 规避投资者的心理偏差,克服人类在投资决策中的弱点,避免人的主观臆断及贪婪、恐惧、侥幸心理等情绪的影响,实现传统投资无法实现的收益。
理解量化交易策略的关键在于,理解宽客科学地分析问题的视角。
1️⃣ 宽客会深入思考那些非量化投资者认为理所当然的策略的许多方面。
对于宽客和主观判断型交易者而言,通过对策略细致缜密的思考,能够弄清楚问题的本质,进而执行投资策略,这是非常重要的。在整个交易过程中,这都被认为是投资和交易成功的主要组成部分。
2️⃣ 风险的正确度量和错误度量
不能因为创造和使用量化风险模型的人的失败而归咎于量化模型本身。[如突发自然灾害],只要交易者没有被诱惑而采取错误的行动,通过理解和度量风险还是会有所收获的。
3️⃣ 遵守纪律
从宽客那里学到的最显而易见的一条经验就是严格遵守纪律。一旦设计出交易策略并通过严格的检验验证了该策略可以获利并具有可行性,宽客都会让模型自动运行而不会进行非必要的任意干预。
很多成功的交易者都很认同这么一句古老的交易格言:"亏损时要止损,盈利时要让利润奔跑。”但是,主观判断型投资者通常很难及时意识到发生了亏损,相反却会很快意识到盈利。这种已经被关注的行为偏差称为 处置效应(disposition effect)。但是计算机不会发生这种偏差。因此,遵守前面交易准则的交易者很容易将其交易策略程序化,使其每次运行都能遵守行为准则。
宽客(quant)通常会基于高深的理论构造追求超额利润,并系统地加以实施。宽客之所以被称为宽客,就在于他们会刻苦钻研交易策略的产生和实施过程。至于交易策略本身,宽客和主观判断型交易者并没有什么差别。
为了全面理解量化交易的本质,仔细研究系统性方法的适用范围是大有裨益的。所谓其适用范围,即什么情形下宽客不得不放弃系统性方法而采用主观判断型交易策略。宽客对其策略进行人工干预的最常见情形是,出现了影响市场行为的消息,而已有策略无法自动进行调整,为削弱其影响宽客不得不进行人工干涉。
上图只是反映了量化交易者的一部分工作,仅考虑了交易系统的生产部分,忽略了两个重要的组成部分;数据 和 研究。量化交易者通过输入数据,对信息进行加工,做出交易决策,进而建立输入/ 输出模型。
交易成本模型可以帮助确定交易的换手率,风险模型可以帮助我们避开错误的头寸敞口,投资组合模型可以在交易成本、风险管理、盈利等相互冲突的目标之间进行平衡,并将目标投资组合传输至执行模型,对投资组合模型执行策略。这些都是基于数据并经过研究才能完成。
阿尔法是希腊字母 a
的音译,常用于量化表述投资者的盈利能力,或投资者得到的与市场波动无关的回报。在通常的定义中,阿尔法 是指扣除市场基准回报之后的投资回报率,或仅仅是由投资策略所带来的价值。由于市场因素带来的回报率称为 贝塔。
显然,任何交易者都倾向于把超过基准回报率的利润归功于 交易策略。阿尔法模型就是,为了增加盈利,在投资过程中所使用的一系列技巧或策略。
阿尔法的一种非常规定义: 在交易中关于买卖时机把握和持有头寸选择的技巧。
绝大多数理论驱动型交易策略可以较为容易地划分为六类:趋势型(trend)、回复型(reversion)、技术情绪型(technical sentiment)、价值型/收益型(value/yield)、成长型(growth)和品质型(quality)。
趋势型 和 均值回复型 交易策略都依赖于价格数据。 技术情绪型 策略较为少见,可看作基于价格的第三类型策略。而剩余的 价值型/收益型 、 成长型 和 品质型 策略都基于基本面数据。
基于 价格数据 的阿尔法模型中的价格数据,一般是指与各种金融产品价格相关的数据,或者交易所产生的其他数据信息(如交易量等)。
试图预测价格并从中获利的宽客,通常都是在分析以下两种现象之一:一是已有的趋势是否会延续,二是目前的趋势是否会反转。前者称为 趋势跟随策略 (trend following)或 动量策略 (momentum),后者称为 反趋势策略 (counter-trend)或 均值回复策略 (mean reversion)。第三类是技术情绪型策略。
趋势法存在的经济学基本原理是市场均衡理论。假定在一定时间内市场通常是朝着同一方向变化,据此对市场趋势做出判断就可以作为制定交易策略的依据。
对趋势的另一解释,称为 博傻理论(greater fools theory),博傻理论认为,人们因为相信趋势才会去追涨杀跌,这种行为反过来又促进了趋势的形成。关键在于将持有的产品卖给更“傻”的下家而避免自身成为最后的持有者。
趋势跟随策略的最典型例子出现在期货交易行业,称为期货管理者或者商品交易顾问(CTA)。
上图显示了始于2007年第4季度的一次美国股市下跌趋势。以交易为目的,定义趋势的一种方法是 移动平均线交叉指标 (moving average crossover indicator),通过对比较 短期间和 较长期间 的某个指标来判断趋势。
均值回复策略的基本理论认为,价格围绕其价值中枢而上下波动,判断出这个中枢以及波动的方向便足以捕捉到交易机会。
均值回复现象的另一种理论认为,市场参与者并不了解其他人的观点和行为,当他们下单进行买入卖出并促使价格向新的均衡状态移动时,在某个时点可能由于超买或超卖, 价格会剧烈波动。
无论造成供需间的短期不均衡的原因何在,由于均值回复交易者都是在逆势交易,他们都给市场带来了流动性。无论执行技巧如何,均值回复交易者事实上都是在对赌市场趋势,并且得承受逆向选择的风险。
趋势跟随策略和均值回复策略并不一定是相互冲突的。趋势通常是长期的,而短期内围绕着趋势的小范围波动也是很常见的。事实上,一些宽客会组合使用这两种策略。采用均值回复策略的交易者,必须识别出目前的价格中心或均衡点,并判断偏离均衡点多少时值得进行交易。如同趋势跟随策略一样,由很多方法可以用来确定价格的均衡点和反转点。
趋势通常在较长的投资期限上延续,而均值回复通常适用于短期投资期限。
采用均值回复策略的主观判断型交易者,通常被称为反转交易者 (contrarians)。基于均值回复概念的最为著名的策略要算 统计套利策略。
[学会如何去读懂这些图?]
主要通过追踪投资者情绪相关指标来判断预期回报,这些指标常见的有交易价格、交易量以及波动性指标等。[无明确经济理论支撑,研究需谨慎。]
包括价值型/收益型、成长型和品质型三类策略。这些策略不仅在股票分析中产生适用,也适用于其他金融产品分析,债券、货币、商品、期权以及地产,都可以进行买卖。
度量资产价值的指标,包含基本面数据与资产价格的比率,如市盈率(P/E)等,盈利收益率(E/P比率) 和 股息收益率计算这些比率 [市盈率] 的倒数。
价值型策略的基本理念是,收益率越高,价格越低。使用将常见比率求倒数得到的收益率的益处是,有利于分析方法的简洁性和一致性。
价值型投资策略认为,市场倾向于高估高风险资产的风险,而低估低风险资产的风险。因此,在适当时间买入高风险资产和(或)卖出低风险资产,可以获得收益。
在同一相对水平上,买入估值过低的证券(货币)并卖出估值过高的证券(货币),这种策略也称为 利差交易 (carry trade)。投资者通过卖出收益低的资产获取资金,用以买入高收益的资产。两种收益之间的差别称为 利差所得 (carry)。
绝大部分使用股票价值型策略的宽客是在寻找相对价值较低的股票,而不是评估某只股票是便宜还是贵。这个策略通常称为 量化多空策略 (quant long/short,QLS)。使用QLS的交易者经常会基于价值等多种因素 判断股票的吸引力,进而对股票进行评级,买入高评级的股票而卖出低评级的股票。
在 期货市场 上,也有各种明确以收益为表现形式的交易策略。展期收益 (roll yield)是指在未来某天到期的期货合约价格和现货价格(或在相对较短时间内到期的期货合约)之间的价差。在 现货溢价 (backwardated)市场上,现货价格高于期货价格,由于期货价格会向现货价格靠拢,所以在这种情形下期货的 展期收益大于零;在期货溢价 (contango)市场上,现货价格低于期货价格,从而展期收益为负。
成长型策略试图通过对所考虑资产以往的增长水平进行分析而对未来的走势进行预测。国内生产总值(GDP)或收益预测都属于这类预测的范畴。
判断一只股票属于成长型资产,并不意味着它的收益会怎么样。成长型策略认为,在其他条件都相同的情况下,应该买入价格正在快速上涨的产品而卖出价格涨幅较慢甚至负增长的产品。
使用品质型策略的交易者认为,在其他条件相同的情形下,最好买入或持有高品质的产品而做空或减少持有低品质的资产。品质型策略的基本理念是看重资金的安全性,而成长型或价值型策略对这一点都没有予以重视。
着眼于持有高品质金融资产的投资策略有利于保护投资者,尤其是在高风险的市场环境中。这类策略常被称为 安全投资转移策略 (flight-to-quality)。
品质型策略的收益随时间波动很大,并且极度依赖于宏观市场环境。
衡量资产质量(度量品质)的指标 可以分为五大类:
① 杠杆比率 (leverage),基于对杠杆比率的度量,在其他条件无差别时,应该卖出高杠杆比率的公司的股票而买入低杠杆比率的公司的股票。
② 收入来源的多样性 (diversity ofrevenue source)。该指标认为,具有多种潜在增长渠道的国家或公司比渠道单一的国家或公司质量要高。对公司而言, 收入的波动率 (volatility of revenue)就属于这类指标。投资者更青睐收益稳定(低波动率)的公司的股票。
③ 管理水平 (management quality),该指标认为,应该买入(卖出)具有好(不好)的领导团队的公司的股票。
④ 欺诈风险 (fraud risk),该指标认为,应该买入(卖出)欺诈风险较低(高)的公司股票或国家外汇。
有关投资者对产品发行方(公司或国家)实力的 ⑤ 情绪型 策略。
数据驱动型策略使用数据挖掘算法(门槛高;预测分辨的市场行为难以用理论解释),如宽客基于目前观察的市场环境,在历史数据中寻找类似的环境,来衡量市场接下来的几种走势的出现概率,基于这种可能性进行交易。
这一流程中需弄清几个问题:
一套实施策略值得深入探讨的有很多方面,包括预测目标、投资期限、投注结构、投资范围、模型设定和运行频率等。
策略实施的第一关键要素是准确理解模型所要预测的目标。模型可用于预测方向、幅度、运动的持续时间,进一步可以包括预测目标的概率或置信度。
较短投资期限上收益的差别通常要大于较长投资期限情形 。
投注结构,依赖于模型进行预测。模型既可以预测金融产品自身的信息,也可以预测其相对于其他金融产品的信息。
在进行相对预测时,我们可以选择预测小类的(例如,配对金融产品)表现或者大类的(例如,一个门类)表现。相对而言,小类更易于理解和分析。在大类中投注,研究人员把证券进行分类,主要是为了隔离和消除类内的共同因素。例如,依据市场板块对股票进行分组,很大程度上就是为了消除整个板块波动的影响而专注于板块内部股票价格的相对变化情况。
研究人员还必须选择如何分组,或者使用统计学方法,或者依靠直觉(例如按照基本面的产业门类)。
在评估阿尔法型策略时,不同投注结构间的差别是很重要的,特别是对于方向性投注(单个产品)和相对投注(多产品)。相同的阿尔法模型,用在单一的金融产品上和用在彼此相关的一组金融产品上,表现不同。对于各式各样的分组方法,平衡分组方法的风险和收益都是极为重要的。
宽客对投资范围做出的选择有地理范围(geography),资产种类 (asset class),产品类别 (instrument class)。
投资范围的选择很大程度上取决于宽客的个人偏好。第一,宽客倾向于流动性好的产品,因为其交易成本是可以预计的。第二,宽客一般需要大量的优质数据。通常这种数据在具有高流动性的比较成熟的市场上更易获取。第三,宽客更喜欢那些易于使用体系化的模型 进行预测的金融产品。
每一种阿尔法策略也可以有多种定义方式。使用数学语言精确地给出策略的具体表达,是宽客工作中很重要的一部分内容。这是值得从事量化交易的投资者认真研究的领域,因为对宽客而言,这是体现差异性和潜在比较优势的根源所在。
模型设定很重要的一个方面是 模型参数设定。
参数设定问题中,有一类问题涉及模型调整的频率。为了使用更近期的数据,通常需要对模型进行调整。这一过程称为 重拟合(refitting),因为需要在目前的交易中,重复进行策略开发过程中完全一样的一部分工作,以更新模型使其更加适用于目前的市场环境。
运行频率 (run frequency)即模型寻找新的交易机会的频率。
提高模型运行频率 通常会带来更多的交易机会,这也意味着要付给经纪商更多的佣金,交易成本也就更高。此外,模型运行频率高,投资组合是基于并不包含有用信息的噪声数据进行决策的可能性会更大。这反过来意味着交易成本的增加并没有带来交易策略的阿尔法收益显著增加,从而降低了策略的总体盈利水平。
运行频率低的模型会导致数量小但规模较大的交易发生。这样的交易会对整个市场造成较大的影响,从这一层面看这样的交易代价很高。
运行频率的高低取决于策略的很多其他因素,特别是预测的投资期限、输入变量的类型等。绝大部分宽客运行他们的模型不少于一周一次,很多甚至是整天连续运行。策略运行频率越低,留有的余地越大,但短期策略倾向于以连续实时的方式运行。
成功的宽客都具有以下特征:令人难以置信地注重细节,不知疲倦地提出恰当的问题并找到最佳解决方案。
如果考虑策略的类型、投资期限、投注结构、投资范围、模型设定、条件变量和运行频率的不同,价值型策略有很多种类。
进行混合预测的3种最常用量化方法分别是线性模型、非线性模型和机器学习模型。第4种基于每一种阿尔法模型构建一个投资组合,之后构建一系列的投资组合。
对阿尔法模型进行混合的目的是找到模型的一个组合,使其对未来有最佳的预测效果。如果其他条件都相同,阿尔法模型的任意有效组合都会比单个阿尔法模型的效果要好。
在线性模型中,是否包含某一变量 和 是否包含另一变量 是 相互独立的,并且假设变量间具有可加性,而不受其他进入模型或者从模型中剔除的变量的影响。
使用线性模型的第一步工作就是给每个阿尔法模型分配权重。这通常是通过多元回归分析(multiple regression)方法来实现,通过该方法可以找到阿尔法模型的一个组合,该组合可以最大限度地解释所交易金融产品的历史交易行为。
非线性模型假设:用于预测目的的变量之间是不独立的或变量间的关系是随时间变化的。条件模型(conditional models)和旋转模型(rotation models)是两类主要的非线性模型。
条件模型 赋予某一阿尔法模型的权重,取决于该模型对其他模型的解释能力。条件模型假设E/P收益模型有利于改进预测效果,但只有在价格趋势法和收益型模型的结果相一致时才有效。
另一种用以 分配权重 的条件模型 的例子是,使用外部变量来分配权重。
旋转模型根据阿尔法模型的表现追随相应的趋势,而不是跟随市场本身的趋势。这一点和线性模型是类似的,但这里模型的权重是基于各种信号的权重进行更新计算,且随时间波动的。随着时间的推进,越来越多近期的数据被用来计算权重,以期模型的权重与当前的市场形势更加相关。这种方法通常会对近期预测表现好的模型以更高的权重。
宽客也会使用机器学习模型来决定各种阿尔法模型的最优权重。在决定最优参数时,与预测市场行为本身相比,机器学习方法在混合阿尔法模型中的使用更为常见,效果也更好。这些方法使用算法来计算出能对历史数据具有最强解释能力的最优混合,并假设在历史数据上表现良好的混合模型在未来的表现也会较好。
如果说阿尔法模型是乐观派,风险模型就像悲观派。风险模型存在的主要目的就是控制敞口规模并处理不希望出现的敞口 [对风险有暴露的地方]。
通常,我们所能做的仅限于限制敞口规模或完全将其剔除。在投资过程中,风险管理的作用就是决定对于不同的敞口进行操作时应当非常谨慎,并为投资策略模型提供输入。
有多种控制规模的量化交易模型,它们的不同之处主要体现在以下三个方面:
1️⃣ 控制规模
控制规模的方法有两大类:硬性约束和惩罚来加以限制。硬性约束就是设定风险线;惩罚是使用惩罚函数来限制。
2️⃣ 度量风险
第一种是通过纵向方式来度量不确定性,计算不同时期各个产品收益的标准差来度量风险。在金融业中,这个概念通常称为 波动率 。波动率越高,说明目前的市场风险越大。
度量风险的第二种方式是,在给定产品范围内对各种金融产品表现的相似水平进行测量,通常是计算在给定时间所有相关金融产品的 横截面标准差(cross-sectional standard deviation)。标准差越大,说明所包含在内的金融产品的表现种类越多样化。这意味着市场处于低风险中,因为进行投资组合时可以选择多样化 的产品投注。
3️⃣ 限制值的适用范围
规模限制模型可以用来管理各种敞口,可以对一个产品的仓位加以限制也可以对一类产品的仓位加以限制。此外,可以对不同种类的风险敞口的规模加以限制。
风险模型的另一个要素是管理投资组合整体的 杠杆率 [资产负债表(财务状况表)中总资产与权益资本的比率]。
量化风险模型主要通过两种方式来清除不希望出现的敞口:理论途径和 经验途径。
基于理论的系统风险是指那些宽客可以进行合理的经济学解读的风险因素。理论驱动型风险建模使用大量预先设定的系统性风险因素,使得宽客可以度量和校准所给定投资组合的敞口。
经验型风险模型和理论驱动型风险模型都是基于同样的假设:系统风险可以被度量并加以减缓。但是经验主义的方法根据历史数据来判断这些风险是什么以及投资组合如何暴露其中。利用如主成分分析(PCA)之类的统计方法,宽客可以从历史数据中识别出系统风险,尽管没有名称却可以和已知的风险因子有很好的对应关系。
理论驱动型风险模型更受宽客青睐,因为其中囊括的风险因素都有明确的意义。
无论宽客使用理论型还是经验型风险模型或者二者的混合,目标都是一样的:宽客需要识别出要面临哪些系统性敞口,度量投资组合中各种敞口的大小,然后对哪些风险是可承受的做出判断。类似于其他量化风险管理办法,这类方法的优势在于,它们要求宽客具有承担风险的主观意识,而不是拼凑些看起来很好的交易仓位,并且或多或少地忽略这些交易可能出现的偶发风险。
量化交易有两个原因:第一,可以增加盈利的概率或量(比如阿尔法模型);第二,可以降低亏损的概率或量(例如风险模型)。但这两个原因都会收到一条警告:投资组合收益或风险的一点改进,可能并不足以支付交易成本。换言之,计算交易收益应该充分考虑交易成本。
在构建投资组合模型过程中,交易成本模型告知进行交易的成本状况。它并非是为了极小化交易成本,正如阿尔法模型并不是创造收益而是进行预测并将这些预测传递给投资组合构建模型。成本最小化可以分为两个阶段。第一步,构建投资组合模型,使用交易成本模型提供的输入变量,去计算进行目标投资组合的成本;第二步,将目标投资组合传输到执行算法阶段,以尽可能低的成本去执行投资组合的交易。
交易成本主要由三部分构成:佣金和费用(commissions and fees)、滑点(slippage)以及市场冲击成本(market impact)。
佣金和费用是交易成本的第一种类型,是支付给经纪商、交易所和监管者的费用,因为它们提供了服务,包括市场参与者的接入通道,有所保障的交易安全性以及运作的基础设施等。
经纪商对所提供的 清算 (clearing)和 结算 (settlement)服务也会收取费用(通常也是佣金的一部分)。清算活动 包括监管报告、实时监控、税务处理和破产处理,所有这些活动都必须在结算活动前完成。结算活动 是以有价证券的交割来换取资金的交付,是交易活动的最后一步,交易双方分别践行其义务。这些活动都花费精力,因而是有偿的。
佣金和费用肯定是不可避免的,但这两部分比较容易计算;而滑点和市场冲击成本在度量、建模和管理上都更加棘手。
滑点是指从交易者决定开始交易到订单进入交易所系统实际被执行这两个时间段所发生的价格变动。
滑点会给趋势跟随策略带来很多损失,因为该类策略选择的买卖时点通常是在金融产品的价格已经沿着预料的趋势波动时。而滑点给均值回复类策略带来的损失就比较少,甚至滑点可能会带来 正收益 ,因为这类策略选择的下单时点通常与现有的趋势相反。
对宽客而言,这可能是最重要的成本。市场冲击所描述的基本问题是,交易者买入某项产品的行为会推高该产品的价格。而如果交易者想要卖出,当他完成交易时会造成产品价格下降。对于小规模订单而言,价格波动幅度通常介于最优买卖价之间。但大规模订单会造成巨大的波动幅度,极端情况下会高达几个百分点。因此,市场冲击是给定订单通过流动性需求对市场造成的价格变动的度量。
市场冲击成本通常定义为订单进入市场时的价格和订单被执行价格之间的差价。
交易成本建模中的市场冲击,关注相对于当时市场流动性的订单规模。 流动性 有很多种定义方法,无论是根据买卖单的数量规模还是依据订单簿深度,都跟偏离最优买价或卖价的买卖单信息有关。
如果交易者需要流动性,提供流动性的人就会要求 交易者 支付一定费用( 做市商,其工作职责就是确保交易者有交易意愿时可以进行交易)。近年来,很多可通过 电子交易平台进行交易的金融产品交易量大幅上涨,这意味着即使不存在做市商,市场依然能够有序运行。
有4类基本的交易成本模型:常值型、线性、分段线性以及二次型交易成本模型。
常值型模型 认为无论订单规模如何,交易成本保持不变。这个模型计算极其简单,但通常是不对的,因而不是很常用。
线性模型,意味着交易成本以一个固定的比率随着交易规模的增大而增大。
分段线性交易成本模型 可以用来提高计算精度,其基本理念是:在一定范围内线性估计基本是正确的,但在某些点上,二次估计的曲率会造成真实交易成本曲线斜率有较大的上升,所以从那一点开始使用新的直线进行拟合比较合适。
二次型模型计算复杂度最高,因为所使用的函数不像线性模型以及分段线性模型那么简单。二次型模型包含的元素很多,形式也比较多样,所以建模过程比较复杂。
投资组合构建模型的目的是为了决定宽客所持有的投资组合。这个模型扮演着裁决者的角色,听取了乐观主义者(阿尔法模型)、悲观主义者(风险模型)和具有成本核算意识的会计(交易成本模型)的说辞之后,决定该进行怎样的投资组合。
如何分配投资组合中各种产品的比例,主要需要考虑期望收益、风险和交易成本之间的平衡。过于强调交易机会会因为忽略风险而带来损失;过于强调风险会因为忽略交易机会而造成收益不足。过于强调交易成本会使系统陷入瘫痪,因为容易导致交易者因不愿意承担更新投资组合的成本而持仓时间很长。
量化投资组合构建模型 主要分为两大类。
常见的基于规则的投资组合构建模型有4类:相等头寸加权、相等风险加权、阿尔法驱动型加权和决策树加权。前两类模型最为简单,核心理念是等权重,只是在如何给出同等权重的方式上有所不同。阿尔法驱动型投资组合构建模型主要依赖阿尔法模型来进行头寸规模选择和投资组合构建。决策树方法,主要是以某种顺序使用一系列规则来决定头寸规模,可以很简单也可以很复杂。
相等头寸加权模型极其普遍。使用这一模型的宽客认为,如果某一头寸好到值得拥有,就不再需要其他信息来决定其规模。 这里有个深层次的隐含假设:金融产品具有同质性,不需要根据其风险或其他指标加以区分。
相等头寸加权模型的基本前提是,对不同的头寸加以区分(给予不同权重)可能会具有两种负面结果,最终会超过非等权重加权所带来的好处。
非等权重方法
阿尔法模型一般都会经过实际数据集的检验,模型的统计显著性和预测能力基本上都是依据于分布的均值或平均水平,而不是分布的尾部。相等头寸加权方法可以控制这种尾概率事件所带来的风险。
值得注意的是,相等头寸加权方法有时会受到流动性的 约束,从而头寸的权重只能在流动性允许范围内尽可能地接近同等权重。
相等风险加权方法根据头寸的 波动性 (或风险的其他度量指标,如下降幅度)来反向调整头寸规模。波动性越大(小)的头寸,分配的权重就越小(大)。
相等风险加权方法也有其 缺点,无论使用何种方法对风险度量,通常都是一种回顾型度量,例如波动率。具有较高(低)波动率的产品应该被分配以较小(大)的权重。但是如果波动性低的产品突然变得波动剧烈呢?(比如金融危机,银行股价波动剧烈)
阿尔法模型可以决定头寸可能具有的吸引力,这个信号是合理决定头寸规模的最佳途径。
通过阿尔法模型来决定头寸规模。该方法的理念是,阿尔法模型可以决定头寸可能具有的吸引力,这个信号是合理决定头寸规模的最佳途径。此外,使用这一方法的绝大部分宽客并不会让最大头寸的规模趋于无穷。这时他们会使用风险模型来给出单个头寸的最大规模上限。
投资组合优化工具主要是基于资产管理行业的经典理论——现代投资组合理论 (modern portfolio theory,MPT)的基本原理。MPT 的核心原理是,投资者一贯是风险厌恶型的,这意味着如果两种产品收益相同但风险水平不同,投资者会偏好低风险产品。
只有存在额外收益作为补偿,投资者才愿意承担额外的风险。由此引入了风险调整收益 (risk-adjusted return)的概念。均值方差优化技术(mean variance optimization) 是基于MPT构建投资组合的一种常用方法。
优化器使用这些输入量,可以输出在不同风险水平下可以达到最高可能收益的一系列投资组合,称为有效边界 (efficient frontier)。
量化交易策略,除了使用阿尔法模型、风险模型和交易成本模型外,还需要说明这些模型中所包含的信息 以及与这些模型相关的约束条件 。
在真实交易中,宽客也会采用其他几个额外的 输入变量,包括① 以货币表示的投资组合规模,② 期望的风险水平(通常以波动率或预期下跌来度量),③ 其他会缩小优化工具可行域的约束条件,例如股票交易中主要经纪商提供的 卖空限制列表 (hard-to-borrow list)。
这些技术被称为优化工具的原因在于,它试图去寻找分析师所给定的目标函数 (objectivefunction)的最大值(最优值) 。
优化工具所需要的输入变量有期望收益、期望波动率以及各种备选产品间的相关系数矩阵。
期望收益
宽客倾向于使用阿尔法模型得到期望收益。阿尔法模型的输出变量通常都会包含期望收益和(或)预期波动方向,或其他用来指示备选产品吸引力的输出变量(如某种得分)。
期望波动率
传统金融界和量化交易界中许多人士倾向于使用历史数据计算出的实际波动率作为优化工具的第二个输入变量,但也有些人使用对波动率的预测值。预测波动率的最常见方法是使用 随机波动模型(stochastic volatility models)。
随机波动预测模型 的基本理念是,波动率一段时间内会在较高水平,接下来的一段时间就会处于低位(即存在可预测性的波动率周期),偶尔还会有所跳跃(某种随机和不可预测性部分)。
期望相关性
相关系数是衡量两个产品变化的相似程度的核心度量,取值范围介于-1~1
之间。相关系数为1
表示完全类似,相关系数为-1
则表示两种产品完全相反,或负相关。相关系数为0
则表示完全不相关,表明两种产品完全不类似,但也不是反向变动的。
无约束条件的优化方法经常做的事情是提出只有一种金融产品的投资组合,就是把所有的钱都投入到具有最高风险调整收益的金融产品上去。
为解决无约束条件方法中把所有钱投入到具有最高风险调整收益的金融产品这一问题,宽客们指出如何在优化过程中添加约束条件和惩罚项,从而得到更加“合理的”结果。约束包括头寸规模限制(如分配给某一头寸的占比不能超过整个投资组合的3%)或对产品组的头寸加以限制(如在任何板块的投资不能超过投资组合的20%)。
优化方法中的另一种约束条件包含风险模型的集成。
交易成本也可以用多种方式加以处理。宽客可以建立每只股票的市场冲击函数的经验模型,并让这些市场冲击模型作为输入变量进入优化工具。或者,宽客也可以简单建立一个市场冲击函数,以波动率、交易量、订单规模等作为输入变量,得出市场冲击模型的一般解。这是宽客常用的两种得到期望交易成本的方法,之后将其作为投资组合优化的输入变量。
为实现优化目标,需要设计数学公式和编程技术,使用上文所提到的各种输入变量,通过迭代求解寻找使投资组合的目标函数达到最大值的均衡状态(如期望收益与期望波动率间的均衡)。
布莱克-李特曼优化方法 解决了优化工具的输入变量带有测量误差的一些相关问题。他们提出了一种方法,在投资者期望中融入了置信度的概念,并把这些与历史数据结合了起来。
布莱克-李特曼优化方法利用投资者对不同金融产品收益的预测来调整真实观测到的产品间的相关系数。
绝大部分优化方法试图确定头寸规模,而这种投资组合优化技术的直接目标就是建立信号的组合。
这种方法的主要思想是建立因素投资组合群 ,其中每个投资组合都是基于规则(实际上通常都是等权重或等风险权重)考虑单一种类的阿尔法预测而构建的。所以,可以考虑构建动量型投资组合、价值型投资组合和成长型投资组合。每一种投资组合都会使用历史数据进行模拟,就好像是根据历史数据来挑选股票。
这个方法的一个优势在于,投资组合的数量更加易于管理,根据在阿尔法模型中所使用的单个因素的数量,通常不会超过20个。因此在进行优化时,并不是优化含有几千种金融产品的投资组合,而是优化几种要素投资组合的混合。
理查德·米肖在《有效资产管理》书中提出的重新取样效率 (resampled efficiency)相关方法解决了针对估计误差的过度敏感性问题。
宽客在阿尔法预测、波动率预测和相关性估计中都会出现估计误差。结果表明,均值方差优化工具对这类误差极为敏感,如果期望存在很小的扰动,就会导致所推荐的投资组合发生很大的改变。
米肖提出使用蒙特卡罗模拟 (Monte Carlo simulation)的方法对数据进行重新取样,以减小优化工具输入变量的估计误差。蒙特卡罗模拟方法会对历史数据进行多次重新组合,基于真实观测得到多个时间序列。
对于这种重新取样技术,有一点值得注意:只有当有足够的信心认为所使用的历史样本数据能很好地代表整个分布时,这种重构历史分布的方法才真的有用。
使用机器学习方法通过在各种可能的投资组合中进行搜索,寻找表现出最好特征(通过优化工具的目标函数得以体现)的一类。
投资组合构建模型的输出
无论采用何种投资组合构建方法,量化投资组合构建模型的输出变量就是目标投资组合:理想的头寸及各个头寸的规模。
执行一个交易有两种基本途径:电子途径或人为中介(如经纪商)。绝大部分宽客选择使用电子交易,因为交易量通常会很大,期望人为操作完成不太现实也没有必要。电子化交易通过直接市场准入(direct market access,DMA)得以实现,交易者可以通过经纪公司的基础设施和交易接口在电子市场(如ECN平台)直接进行交易。
获得执行算法有3种途径:创建算法、使用经纪商的算法、从第三方软件厂商处获得。
执行算法的主要目的以及绝大部分执行方法的主要功能就是新建和消除头寸时最小化交易成本。
订单执行算法的主要目的是,以尽可能低的价格,尽可能完整地完成想要交易的订单 。
如何度量执行算法的效率
订单执行算法主要从以下几个方面进行考虑:是否要采用进取订单或被动订单;采用何种类型的订单;如何决定最佳订单规模以及将订单发送到何处。
执行算法必须做出的第一个决策是选择进取订单或被动订单。进取或被动代表了交易者希望进行交易的急切程度。
进取订单(大多数市场订单是进取型的,)投放进入市场,一般无附加条件。当执行订单时(在合理范围内,只要订单簿上存在买入或卖出订单,就可以和对应方交易),进取订单可以被拆分也可以整体成交,价格则是执行订单时最优惠的市场价格。
被动订单(一种限价订单,不是所有的)允许交易者控制其意愿进行交易的最坏价格,但交易者必须承担这样的后果:他提交的订单可能根本不会被执行或只有一部分会被执行。
对某种证券,所有限定价格的买卖申报指令(均为被动订单)的集合称为 限价指令簿 (limit order book)。在电子化市场上,进入交易市场的每一张订单都会给出先后顺序。
在一些市场上,并不按照时间优先原则,而是价格相同的所有订单具有相同的优先级,但它们会根据进取订单的量按比例进行分配。这些市场要特别注意防范规模虚大和交易过量等问题。
订单执行算法的第一个特征是订单的进取程度,可以通过频谱(spectrum)的概念加以理解。市价订单处于频谱最为进取的一端,最为被动的一端是设定价格远离当前市价的限价订单。订单的进取程度通常取决于所选用交易策略的类型,也依赖于信号强度以及系统关于信号的置信水平,有时也会考虑到订单簿信息,如合理价格等。
暗订单(hidden orders)是指以牺牲与相同价位的明订单的优先权为代价,让市场其他参与者看不到自身订单信息的交易方式。暗订单的主要目的是,向其他市场参与者隐藏交易者的交易意图同时仍可以进行交易。
冰山算法 (iceberging)是暗订单的算法交易策略中其中一种。冰山算法是通过将一个大单拆分成很多小订单,绝大部分小订单以暗订单的形式出现在指令簿上。这样,其他交易者看不到这个订单的大部分交易,就好像只能看到冰山处于海平面以上的部分一样。需要指出的是,只有部分交易所允许暗订单交易。
收盘市价订单 (market-on-close orders)是通知经纪商在交易日的收盘竞价阶段发布的市价订单。
停止限价订单 (stop-limit orders)要求经纪人必须严格按照订单价格成交或在更好价格水平上成交,否则就要等到订单价格或更好价格重新出现时再执行。
立即全部执行或者撤销订单 (fill-or-kill order)是指所下达的订单立即全部成交否则自动撤销。
全部成交或不交易订单 (all-or-none order)和立即全部执行或者撤销订单类似,但没有撤销机制,所以如果一个订单无法马上全部成交,仍存在于指令簿上而不撤销。
取消前有效订单 (good-till-canceled)在交易日结束时不自动取消,在几天甚至几周内持续有效,直到交易者明确取消为止。
有一种订单值得特别留意。由于全国市场系统(Regulation National Market System,NMS)规则的漏洞,美国股票市场上存在着 扫架订单(intermarket sweep orders,ISO)。NMS规则中禁止所谓的 封闭市场。当某产品的最佳买入价和卖出价相等而两个订单无法完成撮合时,我们称这样的市场状态是封闭的。
无论是市价订单还是限价订单,宽客都必须迅速决定订单的交易量。从关于交易成本模型的讨论中我们可以知道,与小订单相比,大订单的交易成本会不成比例地快速上涨,因为随着流动性需求的增加,流动性的供给价格会越来越高。因此,在交易大订单时自动执行订单常用的方法是进行拆分,如将一个100000股的订单拆成1000个100股的小订单,在某个时间窗内分别进行交易。当然,在一段时间内分散出单,交易者会面临价格波动的风险(立即执行订单的价格和分散出单时的价格可能会有很大变化)以及市场冲击带来的额外成本。
在一些市场上,对同一种金融产品有不同的流动性分池。 智能下单方法 (smart order routing)包括在当前形势下最好选择哪个流动性分池去下单。
市场结构上近来出现的一个新动向是,所谓的 暗池在订单执行中的作用日益增强。交易平台可以分为明交易平台 和 暗交易平台 。
提供给交易者用来连接到交易所的服务,最为常见的类型是直接市场入口(DMA),通过经纪商的服务器使待交易订单分配到不同的流动性分池中去。
使用高频策略的分析师,使用 主机托管 (colocation)的连接方式。经纪商通过DMA平台向交易者提供市场接口,但这个过程存在一定程度的延迟。对延迟效应敏感的量化策略可以选择主机托管方式来改进连接速度。主要是为了尽可能地缩短订单(以光速进行)传输的距离(从交易者的服务器到交易所)。
虚假精确 (false precision),面对一个带有很多位小数的精确数字时,我们并不可以完全信赖这一数字。需要考虑交易类型是具有时效性的,因而时间因素显得很重要。
数据基本上可以分为两大类:价格数据 (price data)和 基本面数据 (fundamental data)。
价格数据并不仅仅是和金融产品价格相关的数据 ,也包括从交易行为中得到或提取的其他信息 。股票的交易量、每笔交易的时间及规模等都属于价格信息。实际上,整个指令簿 都可以认为是价格数据,因为指令簿上包含有一个交易日中给定金融产品所有买入价和卖出价(以及量)的连续记录。此外,我们还可以将各种指标水平相关的数据 (如标准普尔500指数每日记录的波动百分比)归为价格数据的范畴,即使计算的数值并不是关于可交易的金融产品的。
基本面数据 包含的范围很宽泛,因而难以进行有效分类。从某种意义上讲,基本面数据是指除了价格数据之外的所有数据。但是,所有类型数据的共同特征是,这些数据有助于决定金融产品未来的价格或者至少描述金融产品目前的状况。最常见的基本面数据种类有财务健康状况(financial health)、财务表现(financial performance)、财务价值(financial worth)和情绪(sentiment)等。
大部分 价格数据 倾向于关注短期效应 ,讨论的都是每日数据甚至日间连续数据。而在 基本面数据 中,我们看到的数据通常是周度、月度或季度数据 。从这一不同的时间周期马上能够看出,一般来说使用价格数据(基本面数据)的相关交易策略通常是短期(长期)策略。这是因为,一般来说价格数据比基本面数据更新的频率更高,但这也不是绝对的。
宽客直接从纽交所(NYSE)得到在纽交所交易的股票的价格数据。这种做法的一个好处是,宽客可以最大限度地控制数据的清洗和存储,并且在速度上也具有很大的优势,但这么做也具有很高的成本。
主要的数据源及数据种类包括以下几种,
有一些公司可以提供统一格式的数据库,用以整合来自不同数据供应商和不同类型的数据。这种公司被称为 第三方数据供应商 (tertiary data vendors),通过整合数据使宽客更容易使用数据而获利。这种公司与很多数据源以及二手数据供应商建立联系,建立并维护证券主管系统,甚至做一些数据清洗(一个我们马上会详细讨论的主题)的工作。
第一类常见的数据问题是缺失值。
第二类常见的数据问题是错误观测值。
目前解决这一问题最为常用的是被称为异常值过滤 (spike filter)的方法。异常值过滤方法寻找价格数据中那些幅度特别大、突然的变动,并对这些变动进行平滑或直接删除。
异常值过滤方法可能会将该点的价格作为坏点(bad prints)[是指那些根本不会出现的数值或者至少不会以数据源所预示的方式出现的数据。]对待,但这却是真实存在的一个点。为了减少这一问题的影响,一些宽客使用异常值过滤方法来提醒,辅以系统监管人员进一步查看该数值,检测这一问题。
一个常见的数据错误类型和公司的行为有关,例如配股和分红等。这一问题的解决主要依赖对公司行
为的独立追踪以及之前提到的异常值过滤方法的人工监管。
有时数据中会含有错误的时间戳。这一问题通常出现在日间数据或实时数据中,但其他数据中也存在这个问题。
一个不太明显的数据问题,被称为 前视偏差(look-ahead bias), 前视偏差(是指在某些事情真实发生之前便错误地假设已经知道了相关信息,还有另一种形象的表述“昨天之前就知道了昨天的新闻”。该问题是由数据的不同步性造成的。
平面文件
第一种数据库是没有相对关系结构的平面文件 (flat file),这种两维的数据库和普通的表格很类似。这种平面文件数据库不会因为需要加载太多内容而变慢,由于简洁而广受欢迎。这种简单的文件结构很容易进行搜索,通常是顺序搜索(如从第一行到最后一行)。
关系数据库
第二类数据存储系统是关系数据库 ,关系数据库允许数据集中出现更加复杂的关系。
在关系数据库中,我们只需要创建一个包含每只股票属性 (如所在行业、所在板块、所属市场和所在范围)的表即可。在这张表的基础上,我们很容易对股票及其属性的相关信息进行管理。数据库根据已建立的关系可以对其他部分进行管理。
尽管关系数据库具有强大的搜索能力,但搜索过程也可能会很缓慢而冗长,因为搜索时需要扫描很多表单、元表单和数据表之间的关系。
数据立方体
有一类很重要的关系数据库被称为数据立方体 (data cube),数据立方体强调关系数据库的一致性,把所有金融产品所有属性的取值都放到一个三维数据表中。
该方法将某些关系强行连接了起来;进一步通过保留每天每种产品的所有属性,对于给定的产品和属性则不需要去搜索最新的数据点。
这种方法也有自身的缺陷,对关系进行强行连接会导致灵活性的缺乏,所以如果关系的性质或数据查询方式发生变化时,会出现很大问题。
研究是量化交易的核心。研究的目的是审查周密思考的投资策略。
表现优秀的宽客共有的一个特征是,进行研究时遵循 科学的方法(scientific method),
研究思想的4个共有来源是:对市场的观察结果、学术文献、研究员或者投资组合经理在量化公司之间的迁移以及来自主观判断型交易者活动的教训。
检验过程的第一个步骤是基于样本内数据寻找最优参数训练(train)模型。
“良好的”模型的组成部分
1️⃣ 累积盈利图
累积盈利图是检验过程最有力的输出量,从累积盈利图可以看出,策略能否盈利、平稳性如何以及存在着何种下行风险,适用于哪些情况。
2️⃣ 平均收益率
平均收益率表明策略在过去实际运行情况如何(即盈利情况如何)。如果策略在测试阶段效果不佳,那么实际情况下策略就不可能奏效。
3️⃣ 收益率随时间的变异性
收益率随时间的变异性描述的是平均收益率的不确定性,该指标有助于研究员判断是否应该持有某交易策略。通常情况下,收益率变异性越小,策略越优。
块度 (lumpiness),指的是显著高于平均收益的时间段内的收益占策略总收益的比例。这是另一种测量收益一致性的方法。
4️⃣ 波峰波谷间的最大降幅
波峰波谷间的最大降幅测量的是盈利曲线中从任意一个累计波峰开始的最大回测。
如果反复操作成千上万次,理论上讲从一个真实历史数据可以得到许多可能的结果。这种方法被称为 重复采样 (resampling),这样可以提升历史样本的效率。基于这些成千上万的历史重复采样数据,可以计算出每一种情况的最大下行,对策略的潜在下行风险估计更稳健。
5️⃣ 预测力
统计量 R 2 R^2 R2 (R-squared)表示预测模型解释被预测量的变异程度,换句话说,就是被预测量被信号解释的变异程度。其值在0~1
,值为1
意味着模型解释了被预测量变异100%的信息。
当我们谈到“被预测量”时,当然是指向进行交易的股票、期货合约或者其他金融产品。我们试图预测期货价格/收益率/一些金融产品的趋势,使其 R 2 R^2 R2 为1
是不可能的,除非方法是错误的。事实上,在这个行业, R 2 R^2 R2 为0.05
就是极好的了。
宽客经常使用别的方法衡量预测力。这个方法是在检验中按照 十分位数(或者研究喜欢的其他分位数)的方法对金融产品的潜在预测的收益率进行分组。通常情况下,具有可靠预测力的模型能够显示最坏的收益情形出现在最坏的预测收益情形中。实际上,改善的预期收益的每一个分组表现优于前一个。如果被预测的金融产品的收益不能随着预测而改进,则暗示着这个策略只是偶然地发生作用。
6️⃣ 胜率或盈利时间占比
胜率这个百分比是一致性的另一种度量方法。这个指标告诉研究者系统盈利是来自小比例的偶然表现极其优秀的交易,还是来自很多交易,每笔交易可能都贡献微小的利润。
类似地,可以使用盈利周期与总周期数的比值简单度量(这通常是用胜率或者盈利天数百分比进
行度量)。对于两种度量方法,人们对具有更强一致性的策略具有更多的信心。
7️⃣ 回报相对于风险的不同比率
许多统计量被用来度量 调整风险收益 (risk-adjusted return),通常都是设法度量获得一些收益的“成本”(以风险的角度)。
夏普比率 是通过计算某周期内高于无风险利率的平均收益率与收益率的波动率之间的比值可得。夏普比率越高,策略越好。
和夏普比率相近的比率是 信息比率 (information ratio),不同之处在公式中去除了无风险利率。
斯特林比率 (Sterling ratio,平均收益率与低于平均收益率的波动率),
Calmar 比率(Calmar ratio,平均收益率与波峰波谷间最大回测的比值),
Omega 比率(Omega ratio,正收益率之和与负收益之和的比值)也是广泛应用于调整风险收益的度量指标。
1982~2000年的标准普尔500指数策略显示斯特林比率为0.87,Calmar 比率为0.31,Omega 比率为1.26。在这些比率中,最让人失望的是较低的Calmar 比率,这个结果意味着承担1%的回测风险,能够产生0.31%的收益。
8️⃣ 与其他策略的关系
许多宽客会同时使用几个策略。这样,宽客有效地管理策略组合,这与其他类型的投资组合一样,分散风险。宽客需要频繁地测量新策略如何适应于其他已经使用的策略,确保新策略能够增加价值。
9️⃣ 时间延迟
在检验策略时,一个有趣的问题是,策略及时获得信息的敏感性如何,预测效果会在市场中持续多长时间。许多宽客寻求理解,如果他们必须在接受交易信号后才开始交易,这个交易有一些延迟,那么策略的收益将会如何。
1️⃣ 0️⃣ 特定参数的敏感性
通过改变参数,可能得到不同的结果。但是基于参数的微小变化对结果所造成影响的理解,有助于了解策略的质量。
样本外检验
样本外检验 (out-of-sample testing)是检验流程中的第二部分,是告知研究员去除样本内检验中那些 虚拟表格 (cheat sheet)的帮助后,策略在实际中是否起作用。
许多宽客使用的另一个统计量是样本外检验的 R 2 R^2 R2 与样本内检验的 R 2 R^2 R2 的比值。这个比率是度量模型鲁棒性的另一种方法。如果样本外检验的 R 2 R^2 R2 与样本内检验的 R 2 R^2 R2 相当接近(即,如果比率大于等于0.5),则被认为是一个好的模型。如果比值显著小,研究者必须对模型的成功应用持怀疑态度。
对于样本外检验有许多种方法。最简单的方法是使用除去样本内检验数据的剩下部分进行检验。一些研究员使用 滚动样本外数据的方法 (rolling out-of-sample technique),在这种方法中,最古老的数据点将会被丢弃,最新的数据点被用来拟合(样本内)和检验(样本外)模型。这个过程重复进行,直至全部可行的数据样本被完全使用。滚动样本外数据的方法被认为不断随着时间的改变而有助于更新模型,模型不是依靠可能先前运行了很多年的单一数据集。然而,这个方法依赖于环境,缺点在于模型不断地吸收最近一段时间的信息,这可能减少其鲁棒性。
检验中的假设条件
检验流程中的另一组成部分是假设条件,这些有关交易策略的假设条件在历史上已被检验。
一般而言,过高估计交易成本会使得宽客持有头寸时间长于可能的最佳值。然而低估交易成本将使得宽客太频繁地更换投资组合,产生额外的交易成本。如果我们在这方面不得不犯错的话,过高估计比过低估计更有意义,但能够近似正确估计成本仍是更受欢迎的事情。
模型风险 (model risk)是任何一个量化交易系统都会带给投资者的最基本的风险类型。
建模的不适宜性是一个根本的错误,它包含两种形式。第一种形式是对一个给定的问题进行错误的量化建模。
第二种错误出现在量化交易中,更不容易被发现,是对已知问题的模型的错误应用。对于这种错误的一种示例是在风险评估部分讲过的,对于VaR
(value at risk)的广泛使用。
第2种模型风险是错误设定 (misspecification)。模型误设意味着研究员建立了不能很好描述真实世界的模型。就实际情况而言,完全无法拟合真实世界的模型不可能获取利润,因为在作废之前不可能被关注很长时间。
第3种或许是最常见的模型风险是执行错误 (errors in implementation)。所有的量化交易策略最终都成为依存于硬件和网络架构中的软件组成部分。执行错误,或者是编程错误或者是网络架构中的错误,对于量化交易者而言都是严重的风险,某些情况下也会对整个市场带来严重的风险。
在分析量化策略和决定如何使用量化策略时,对过去的依赖确实是值得考虑的很有趣的问题之一。
如果一个宽客对两者相关关系持续性进行赌注,将会经历两段艰难的时间段,因为这个关系并不是一直保持不变。这些股票是已经永久分离还是在未来的某个时间点重新恢复关联,这超出了我们预测的能力。这正是结构关系改变时的风险所在:市场结构的转变引起一个金融工具的历史行为或者金融工具之间的关系剧烈快速发生变化。
2️⃣ 这种结构型转变的另一个例子是价值型股票和成长型股票之间的关系。IVE
和 IVW
ETF分别代表标准普尔500价值型指数和标准普尔500成长型指数。
从2004年年初至2007年5月中旬,标准普尔500价值
型指数优于标准普尔500成长型指数大约29个百分点。价差略微缩小,
直到2007年7月中旬。
参考链接 - 打开量化投资的黑箱 (原书第2版) - [美] 里什·纳兰(Rishi K. Narang)
推荐书籍 格雷厄姆和多德《证券分析》