量化选股就是利用数量化的方法选择股票组合,期望该股票组合能够获得超越基准收益率的投资行为。
量化选股策略总的来说可以分为两类:第一类是基本面选股,第二类是市场行为选股。
基本面选股 | 多因子模型、风格轮动模型和行业轮动模型 |
---|---|
市场行为选股 | 资金流模型、动量反转模型、一致预期模型、趋势追踪模型和筹码选股模型。 |
策略 | 简介 |
---|---|
多因子模型 | 应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。多因子模型相对来说比较稳定,因为在不同市场条件下,总有一些因子会发挥作用 |
风格轮动模型 | 是利用市场的风格特征进行投资,比如有时候市场偏好小盘股,有时候偏好大盘股,如果是风格转换的初期介入,则可以获得较大的超额收益。 |
行业轮动 | 与风格轮动类似,由于经济周期的原因,总有一些行业先启动,有的行业跟随。在经济周期过程中,依次对这些轮动的行业进行配置,则比买入持有策略有更好的效果。 |
资金流选股 | 基本思想是利用资金的流向来判断股票的涨跌,如果资金流入,则股票应该会上涨,如果资金流出,则股票应该下跌。所以将资金流入流出的情况编成指标,则可以利用该指标来判断在未来一段时间股票的涨跌情况了。 |
动量反转模型 | 是指股票的强弱变化情况,过去一段时间强的股票,在未来一段时间继续保持强势,过去一段时间弱的股票,在未来一段时间继续弱势,这叫做动量效应。过去一段时间强的股票在未来一段时间会走弱,过去一段时间弱势的股票在未来一段时间会走强,这叫做反转效应。如果判定动量效应会持续,则应该买入强势股,如果判断会出现反转效应,则应该买入弱势股。 |
一致预期 | 是指市场上的投资者可能会对某些信息产生一致的看法,比如大多数分析师看好某一个股票,可能这个股票在未来一段时间会上涨;如果大多数分析师看空某一个股票,可能这个股票在未来一段时间会下跌。一致预期策略就是利用大多数分析师的看法来进行股票的买入卖出操作。 |
趋势追踪 | 是属于图形交易的一种,就是当股价出现上涨趋势的时候,则追涨买入;如果出现下跌趋势的时候,则杀跌卖出,本质上是一种追涨杀跌策略。判断趋势的指标有很多种,包括MA、EMA、MACD等,其中最简单也是最有效的是均线策略。 |
筹码选股 | 是另外一种市场行为策略,基本思想是,如果主力资金要拉升一支股票,会慢慢收集筹码,如果主力资金要卖出一支股票,则会慢慢分派筹码,所以根据筹码的分布和变动情况,就可以预测股票的未来是上涨还是下跌。 |
各种多因子模型核心的区别一是在因子的选取上,二是在如何用多因子综合得到一个最终的判断。
多因子选股模型有两种判断方法,一是打分法,二是回归法。
判断方法 | 介绍 | 优缺点 |
---|---|---|
打分法 | 根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。打分法根据加权方法的不同又可以分为静态加权和动态加权 | 优点是相对比较稳健,不容易受到极端值的影响 |
回归法 | 用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后把最新的因子值代入回归方程得到一个对未来股票收益的预判,最后以此为依据进行选股 | 优点是能够比较及时地调整股票对各因子的敏感性,而且不同的股票对不同的因子的敏感性也可以不同。回归法的缺点是容易受到极端值的影响,在股票对因子敏感度变化较大的市场情况下效果也比较差 |
候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进5个步骤
1、候选因子的选取候选因子可能是一些基本面指标,如PB、PE、EPS增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其他指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。
2、选股因子有效性的检验
3、有效但冗余因子的剔除
4、综合评分模型的建立和选股综合评分模型选取去除冗余后的有效因子,在模型运行期的每个月初对市场中正常交易的个股计算每个因子的最新得分,并按照一定的权重求得所有因子的平均分。如果有的因子在某些月份可能无法取值(例如,有的个股因缺少分析师预期数据无法计算预期相关因子),那么按剩下的因子分值求加权平均。最后,根据模型所得出的综合平均分对股票进行排序,然后根据需要选择排名靠前的股票。例如,选取得分最高的前20%股票,或者选取得分最高的50~100只股票等。
5、模型的评价及持续改进一方面,由于量选股的方法是建立在市场无效或弱有效的前提之下,随着使用多因子选股模型的投资者数量的不断增加,有的因子会逐渐失效,而另一些新的因素可能被验证有效而加入到模型中;另一方面,一些因子可能在过去的市场环境下比较有效,而随着市场风格的改变,这些因子可能短期内失效,而另外一些以前无效的因子会在当前市场环境下表现较好。另外,计算综合评分的过程中,各因子得分的权重设计、交易成本考虑和风险控制等都存在进一步改进的空间。因此在综合评分选股模型的使用过程中,会对选用的因子、模型本身做持续的再评价和不断改进以适应变化的市场环境
背景:
市场上的投资者是有偏好的,有时候会偏好价值股,有时候偏好成长股,有时候偏好大盘股,有时候偏好小盘股。由于投资者的这种不同的交易行为,形成了市场风格,因此在投资中,利用市场风格的变化,进行轮动投资会比一直持有的效果好很多。
投资风格是针对股票市场而言的,是指投资于某类具有共同收益特征或共同价格行为的股票,即某类投资风格很受欢迎,并且在某一个时间段内具有持续性和连续性(譬如,价值投资和成长型投资两种风格,或者大盘股和小盘股这两种风格总是轮流受到市场追捧)。由于投资风格的存在,从而产生一种叫做风格动量的效应,即在过去较短时期内收益率较高的股票,未来的中短期收益也较高;相反,在过去较短时期内收益率较低的股票,在未来的中短期也将会持续其不好的表现。
与风格轮动类似,行业轮动是另外一种市场短期趋势的表现形式。在一个完整的经济周期中,有些是先行行业,有些是跟随行业。例如,对某个地方基础设施的投资,钢铁、水泥、机械属于先导行业,投资完后会带来房地产、消费、文化行业的发展,这就属于跟随行业
行业轮动策略的有效性原因是,资产价格受到内在价值的影响,而内在价值则随着宏观经济因素变化而波动。而周期性行业在不同经济周期表现差异较大的原因是,其经济产业链上的位置所决定的现金流量不均衡。研究表明,板块/行业轮动在机构投资者的交易中最为获利的盈利模式是基于行业层面,进行周期性和防御性的轮动配置,这也是机构投资者最普遍采用的策略。此外,周期性股票在扩张性货币政策时期表现较好,而在紧缩环境下则支持非周期性行业。行业收益差在扩张性政策和紧缩性政策下具有显著的差异。
在市场中,经常存在交易性机会,这是指股价在短期内可能受到某些消息的影响,或者某些市场内在因素的改变从而产生剧烈波动带来的价差投资机会。其中,一个典型的交易性策略就是资金流模型,该模型使用资金流流向来判断股票在未来一段时间的涨跌情况,如果是资金流入的股票,则股价在未来一段时间将可能会上涨;如果是资金流出的股票,则股价在未来一段时间会可能下跌,那么,根据资金流向就可以构建相应的投资策略。
动量与反转效应是市场上经常出现的一种情况。所谓动量效应就是在前一段时间强势的股票,在未来一段时间继续保持强势;反转效应就是前一段时间弱的股票,未来一段时间会变强。但问题的关键是这个强势和弱势会保持多长时间和多大幅度,这是动量、反转策略需要考虑的关键问题。
动量策略就是寻找前期强势的股票,判断它将继续强势后买入持有;反转策略就是寻找前期弱势的股票,判断它将出现逆转后买入持有。
1965年,法玛提出了经典的有效市场假说(EMH),夏普、林特纳和莫辛将EMH和马科维茨的资产组合理论结合起来,建立了一个以一般均衡框架中的理性预期为基础的投资者行为模型——资本资产定价模型(CAPM),CAPM和EMH成为现代金融学的两大基石。但随着市场的发展也出现了一系列无法用传统金融理论解释的现象,如羊群效应、小公司和规模效应、股权溢价之谜等给现代金融理论构成了强有力的挑战,行为金融学也随之产生。
现代金融理论和EMH是建立在有效市场竞争的基础上的,能够在市场竞争中幸存下来的只有理性投资者。而相关研究表明,在某些情况下,非理性投资者实际上可以获得比理性交易者更高的收益,非理性投资者仍然可以影响资产价格。
行为金融学 | 介绍 |
---|---|
羊群效应 | 羊群效应是指投资者在交易过程中观察并模仿他人的交易行为,从而导致一段时间内买卖相似的股票。在信息高度不对称的市场环境下,投资者无法直接获得别人的私有信息,但却可以通过观察机构投资者的买卖行为来推断其私有信息,此时容易产生个人投资者和机构投资者的羊群行为,出现群体压力等情绪下的非理性行为。 |
小公司效应 | 小公司效应是指小盘股比大盘股的收益率高。1981年,Banz发现了股票市值随着公司规模的增大而减少的趋势。随后,Reimganum也发现了公司规模最小的普通股票的平均收益率要比根据CAPM模型预测的理论收益率高,且小公司效应大部分集中在1月份。由于公司的规模和1月份的到来都是市场已知信息,这一现象明显地违反了有效市场假设。 |
反应过度和反应不足 | 人们进行投资决策时存在两种错误范式:其一是选择性偏差,即投资者过分重视近期数据的变化模式,而对产生这些数据的总体特征重视不够,这种偏差导致股价对收益变化的反应不足。另一种是保守性偏差,投资者不能及时根据已变化的情况修正自己的预测模型,导致股价过度反应。 |
动量效应与反转效应 | 所谓动量效应是指早期收益率较高的股票在接下来的表现仍会超过早期收益率低的股票;而反转效应就是买进过去表现差的股票而卖出过去表现好的股票来进行套利的投资方法。而在我国市场上,热点的切换及投资者的偏好会经常发生转变,也使得动量效应和反转效应在一段时间内能反复出现 |
1)阿尔法动量
一只股票未来回报的预期可以拆成Alpha、Beta及残差3个部分,用公式描述为:
rp=α+βm+ε
式中第二项是股票随着市场总体涨落带来的市场回报,最后一项代表的是无法提前预知的股票相对于市场回报的差异。而式中第一项Alpha同样也是偏离市场的回报,但是它与残差不同,Alpha代表了提前预知的偏离。
从量化投资的角度来说,积极型股票投资者的目标可以理解为寻找正的Alpha动量,这个过程通常是通过基本面分析来完成的。而动量模型的目标是通过数量方法寻找到股票持续的正的Alpha。量化投资方法可以观测到通常投资者不容易观测到的股票细微变化,同时也可以观察更多的股票,快速建立投资股票池,帮助投资者选择股票。
另一方面,当股指期货推出以后,投资者也可以找出有Alpha的股票进行套利。股指期货非常接近于市场的回报,可以用来消除股票中的Beta使投资者获得纯粹的Alpha,从而不用在意市场的涨跌而得到绝对回报。
(2)股票的Alpha会持续吗
股票的Alpha会持续主要有以下两个原因:
(1)如果股价向股票的价值收敛的速度比较慢,知情投资者就更容易从中得利,所以这些交易者会倾向于更缓慢地把价格推向股票的实际价值。
(2)中国股票市场存在一种股票轮动现象,一个行业或部分股票常常会在一段时期内保持强于或弱于市场总体水平。
因此,动量策略的目标是从股票市场上千只股票的大海中筛选出这样的股票,即当它出现正(负)的阿尔法时,之后的阿尔法也会为正(负)。找到以后,便可以使用对应的策略进行投资,因此这种筛选股票的策略称为阿尔法动量策略。
(3) 阿尔法动量模型
假设股票的阿尔法是一个随机过程。出于简化的目的,假设阿尔法是最简单的AR(1)过程。股票的收益率就能表示为下面的形式:
r p(t)=α(t)+β rm(t)+ε(t)
α(t)=δ α(t-1)+V(t)
在这个模型中,当δ小于0时,αt会出现反转,这种情况意味着这只股票存在过度反应的现象。当δ介于0到1之间时,随着时间的变化αt总会向0靠近,决定其减为0速度的关键是δ的大小。
当一只股票的δ越大,代表它的αt向0回归的速度越慢。
换句话说,如果我们能找到一些股票δ与现在的α(t)都比较大,那么这只股票在接下来的时间内α(t)大于0的可能性也比较大。
可以使用马尔科夫链蒙特卡罗方法估计该模型的参数,使用模拟结果的均值作为各个参数的估计值。
一致预期是指市场上对某股票有一致看法,看多或者看空,在众多分析师一致预期下,投资者会产生羊群效应,大量买入或者大量卖出,从而使得某股票持续上涨或者持续下跌,这就是一致预期选股的基本原理
一致预期选股策略采用分析师的评级数据来构建相应的组合,试图找出最适合的一致预期参数。
股票的长期收益并不仅仅依赖于实际的利润增长情况,还取决于实际的利润增长与投资者预期的利润增长之间的差异。持续的成长性可以消弭估值的泡沫,只有超预期的成长性才能带来价值重估的机会,从而才可能获得更高的估值水平,因此带来更多的投资收益。
从历史经验来看,市场热衷于追捧一致预期看好的股票,而摒弃预期不好的股票;同时,市场也会迎合那些未来有高成长预期的股票,并因此提升个股或行业的估值水平。也就是说,市场预期本身很重要,因此我们可以利用市场的一致预期数据去挖掘投资的机会
趋势追踪的基本思想是追随大的走势,例如,对于一只股票来说,当向上突破重要的压力位后可能意味着一波大的上涨趋势行情的到来,或者向下突破某重要的阻力位后,可能意味着一波大的下跌行情的到来。趋势追踪策略就是试图寻找大的趋势波段的到来,并且在突破的时候进行建仓或者平仓操作,以期获得大的波段收益。
投资者选股,主要是基于3个方面的信息:基本面、技术面和消息面。这3种方法各有其优点和缺点。
投资者选股 | 说明 |
---|---|
基本面分析 | 基本面分析的经济逻辑较强,对事件的解释性也较强,比较容易给出一套逻辑来判断某种状态下股价被低估。但是基本面分析也有其弱点,不容易判断被低估价值的股票价格何时或者以怎样的过程恢复到其对应的价值,对短期行情的判断缺乏指导性。 |
技术面分析 | 技术面分析是对历史已发生的行情进行统计,得出指标来推断将来的行情。其优点是既可运用于长期的判断,也可以运用于短期的判断,并且依据的信息是已经发生的可靠信息,可操作性最强。但是它也有自身的缺点,由于它利用的主要是已发生的信息,因此总是存在滞后性。 |
消息面分析 | 消息面分析认为拥有超额信息才能拥有超额收益,拥有非对称信息可以获得超额收益。但是内幕消息交易是法律上禁止的,且其获得有一定的门槛和成本。并且假消息也充斥于资本市场之上,辨识其真伪有一些难度。所以每种方法都在一个方面和一定程度上对股价的判断具有指导作用,但又各有其弱点,需要其他方法来做有益的补充。 |
筹码选股的基本思想是通过判断某只股票的筹码分布情况来判断股票未来的涨跌。
根据主力持仓理论,如果主力资金开始收集筹码,则意味着在未来一段时间该股票出现上涨的概率比较大;
如果主力资金开始派发筹码,则意味着在未来一段时间该股票出现下跌的概率比较大。
筹码选股策略就是通过筹码分布数据,选择筹码集中度越来越高的股票,以期获得超额收益的方法。
由于在二级市场上流通股票的份额是相对固定的,价格走势的变化必然是市场中资金与筹码之间交替互换的结果。一般地,股票价格走势都会经历“筑底—上升—作顶—下降”4个阶段,相应地,筹码变化的特征则会遵循“由分散到集中,发散度下降—由集中到分散,发散度上升—由分散到集中,发散度下降—由集中到分散,发散度上升”的路径。
因此,筹码分布理论应运而生,筹码分布的学术名为“流通股票持仓成本分布”,它反映的是在不同价位上投资者的持仓数量。
筹码分布理论是通过股票价格和成交量来研究筹码和现金可逆互换的理论。该理论的最主要假设是:将所有影响股票内在价值和供求关系的因素都可以由筹码来还原。依据该理论,股票投资的收益无非是来自于现金在低位转换为筹码(股票),再将筹码在高位兑换为现金的过程。
也就是说,任何一轮行情都将经历由低位换手到高位换手,再由高位换手到低位换手,即筹码的运动过程是实现股票投资收益的过程,因此股价运动的本质等于成交量背后的筹码运动状态,简而言之,是资金与筹码之间的博弈。
筹码分布和股价的变动相关,当某一股票筹码分布较为集中时,表明主力正在收集筹码,股价上涨的概率较大,当某一股票筹码分布较为分散时,表明主力正在抛售,股价下跌的概率较大。
上市公司股东人数的变化与其二级市场走势存在着一定相关性,股东人数越少,表明筹码越集中,股价走势往往具有独立个性,并常常逆大势而动。股东人数越多,表明筹码越分散,股价走势往往较疲软,不具有独立性,跟着随大盘随波逐流。
对于一个选股组合的好坏,可以通过一些指标来判别,主要包括收益率指标和风险率指标两大类。对于投资者,特别是机构投资者来说,收益率并不是判断好坏的唯一指标,需要更多地考虑相对市场、相对业绩基准的情况,并且还要考虑收益率的波动情况、是否投资足够稳健等。
对于一个选股组合的好坏,可以通过一些指标来判别,主要包括收益率指标和风险率指标两大类。对于投资者,特别是机构投资者来说,收益率并不是判断好坏的唯一指标,需要更多地考虑相对市场、相对业绩基准的情况,并且还要考虑收益率的波动情况、是否投资足够稳健等。
收益率指标 | |
---|---|
总收益率 | |
年化复合收益率 | |
相对收益率 | |
阿尔法收益率 | |
贝塔系数是统计学上的概念,它所反映的是某一投资对象相对于大盘的表现情况。其绝对值越大,显示其收益变化幅度相对于大盘的变化幅度越大;其绝对值越小,显示其变化幅度相对于大盘越小。如果是负值,则显示其变化的方向与大盘的变化方向相反;大盘涨的时候它跌,大盘跌的时候它涨。
系数一般有3种估计模型,分别是基于β系数定义、CAPM以及单因素模型的估计。
1)基于定义估计
1)夏普比率的计算公式
它反映了单位风险投资组合净值增长率超过无风险收益率的程度。如果夏普比率为正值,则说明在衡量期内投资组合的平均收益率超过了无风险利率。在以同期银行存款利率作为无风险利率的情况下,说明该投资组合比银行存款要好。
夏普比率越大,说明投资组合单位风险所获得的风险回报越高。
以夏普比率的大小对投资组合表现加以排序的理论基础在于,假设投资者可以以无风险利率进行借贷,这样,通过确定适当的融资比例,高夏普比率的投资组合总是能够在同等风险的情况下获得比低夏普比率的投资组合高的投资收益。
例如,假设有两个投资组合A和B,A投资组合的年平均净值增长率为20%,标准差为10%,B投资组合的年平均净值增长率为15%,标准差为5%,年平均无风险利率为5%,那么,投资组合A和投资组合B的夏普比率分别为(20%-5%)/10%=1.5和(15%-5%)/5%=2。依据夏普比率,投资组合B的风险调整收益要好于投资组合A。
为了更清楚地对此加以解释,可以以无风险利率的水平,融入等量的资金(融资比例为1:1),投资于B,那么B的标准差将会扩大1倍,达到与A相同的水平,但这时B的年平均净值增长率为25%(即2*15%-5%),即大于投资组合A。
夏普率在运用中应该注意的问题:
(1)用标准差对收益进行风险调整,其隐含的假设就是所考察的组合构成了投资者投资的全部。因此只有当考虑在众多的投资组合中选择投资某一只组合时,夏普比率才能够作为一项重要的依据。(2)使用标准差作为风险指标也被人们认为不合适。(3)夏普率的有效性还依赖于可以以相同的无风险利率借贷的假设。(4)夏普率没有基准点,因此其大小本身没有意义,只有在与其他组合的比较中才有价值。(5)夏普率是线性的,但在有效前沿上,风险与收益之间的变换并不是线性的。因此,夏普指数在对标准差较大的投资组合的绩效衡量上存在偏差。(6)夏普率未考虑组合之间的相关性,因此纯粹依据夏普值的大小构建组合存在很大问题。(7)夏普率与其他很多指标一样,衡量的是投资组合的历史表现,因此并不能简单地依据投资组合的历史表现进行未来操作。
(7)夏普率与其他很多指标一样,衡量的是投资组合的历史表现,因此并不能简单地依据投资组合的历史表现进行未来操作。
(8)计算上,夏普率同样存在一个稳定性问题:夏普率的计算结果与时间跨度和收益计算的时间间隔的选取有关。
尽管夏普率存在上述诸多限制和问题,但它仍以其计算上的简便性和不需要过多的假设条件而在实践中获得了广泛的运用。