本文选取13 个常见因子,首先针对因子的Rank-IC 回测,衡量因子对未来收益
的预测能力,其次通过对每一期固定分位数分组,将股票池分为10 组,观测各
组之间收益率的差异,从而总结因子预测结果的单调性。
本文选取的因子包括技术类因子(ADX,RSI,20 日平均换手率),动量类因子
(动量指数),盈利因子(ROE,ROA),估值类因子(PB,PE),成长类因子
(净资产增长率,净利润增长率),规模类因子(总市值对数),杠杆类因子(资
产负债率)和历史BETA 因子。回测区间选取2014 年1 月1 日到2016 年6 月
24 日,调仓周期以周为单位,分别选取沪深300 和中证500 的成分股为股票池。
2.1、 因子Rank-IC 实证
本文接下来将分别对各因子的Rank-IC 进行讨论。
1. ADX
ADX 因子属于技术类因子,用来衡量趋势的强弱。图A-1 和图A-2 分别展
示了ADX 因子的Rank-IC 在沪深300 股票池和中证500 股票池中从2014
年初至2016 年6 月的时间序列,其中红色曲线为20 周均线。从长期来看,
ADX 因子并没有稳定的预测能力,2014 年初至2015 年末的2 年时间里,
证券研究报告
请务必阅读正文后免责条款部分 6
20 日均线呈现为在零附近的周期震荡。而从2016 年初开始,ADX Rank-IC
进入了一个正的周期,强趋势性具有正向的预测能力,该现象在沪深300 成
分股中尤为明显,其Rank-IC 均值为0.0279,标准差相对历史大幅下降。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 0.0021 0.1256 0.0000 0.0805
2016 年初至2016 年6 月 0.0279 0.0708 0.0072 0.0775
2. RSI
RSI 属于技术类因子,多用于衡量超买超卖。图A-3 和图A-4 分别展示了
RSI 因子的Rank-IC 在沪深300 股票池和中证500 股票池中从2014 年初至
2016 年6 月的时间序列,其中红色曲线为20 周均线。在回测中,RSI 是一
个较好的反向预测指标,其均线长期处于负值区间,而自2016 年以来,20
日均值在沪深300 中有相对扩大的趋势,同时在中证500 中也处于历史较高
阶段。RSI 作为超买超卖指标,很有效的反映了市场观点,并具有反向预测
未来的能力。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0201 0.2003 -0.0366 0.1424
2016 年初至2016 年6 月 -0.0893 0.1649 -0.0494 0.1866
3. 20 日平均换手率
图A-5 和图A-6 分别展示了20 日平均换手率因子的Rank-IC 在沪深300 股
票池和中证500 股票池中从2014 年初至2016 年6 月的时间序列,其中红
色曲线为20 周均线。我们认为20 日平均换手率也是一个较好的反向预测指
标,从图中可以看到,其20 周均值一直处于零轴以下,有较稳定的表现。
但是,其问题在于,标准差过大,如果仅选用该因子构建投资组合,可能带
来较高的波动性,图中可以明显看到,自2016 年年初以来,其Rank-IC 的
标准差明显上升,处在一个高波动阶段。换手率的反向预测能力,一方面体
现了冷门股票的补涨行为和轮动效应,另外一方面,其高波动现象也体现了
短期追涨,然而急速反转的现象。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0220 0.2190 -0.0432 0.1403
2016 年初至2016 年6 月 -0.0383 0.3296 -0.0299 0.2193
4. 动量指数
动量指数用于描述股价波动过程中的惯性作用,当速度力量逐渐减缓,行情
可能出现反转。图A-7 和图A-8 分别展示了动量指数因子的Rank-IC 在沪深
300 股票池和中证500 股票池中从2014 年初至2016 年6 月的时间序列,
其中红色曲线为20 周均线。从图中可以看到,其20 周均线一直处于负值,
证券研究报告
请务必阅读正文后免责条款部分 7
体现了反向预测效应,当指标过高时,收益将会回落。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0355 0.1805 -0.0556 0.1407
2016 年初至2016 年6 月 -0.0537 0.2388 -0.0475 0.2175
5. ROA
ROA 作为财务报表盈利因子,通常用来评价财务盈利和总资产的回报能力。
图A-9 和图A-10 分别展示了ROA 因子的Rank-IC 在沪深300 股票池和中
证500 股票池中从2014 年初至2016 年6 月的时间序列,其中红色曲线为
20 周均线。从图中可以看到,从2015 年上半年起,ROA 的20 周均线从负
向转为正向,并一直持续到现在。ROA 的正向预测能力比较符合主观认识,
高ROA 的标的能够在未来带来高收益。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0021 0.1726 -0.0044 0.1363
2016 年初至2016 年6 月 0.0450 0.1870 0.0382 0.1702
6. ROE
ROE 作为财务报表盈利因子和ROA 一样通常用来评价财务质量。图A-11
和图A-12 分别展示了ROE 因子的Rank-IC 在沪深300 股票池和中证500
股票池中从2014 年初至2016 年6 月的曲线,其中红色曲线为20 周均线。
ROE 和ROA 在沪深300 中表现并不是完全同步,从图11 中可以看到,ROE
Rank-IC 的20 周均线在2015 年10 月分之后才开始由负转为正。2016 年年
初以来,ROE Rank-IC 的波动性也有减小的趋势。总体来讲,ROE 的预测
效果稍好于ROA。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0097 0.1783 -0.0079 0.1205
2016 年初至2016 年6 月 0.0601 0.1641 0.0296 0.1513
7. PB
图A-13 和图A-14 分别展示了PB 因子的Rank-IC 在沪深300 股票池和中
证500 股票池中从2014 年初至2016 年6 月的时间序列,其中红色曲线为
20 周均线。PB 因子是最常用的估值因子之一,被广泛应用,但是以20 周
均线为衡量标准,PB 的预测能力较为不稳定,常常在正负间切换。从2016
年至起,其Rank-IC 的均值均值的绝对值明显减小,表明预测能力在减弱。
我们认为。在短时间区间内,PB 并不适合作为个股的评价指标。
HS300 ZZ500
均值 标准差 均值 标准差
证券研究报告
请务必阅读正文后免责条款部分 8
2014 年初至2015 年末 -0.0250 0.2656 -0.0296 0.2046
2016 年初至2016 年6 月 -0.0054 0.2585 -0.0035 0.2169
8. PE
图A-15 和图A-16 分别展示了PE 因子的Rank-IC 在沪深300 股票池和中
证500 股票池中从2014 年初至2016 年6 月的时间序列,其中红色曲线为
20 周均线。PE 和PB 的表现从图中来看,基本一致,但是其Rank-IC 的均
值表明,近半年来其预测能力更为显著,相对而言,PB 的预测能力在2014
年初到2015 年底的时间里更为显著。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0137 0.2352 -0.0098 0.1425
2016 年初至2016 年6 月 -0.0305 0.2122 -0.0183 0.1626
9. 净资产增长率
净资产增长率是成长类因子的代表。图A-17 和图A-18 分别展示了净资产增
长率因子的Rank-IC 在沪深300 股票池和中证500 股票池中从2014 年初至
2016 年6 月的时间序列,其中红色曲线为20 周均线。净资产增长率的20
周均值在近半年来一直表现出正向预测能力。这与2014 年至2015 年的效
应正好相反。在中证500 中,这一正向预测能力在2015 年中便已经体现出
来。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0137 0.1317 -0.0018 0.0942
2016 年初至2016 年6 月 0.0165 0.1265 0.0268 0.1413
10. 净利润增长率
净利润增长率也是成长类因子的代表。图A-19 和图A-20 分别展示了利润增
长率因子的Rank-IC 在沪深300 股票池和中证500 股票池中从2014 年初至
2016 年6 月的时间序列,其中红色曲线为20 周均线。净利润增长率Rank-IC
的20 周均线在绝大多数时间处于正向,在中证500 中其波动性更小,效果
更为突出。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 0.0053 0.1113 0.0091 0.0682
2016 年初至2016 年6 月 0.0113 0.1662 0.0216 0.1030
11. 总市值对数
总市值对数是多因子模型中最为常用的因子之一,小规模的个股一直以来都
能够带来稳定的超额收益。图A-21 和图A-22 别展示了总市值对数因子的
证券研究报告
请务必阅读正文后免责条款部分 9
Rank-IC 在沪深300 股票池和中证500 股票池中从2014 年初至2016 年6
月的时间序列,其中红色曲线为20 周均线。总市值对数因子Rank-IC 的20
周均线一直以来都处于负数区间,但值得注意的是,在近半年来,其Rank-IC
开始减小,表明规模较小的个股的超额收益有收敛的趋势,这个现象值得长
期关注。另外,在中证500 中的Rank-IC 的波动率要远小于HS 中Rank-IC
的波动率,也表明中小市值企业的规模效应更为突出。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0818 0.2359 -0.0986 0.0862
2016 年初至2016 年6 月 -0.0222 0.2168 -0.0432 0.0940
12. 资产负债率
资产负债率作为杠杆因子也常常用于多因子模型。图A-23 和图A-24 别展示
了资产负债率因子的Rank-IC 在沪深300 股票池和中证500 股票池中从
2014 年初至2016 年6 月的时间序列,其中红色曲线为20 周均线。资产负
债率在2014 年初到2015 年初的很长一段时间里都有正向预测能力,这似
乎与主观认识相悖,不过,在2015 年中以来,其Rank-IC 恢复理性,一直
有着反向预测能力。在ZZ500 中更为明显,体现了中小企业的债务水平对
股市价值的影响更为明显。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0052 0.2101 -0.0073 0.1158
2016 年初至2016 年6 月 -0.0197 0.1720 -0.0300 0.1249
13. 历史Beta
图A-25 和图A-26 别展示了Beta 因子的Rank-IC 在沪深300 股票池和中证
500 股票池中从2014 年初至2016 年6 月的时间序列,其中红色曲线为20
周均线。相对而言,历史Beta 的Rank-IC 具有较高的波动性,在正负值之
间剧烈波动,20 周均线的波动性也很明显。我们认为Beta 作为预测因子的
效用不是很可靠。
HS300 ZZ500
均值 标准差 均值 标准差
2014 年初至2015 年末 -0.0155 0.2161 -0.0144 0.1360
2016 年初至2016 年6 月 -0.0384 0.3149 -0.0053 0.1500
2.2、 因子分位值实证
是否具有较高的Rank-IC 并且效果长期稳定便可以说明因子的预测能力强?本文
希望通过分位值的实证检验来进一步分析预因子的测能力。本文将因子在每一周
期(1 周)初始将因子值进行排序,并将个股划分为10 档,在当期结束后计算
该档个股的平均收益,统计因子分为档和平均收益率的关系。
证券研究报告
请务必阅读正文后免责条款部分 10
本文对仅用IC 来衡量预测有效性的顾虑来源于,IC 是基于线性相关性的假设而
推倒出来的,无论是Spearman 相关系数还是Pearson 相关系数都是基于线性
方法求解。当序列存在局部线性关系时,虽然,我们可以得到较高的相关系数,
但是,当我们应用打分法或者回归法取最高或最低值的时候,很有可能落在非单
调区间,因而,不能得到优化组合。举例说明,假设有一个从1 到50 的整数序
列x,通过cosine 函数映射为序列y,x 和y 的pearson 相关性系数为0.24,如
下图所示,虽然x 和y 在20 到40 之间有良好的正相关性,但假如我们应用打
分法取最高值的时候,便会取到较差的y 值。因此,这里的问题在于,对于两个
相关序列,如何选择相关区间。从经济学意义上讲,因子所代表的经济意义理论
上会带来相应的风险收益,但在有摩擦的市场中,这种经济意义也许不能在短期
内释放,产生于理论相适应的结果,所以接下来,我们希望通过实证,选择较为
理想的因子线性区间。
图1:非线性相关序列
资料来源:国海证券研究所
1. ADX
图B-1 和图B-2 分别展示的是ADX 因子在沪深300 和中证500 中的10 个
分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平均收益,
红色表示2016 年初至2016 年6 月的平均收益。在2.1 节中我们提到,ADX
Rank-IC 的均线在零轴上下不断切换,并不具备持续的预测能力,因此,各
分位值对应的平均收益率呈现非单调性便可以理解,所以,我们不建议把
ADX 作为有效因子。
2. RSI
图B-3 和图B-4 分别展示的是RSI 因子在沪深300 和中证500 中的10 个分
位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平均收益,
红色表示2016 年初至2016 年6 月的平均收益。在2014 年初至2015 年末
的区间中,平均收益率对应分位点并没有呈现出明显的线性,相反,其最高
收益均出现在中间分位点。在2016 年之后出现的现象较为引人关注,收益
率对RSI 因子呈现较为明显的单调递减趋势,这意味着,在统计上,高RSI
(超买)会导致未来收益率下降,而低RSI(超卖)预示未来收益率较大提
高。结合图3 和图4 的Rank-IC,我们可以对第二到第六分位点给予相近的
得分,而对第一分为点持保留意见。
3. 20 日均换手率
0
10
20
30
40
50
60
-1.5
-1
-0.5
0
0.5
1
1.5
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
证券研究报告
请务必阅读正文后免责条款部分 11
图B-5 和图B-6 分别展示的是20 日均换手率因子在沪深300 和中证500 中
的10 个分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平
均收益,红色表示2016 年初至2016 年6 月的平均收益。平均收益率对换
手率有较明显的单调递减趋势。稍为例外的是沪深300 中,中间分位点也对
应较高的平均收益。在选股过程中,取第一分位点为多头,第十分位点为空
头是很合理的。
4. 动量指数
图B-7 和图B-8 分别展示的是动量指数因子在沪深300 和中证500 中的10
个分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平均收
益,红色表示2016 年初至2016 年6 月的平均收益。总体上讲,高分位动
量指数将带来较低的平均收益,中间分位将出现较高的收益。这个因子的重
点是排除高位动量指数。
5. ROA
图B-9 和图B-10 分别展示的是ROA 因子在沪深300 和中证500 中的10
个分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平均收
益,红色表示2016 年初至2016 年6 月的平均收益。ROA 同样呈现的是典
型的非单调性,而2014 年初至2015 年底和2016 年初至2016 年6 月的结
果截然相反,中间分位点的高收益在2016 年以后对应的是低收益。在该因
子的使用过程中,应进一步讨论其效果。
6. ROE
图B-11 和图B-12 分别展示的是ROE 因子在沪深300 和中证500 中的10
个分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平均收
益,红色表示2016 年初至2016 年6 月的平均收益。ROE 的情况和ROA
基本类似。
7. PB
图B-13 和图B-14 分别展示的是PB 因子在沪深300 和中证500 中的10 个
分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平均收益,
红色表示2016 年初至2016 年6 月的平均收益。PB 因子也很难识别出其单
调特性,也不适合线性回归法或线性打分法的选股模型。
8. PE
图B-15 和图B-16 分别展示的是PE 因子在沪深300 和中证500 中的10 个
分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平均收益,
红色表示2016 年初至2016 年6 月的平均收益。PE 与PB 类似,单调性不
显著,但是,相对而言低分为的PE 对应较高的收益。
9. 净资产增长率和净利润增长率
证券研究报告
请务必阅读正文后免责条款部分 12
图B-17、图B-18 和图B-19、图B-20 分别展示的是净资产增长率和净利润
增长率因子在沪深300 和中证500 中的10 个分位点对应的平均收益,其中
蓝色表示2014 年初至2015 年底的平均收益,红色表示2016 年初至2016
年6 月的平均收益。波浪形状明显,不宜用于线性预测。
10. 总市值对数
图B-21 和图B-22 分别展示的是总市值对数因子在沪深300 和中证500 中
的10 个分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平
均收益,红色表示2016 年初至2016 年6 月的平均收益。总市值对数因子
是各因子中单调性最明显的一个因子,无论是在空间上的沪深300 和中证
500,或是时间上的2014 年初至2015 年末和2016 年初至2016 年6 月,
均呈现出良好的线性关系。
11. 资产负债率
图B-23 和图B-24 分别展示的是资产负债率因子在沪深300 和中证500 中
的10 个分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平
均收益,红色表示2016 年初至2016 年6 月的平均收益。资产负债率因子
也是典型的局部单调,总体波浪的因子。
12. 历史BETA
图B-25 和图B-26 分别展示的是BETA 因子在沪深300 和中证500 中的10
个分位点对应的平均收益,其中蓝色表示2014 年初至2015 年底的平均收
益,红色表示2016 年初至2016 年6 月的平均收益。BETA 因子呈现的结果
更接近于拱形,中部比较高,而两端相对较低。同时,时间维度上的不确定
性也给结果带来了不稳定的效应。
总体来讲,技术类因子中的RSI 和20 日均换手率、动量类的动量指数和规模类
的总市值对数在回测区间中相对预测结果表现出了较为显著的单调特征,可以直
接用于线性模型中。而其他类型的因子,还需要通过其他途径判断其适用性,而
对于其使用方式,线性模型似乎不能够真正体现因子的特性,需要通过其他非线
性模型将这些因子归类。本节主要是通过对因子空间维度的分析来探讨线性模型
的适用性,从而选出适当的因子。
米筐量化交易平台:http://www.ricequant.com
量化炒股QQ群:484490463 群内大神每日在线讲解代码,用Python自动赚钱!