因子变换

Alhpa 模型的实质是通过找到因子或因子组合与未来收益率之间的关系,从而训

练出较为稳定的收益预测函数,选取优质个股组合。例如,通常用的线性回归模

型就是通过线性回归系数将因子映射到收益率上,从而筛选优质个股,但是其问

题在于,长期来看,多数因子与收益率之间往往不存在稳定线性关系,甚至单调

性也不能保证,所以线性模型的前提条件往往不能满足。个股分类的方法实际是

将连续函数离散化,放松了对模型的限制,只要满足分类组合的加权平均收益有

较高的区分度便可以达到模型的目的。在金融领域广泛应用的逻辑回归便是一种

良好的分类模型,虽然因子之间仍然是线性叠加,但是输出结果却是分类的概率,

因此,它可以作为向高阶分类方法的过度的参照物。更进一步的离散化可以将因

子也分组归类,找出因子分组与未来收益分组之间的关系,进一步放松对模型的

限制。下面,我们以动量因子为例,阐述因子到收益的映射过程。如图2 所示,

图中很难直观看出单个动量因子对未来收益的关系,线性拟合在长训练序列中虽

然可能得到显著系数,但由于非线性或非单调性造成的预测误差也十分明显。相

对而言,二元分类法的输出是分类概率,我们希望通过概率大小分组,构造组合

证券研究报告

请务必阅读正文后免责条款部分 8

收益具有良好区分度的组合。另外,对因子进行分组也省去了回归方法中对原始

因子数据的标准化、去极值等过程。我们的分组方法是对训练序列每一期的横截

面数据进行分组,使得不同时期数据具有可比性。与原始因子数据类似,分类本

身并不会影响因子与未来收益之间的内在关系如图2 中第三个子图所示。分组数

据之后会通过模型训练得到因子分位值与决策函数之间的关系图2 中第四子图

所示。最后,通过决策函数结果筛选优质个股,而图2 中第五子图是决策函数对

应未来收益的散点图,其线性关系明显提高。另外,值得注意的是,对比图3 中

第四子图所示(逻辑回归结果)的因子分组均值和收益之间的关系,AdaBoost

算法所示结果具有明显的非线性拟合能力,这也是该算法的突出优点之一。逻辑

回归是将因子与决策函数强制定义为对数线性,但在图中所示的结果中,效果要

弱于AdaBoost 算法。


因子变换_第1张图片


因子变换_第2张图片


因子变换_第3张图片

米筐量化交易平台:http://www.ricequant.com

量化炒股QQ群:484490463  群内大神每日在线讲解代码,用Python自动赚钱!

你可能感兴趣的:(因子变换)