量化投资中的因子逻辑与多因子选股的概念

如何理解多因子选股

量化交易:多因子选股之有效因子
这篇文章对我来说,还是不够透彻。我需要理解什么是因子。

量化投资中的因子逻辑是什么?该如何实现?
这篇文章将因子分为了估值因子,成长因子,财务质量因子,杠杆因子,规模因子,动量因子,波动率因子,换手率因子,情绪因子,股东因子以及技术因子十一个大类,每个大类因子中又分别选择了一些小因子做了一个简单的描述。
量化投资中的因子逻辑与多因子选股的概念_第1张图片
可见,因子是利用股票的历史数据(高开低手成交量等)和各种各样的市场数据(比如利用新闻文本数据挖掘得到的市场情绪因子)通过一定的算法计算出来的数值。这个数值可以用来对股票的当前状况进行估量,对股票的未来走势进行预测!

我们来看几个例子
量化投资中的因子逻辑与多因子选股的概念_第2张图片
在这个图中,市盈率,顾名思义,市值和盈利的比率;市净率:市值和净资产的比率。那么市盈率这个因子比较高,说明了什么呢?
显然,这说明相对于公司的实际经营情况,股价的虚高程度。这个比率太高就意味着该股票可能是存在泡沫的。

市盈率(PE) = 市值 / 公司净利润 = 股价 / 每股收益

上面这个公式1把市盈率这个因子拆解得很清晰。光是用市盈率这个因子就可以帮助大家在选股的时候对股票进行初步筛选。

这个时候我们回过头,去看开头的多因子选股的文章,就能看懂了。

各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。

一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。

打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。

多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。

如何检验因子的有效性

一般检验方法主要采用排序的方法检验候选因子的选股有效性。

具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小, 按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。

既然是排序了,那么从0~9这十个组合,它们的因子的大小应该也是从小到大的。

基本思想:我们需要采取循环测试,每月按照因子的值升序排序,然后选取某一区间(共十个均分区间)的股票作为标的,全仓等权重买入,每月换仓,统计最终结果。2(这样做的目的:始终保持0~9十个组合的因子大小是从小到大排列的)

量化投资中的因子逻辑与多因子选股的概念_第3张图片
上图的纵轴代表了绝对收益,对于这个年化净资产收益率因子来说,右边(因子比较大的一边)的绝对收益比较高。这是符合我们的预期的。BTW,经过检验,我们就可以说这个因子是有效的。我们就可以用历史数据计算股票的年化净资产收益率,用它来支持我们的股票购买决策。


  1. https://www.zhihu.com/question/34552077 ↩︎

  2. https://www.douban.com/doulist/110048334/ ↩︎

你可能感兴趣的:(量化交易,量化,多因子选股)