因子暴露度与因子IC值

因子暴露度与因子IC值

注:文中提到的因子值就是纯粹的因子的数据,如roe做各种数据处理之后的大小

1.排序法
排序法最核心的思想是使用个股在该变量上的取值的大小来代替个股在该因子上暴露的高低。
每到一个时点,抽出所有股票当期的因子(标准差、取极值,市值行业中性化),抽出所有股票下一期的收益率,求相关系数
此时的因子暴露度就是因子值,IC值就是相关系数
举例:在2010年1月30日,抽出n个股票在1月30日的因子值,做数据处理,再抽出n个股票1月30日到2月28日的收益率,求相关系数

2.多因子模型的回归检验
2.1时序回归
在时序上,对股票在某时期内的收益率,与某时期内的多空收益率,回归得到因子暴露。

对于每一个股票,得到过去30天的因子值,得到过去30天的收益率数据,再由前者算出所有股票的多空收益率(所谓多空收益率,即是在所有股票的股票池子里,高因子组合的收益率减去低因子组合的收益率)。此时,再以股票的收益率为y,以组合的多空收益率为x,做线性回归,系数就是因子暴露,n个股票,就有n
个因子暴露。将这n个因子暴露和股票下一期的n个收益率,求出相关系数,就是IC值。
举例:5支股票,1月1日到1月30日的日收益率30个,1月1日到1月30日的因子值30个。由因子值大小和收益率,可以求得1月1日到1月30日的多空收益率30个。令日收益率为y,多空收益率为x,得到系数,即得到5个股票的因子暴露。
再拿出5个股票再2月1日到2月28日的月收益率1个,共5个。
将这两组各5个数据求出相关系数,即是该时点的IC值。
最典型的就是Fama-French三因子模型。
注意,对于ROE这种数据,就做不了回归,因为ROE是季度披露的。
2.2 截面回归
截面回归求因子暴露实际上也是时序回归,之所以叫截面回归是因为他的第二步。
截面回归不需要计算因子收益率,以因子值的大小来代替,通过时序回归得到因子暴露。
再通过得到的因子暴露,与因子的预期收益率E(r),在截面上进行回归。

总结:
1.截面回归就是某个时点,对n个股票回归;时序回归就是取一段时间,在t个时间回归
2.因子IC值需要求解因子暴露,我的理解是用最简单的排序法就行。

参考:《因子投资,方法与实践》,石川

你可能感兴趣的:(python,量化学习,python)