机器学习笔记014 | 对于因子选股,机器学习可以这样用

还记得前几天在《过度拟合和正则化》文末提的问题么?

我们进行多因子选股,每个因子之间的权重,是否可以通过机器学习的方式得到呢?

这一回,我就进行了简单的实现。

还是以之前文章《投资10年300倍,你也可以。》中策略所使用的33个因子进行计算,构建的线性回归模型如下:

以股票某一个交易日的因子数据为特征x,之后某一段时间股票的涨幅为结果y,各个股票为样本的训练集m。

某一段时间的涨幅中的时间是调仓周期。

例如调仓当日计算的因子权重,应该是基于上一个调仓周期的,涨幅也应该是上一个周期至今的涨幅情况。

这样,通过线性回归的方式,就能获得最优的参数组合 θ。

然后以该参数组合,根据各个股票调仓当日的因子情况,来预测其当日到下一个调仓日的上涨幅度。

按照涨幅预测值降序排序,进行选股。

根据这样的策略逻辑,我设置了调仓周期为10天,持有股票50个,不设置止损,过滤创业板、ST、涨跌停股票。

从2007年1月1日到2017年9月15日的回测效果如下:

机器学习笔记014 | 对于因子选股,机器学习可以这样用_第1张图片

从历史的回测来看,是具有一定的作用的。

通过归因分析中的年度收益来看,大部分的收益是来自于牛市:

机器学习笔记014 | 对于因子选股,机器学习可以这样用_第2张图片

这可能结果判断标准y是股票的涨幅有关系,通过股票的涨幅来选股,趋势性自然就很强。

对于这样的策略模型,目前我暂时想到可以和多因子策略进行结合,例如我之前发布的动态多因子策略。

当然,也应该有更多可以应用的地方,欢迎大家讨论,让我们碰撞出思想的火花。

详细的代码请点击阅读原文查看。

文章转载自公众号:止一之路

你可能感兴趣的:(机器学习笔记014 | 对于因子选股,机器学习可以这样用)