2023-02-06:一件关于量化有趣的事情

昨天和同学聊到这个,她的一个朋友目前在上海某私募做量化,其主管隔天就要一个遗传规划进行因子挖掘的代码,然后来问我有没有接触。

有相关实习经验的同学其实应该都知道,这不算很少见的代码,也有不少可以快速辅助实现的库,如gplearn、deap等。只要设置好基因型和对应表现型、重组突变率、种群和代际规模、目标函数等,就可以快速实现。

但是关键问题是这个写好后,如何控制过拟合的风险,以及如何去处理并解释这些挖掘的因子,究竟完全是样本内过度挖掘的产物,还是代表了某种思路(其实更多是前者)。

思路是清晰的,但是隔天就要就有点离谱了(更别提还是周日),还是给这位同学默哀一下吧,LOL。

你可能感兴趣的:(2023-02-06:一件关于量化有趣的事情)