tsfresh学习

tsfresh今天认真看了一遍,就是一个talib集成包(升级版)。

获得基础因子数据,然后放入写好的所有的函数中,计算新的因子,注意,他只能单个因子,如果用两个参数的函数,无效。相信大家都明白意思了吧。

     因子生成的原理是,tsfresh预置了783个算子(calculator),会逐个用在每一个交易日的基础因子数值序列上,这就相当于孙悟空拔一根猴毛下来,
能变出783个形态各异的化身,相同计算公式不同单参数也算1个,11乘以783就是8613,具体的算子计算公式请见官方文档:

https://tsfresh.readthedocs.io/en/latest/text/list_of_features.html

举例,talib中有一个atr函数,用到了OHLC四个价格,tsfresh是计算不了,因为他只能使用一个因子。

现在正式进入学习环节:

导包:

import datetime
start_time = datetime.datetime.now() #开始时间

# 核心代码部分
from tsfresh import extract_features
from tsfresh.utilities.dataframe_functions import roll_time_series
data_roll = roll_time_series(data, column_id='code', column_sort='date', max_timeshift=20, min_timeshift=5).drop(columns=['code'])
data_feat 

你可能感兴趣的:(python,收费专栏,量化,学习)