时间序列统计特征的详细解析

  大家好,我是herosunly,从985院校硕士毕业,现担任算法研究员一职。CSDN博客专家,2020年博客之星TOP。曾获得阿里云天池比赛第一名等Top名次,拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。

  根据对已有时间序列比赛的统计研究,发现数据规模不大的比赛任务中,依然使用的是特征工程+梯度提升树模型(XGBoost、LightGBM、CatBoost)。而且特征工程依然是重中之重。所以特意换了一些时间对特征工程进行了详细的总结。主要包括两大类,一类是常用的(大家都使用的)基本特征,还有一类是Top选手使用的高级特征。为了方便比赛选手学习,将其概念代码均进行了详尽的总结,具体如下文介绍。
时间序列统计特征的详细解析_第1张图片

文章目录

  • 1. 基本特征
  • 2. 高级特征
    • 2.1 峰值因子、裕度因子、波形因子、脉冲因子、重复值的若干个特征
    • 2.2 傅里叶变换的若干个特征
      • 2.2.1 傅里叶系数
      • 2.2.2 傅里叶变换后的统计特征
    • 2.3 差分特征

你可能感兴趣的:(AI比赛教程,时间序列,机器学习,特征工程,数据挖掘,人工智能)