【AI量化模型】跑通baseline

跑通baseline

  • 任务
  • 学习内容
    • 特征工程
    • 模型训练与验证
  • bug
  • 未纠错的结果

任务

教程部署在百度 AI Studio,可以一键fork运行代码,选择*v100 32g1*的配置,baseline运行大约20分钟,再加上进阶部分大约40分钟

学习内容

特征工程

构建基本的时间特征,提取小时、分钟,刻画不同时间阶段可能存在的差异性信息

模型训练与验证

基线实验是采用CatBoost模型,5折交叉验证的方法训练和测试

CatBoost模型不需过程调参,可以得到比较稳定的分数

bug

  1. kf.split(X)
    K折交叉验证是为了得到训练集和验证集的分类索引,这里仅需要对样本进行分类,而不是样本和标签一起

  2. 模型for循环
    交叉验证的结果需要取平均,不应在循环里

未纠错的结果

【AI量化模型】跑通baseline_第1张图片


  1. 32g 指显存容量,windows版本可通过cmd+dxdiag查看;ubuntu版本可以通过nvidia-smi命令查看,面板中“Memory-Usage”一项表示显存使用率 ↩︎

你可能感兴趣的:(人工智能)