《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施

@[TOC]《零基础入门数据挖掘 - 二手车交易价格预测》baseline实施

《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施

前面陆陆续续学习机器学习大概有有2个月的时间,西瓜书没有看完,吴恩达的视频也没有看完。春节期间开始参加阿里巴巴智能运维算法大赛,和小伙伴一起通力合作,勉强进入复赛,感到力有不逮,基础不够牢固。前几天看到天池举行了《零基础入门数据挖掘 - 二手车交易价格预测》的比赛,并且出了官方Baseline。
  初略的看了一遍Baseline,感觉写的非常好,数据分析EDA、特征工程、参数调整等等全部都有,并且出了官方教程,感觉就是一本零基础入门的宝书。
  下面将我实施Baseline的过程写下来,供大家参考。

Fork Baseline

Baseline的链接在这里
最新版本为V11。

  1. 点击右上角的“Fork”按钮,fork到自己的天池实验室空间;
    在这里插入图片描述
  2. 标题可以修改,你可以下载Notebook到本地运行。
    在这里插入图片描述

修改数据集

我试过使用天池的公共数据集,不稳定,会出现不能读取的问题。
上传数据到自己的个人空间。

  1. 在个人空间建子目录“zero”;
  2. 上传文件到目录“zero”
  3. 在Notebook里检查文件
    《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施_第1张图片

修改提交文件路径

将提交文件路径也设置到刚才新建的目录里。
《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施_第2张图片

运行Baseline Notebook

这个Baseline写的很好,做了上面的配置后,就可以正常运行了。

  1. 运行Notebook;
    可以点击中间的按钮单步执行,也可以点击右面的按钮执行全部程序。
    在这里插入图片描述
  2. 下载提交文件
  3. 到比赛页面提交即可。

Baseline在没有修改的情况下,成绩大概的680分。

你可能感兴趣的:(《零基础入门数据挖掘》组队学习)