kaggle competition code & nice kernels & thinking

背景

过去1年在kaggle上有过几次参赛,排名一直在往上升从65%~15%。也算有进步,但是不够快。所以花一天的时间把参赛的代码整理了一下。公布在GitHub上:https://github.com/mr007rin/kaggle

image.png

结构

common:

常用的代码段,包括EDA、数据清洗、特征工程、模型构建(目前仅支持分类模型)、模型选择

参赛代码:

home-credit-default-risk 前65%
quora-insincere-questions-classification 前18%
santander-customer-transaction-prediction 前15%

高价值的kernels

master kernels
这里主要是EDA和FE为主

思考

image.png

http://note.youdao.com/noteshare?id=67707ce92f9a78bae0fb3c4743246887&sub=60835703DFC14671BA541AB41E43B5B4

以前一直在aws上达了个blog,不过还是习惯用的编辑器,就不在维护两套内容了。

你可能感兴趣的:(kaggle competition code & nice kernels & thinking)