第七周周报

第七周周报

这次的天池贷款违约预测比赛,是我第一次参加数据挖掘这方面相关的比赛,经过七周的时间,从学习数据挖掘相关知识,数据预处理,建模到特征工程,参数优化,我从中学习到了数据挖掘领域的许多知识。

数据预处理

在本次的比赛中,我感受到了数据处理的重要之处,通过恰当地处理数据,能够大幅地提升预测的水平,我从这次比赛中,也学习到了很多数据处理的方式。
在数据处理之前,我们首先需要了解数据本身的特点,需要观察,数据的缺失情况,数据的一致性,是否存在矛盾的数据,数据中的数值型与非数值型数据,数据的分布情况,通过对数据的了解,我们才能恰当地处理数据。
分析完数据之后,我们需要对数据进行处理,我在本次比赛中,将非数值型数据,转化为了数值型,对缺失值进行填充,对只有单一值的列,进行删除,并且,通过对原数据中多种属性的概括总结,形成了新的特征,通过数据的处理,能够提升模型的准确性。

建模

我采用的是lightgbm模型,这个模型训练效率高的同时,还能提高准确性,通过对原数据集进行划分,划分为训练集与测试集,进行训练,在模型的相关参数的优化方面,我采用了贝叶斯调参的方法,对参数进行优化,对于最后的结果,也起到了很大的提升作用。

总结

本次比赛是我第一次参加的数据挖掘比赛,从零开始掌握了数据挖掘中的很多知识,在接下来的比赛中,我计划尝试更多的模型,扩宽知识面。

成绩

第七周周报_第1张图片

你可能感兴趣的:(第七周周报)