2020-10-27

数据挖掘周报

本周按照之前讲解的方法进行了优化,对于一些特殊的数据进行了删除,例如全1的数据,大部份都是1的数据进行了剔除,但是结果很不理想,线上提交测试居然准确率下降,目前我也没有明白具体的原因。可能猜测如下:
1.其中有几行几乎95的数据都为1 ,在本题中是一个isDefault的强相关特征
2.某几行数据可能具有关联,删除之后这种关联消失了,导致了结果的下降
3.数据变少了,可能发生过拟合?(不确定会不会有这种情况发生

排名

2020-10-27_第1张图片

你可能感兴趣的:(2020-10-27)