2017.08.15回顾

1、IV计算时候前面的系数推导,反正结论一句话,odds固定,样本数越多,IV分量越大

2、为什么不能用bad rate去编码,我搜了很多资料但是没得到结果,我也和别人讨论,在群中提问,但目前无人回答

3、拒绝推断到底有没有必要,这个有联系到变量分布,PSI等问题,而且现在通过率相当低,下一次迭代模型,有可能看见有个变量并没有区隔度了,因为都是高分段了,区隔自然差,但实际上别人是有区隔度的在总体中,我这次可能还好,因为上一个模型放了很多差的进来,但下一次可能就会面临这个问题,但是拒绝推断很难还原到总体,比如5000建模样本,还需要还原出95000的样本,怎么可能?

感觉进展有点缓慢,节奏不能乱,战胜困难!

你可能感兴趣的:(日记,python)