logistic回归研究 2016.04.28回顾

  昨天的话,主要就干了一个事情,就是对logistic regression的研究

1、从最开始的woe开始说起,一般来说woe公式是ln((Bi/BT)/(Gi/GT)),但是我偶然发现tony的WOE是用的ln((Gi/GT)/(Bi/BT)),由于ln(A/B) = ln(A) - ln(B),所以ln(A/B) = - ln(B/A),相当于说就是所有的输入变量添加了一个负号,当时就这个问题讨论了2个多小时,我当时结合到最后tony的logistic regression结果进行了猜测,因为最后结果,tony的公式是1/(1+e^z),和书本上的1/(1+e^(-z))是互补的关系,我当时sb地猜想woe的符号导致了最后结果是1/(1+e^z),而并非1/(1+e^(-z)),后来思考发现,添加负号进去拟合,拟合出来的系数只不过变号而已,比如以前是a0+a1x1+a2x2,现在把变号过后的-x带入就变成了a0+((-a1)x1)+((-a2)x2),也就是可以把负号提出来把-a1和-a2看成整体,那现在就是按照规则训练出一套系数,这个系数除了常数项,其他系数取反就可以了

2、至于我最以前的问题,为什么tony的公式是1/(1+e^z)?我思考了下,1/(1+e^-z)其实是一样的,最后拟合出来只不过符号不一样,推理过程类似于上一点!所以最后g(Z)算出来都是1的概率,但是如果反着标记,逾期为0,非逾期为1,那就跟着颠倒了,但是如果两类只是A类和B类,那怎么说呢?为什么一般阳性为1,我得到的就是阳性概率呢?难道是28中少的部分?如果一样多呢?我发现我一时半会不能解决这个问题了!那先把这个问题放一放!说明logistic的水很深,真正会玩的人很少!

3、最后要下班的时候还研究了一下odds ratio,简称OR,这个指标我也没理解,还需要深入研究!


你可能感兴趣的:(Logistic)