logistic模型

1 什么是逻辑

        线性回归是针对结果是连续值的问题,而逻辑回归则是针对结果是离散值的问题。也就是说,逻辑回归通常用来处理因变量是定性变量的问题。比如是否患病、是否结婚、是否购买等事件。        

2 原理

        对于logistics回归有:

               

         首先,建立多元线性方程:

        y = \Theta _{0}+\Theta_{1}x_{1}+\Theta_{2}x_{2}+....+\Theta_{n}x_{n}

        其中(θ0,θ1,θ2,⋯ ,θn)为模型的参数,如果因变量是数值型的话,可以解释成某某因素xi变化了多少导致结果y发生了多少变化,如果因变量y是用来刻画某特定结果发生的概率(0~1)呢?这时候因素xi变化导致结果y的变化恐怕微乎其微,有时候甚至忽略不计。于是,我们需要让不显著的线性关系变得显著,使得模型能够很好解释随因素的变化,结果也会发生较显著的变化,这时候,人们想到了logit变换,下图是对数函数图像:

logistic模型_第1张图片

 后变为:

        log(y) = \Theta _{0}+\Theta_{1}x_{1}+\Theta_{2}x_{2}+....+\Theta_{n}x_{n}

虽然上式解决了因变量随自变量变化的敏感性问题,同时也约束了y的取值范围为(0,+∞)。我们知道概率是用来描述某件事发生的可能性,事件发生与不发生有对立性,结果可以走向必然发生(概率为1),也可以走向必然不发生(概率为0),因此概率的取值范围为(0,1),而等式左边y的取值范围是(0,+∞),所以需要进一步压缩,又引进了几率。
                ​​​​​​​        ​​​​​​​        ​​​​​​​        ​​​​​​​        ​​​​​​​        odd = \frac{p}{1-p}

经过变换:

 log(\frac{p}{1-p}) = \Theta _{0}+\Theta_{1}x_{1}+\Theta_{2}x_{2}+....+\Theta_{n}x_{n}

可得:

  

 

你可能感兴趣的:(逻辑回归,python,机器学习)