Logistics回归模型

  1. 二分类资料logistics回归:
    因变量为二分类变量的资料(一般为0,1分类),可用非条件logistics回归和条件logistics回归进行分析。非条件logistics回归多用于非配比研究资料,条件logistics回归多用于配对或配比资料。

  2. 多分类资料logistics回归:
    因变量为多项分类的资料,可用多项分类logistics回归模型或有序分类logistics回归。

  3. 以下我们对二分类资料logistics回归作介绍:
    i. logistics回归方程为:

    p=exp(β0+β1x1+β2x2+...+βmxm)1+exp(β0+β1x1+β2x2+...+βmxm)

    (注:因为分子比分母小,且指数函数取值为正数,故p取0-1区间的数值)

    ii. 令 Z=β0+β1x1+β2x2+...+βmxm ,则Z与P之间的关系曲线如图所示:

    Logistics回归模型_第1张图片

    iii. logit变换

    logit p=ln(p1+p)=β0+β1x1+β2x2+...+βmxm

    例如: ln(p1+p)=5.62+0.23x10.4x2
    x1代表年龄,x2代表文化程度,p代表死亡率。x1系数为正,则年龄越大死亡率越高;x2系数为负,则文化程度越高死亡率越低。

    iv. 计算出因变量p的值后,我们人为定义阈值为0.5;p的值大于0.5则用1表示,p的值小于0.5则用0表示。

你可能感兴趣的:(统计学)