python 多分类有序logit模型_有序多分类Logistic回归模型.ppt

有序多分类Logistic回归模型 一、模型适用条件 研究变量Y是有序的而且是多分类的,常见的如生活满意度,答案包括五个:很不满意;不太满意;一般;比较满意;非常满意。或者三个:满意;一般;不满意。关于主观幸福感的研究,答案包括:比较幸福;一般;比较不幸福。 具体的研究中,有些研究把上述五分类或者三分类变量合并成二分类,使用二项Logistic回归模型,这样的研究比较常见。 二、具体操作 有序多分类回归模型中既可以放分组变量,也可以放连续型变量。 具体操作:Y放在Dependent框中,路径:Analyze-Regression-Ordinal 在Factors框中放分组变量,spss自动对分组变量进行分组,默认最后一组作为对照组。 在Covariate框中放连续变量 输出结果会出现Warnings,警告信息说明自变量的各种取值水平组合中有多少其观察频数为0。如果模型中有连续型变量,这个比例会很大,这样的情况属于正常,不必担心。 Model Fitting Information:是对是否所有自变量偏回归系数全为0进行似然比检验,结果P<0.001,说明至少有一个自变量的偏回归系数不为0。说明拟合包括上述几个变量的模型拟合优度好于仅仅包含常数项的模型。 Goodness-of-Fit:输出的是Pearson和Deviance两种拟合优度检验结果。这两个统计量的致命缺点是对于自变量取值水平组合的实际观察频数为0的比例十分敏感,如果这一比例过高,这两个统计量不一定仍旧服从卡方分布,因而基于卡方分布计算的P值也不可信。 Pseudo R-Square:输出的是三种伪决定系数。对于分类数据的统计分析,对此不必太在意,一般情况下伪决定系数都不会太高。 Parameter Estimates:输出了最重要的结果。由于生活满意度是三分类,因此会建立两个回归方程,常数项有两个。 需要注意的是,反应变量为有序多分类的Logistic回归的前提假设之一是各自变量对于反应变量的影响在两个回归方程中相同,所以,各自变量的偏回归系数只有一个。 三、模型适用条件检验 Test of Parallel Linesa:输出的是检验各自变量对于反应变量的影响在两个回归方程中是否相同的结果。其实质是拟合不限定下属相等的模型(General Model),将该模型的似然值和当前限定系数相等的模型(Null Hypothesis)加以比较,进行似然比检验。如果检验结果P>0.05,说明各回归方程互相平行,可以使用Ordinal Regression 过程进行分析,否则就要进行处理。 如果平行性假设不能被满足,如何处理呢?首先,有序回归模型对此适用条件有一定的难受性,当条件被轻微违反时(P值很接近0.05),参数的估计仍然是较为稳定的。如果平行性检验的P值非常小,导致该情形出现的原因主要是两个:连接函数选择不准确或者系数的确在随着分割点发生变化。 SPSS提供了5种连接函数,不同的函数有不同的适用范围: Logit:反应变量各取值水平发生概率相近的资料。此选项为默认选项。 Complementary:反应变量取值水平高的水平发生概率高的资料。 Negative log-log:用于反应变量取值水平低的水平发生概率高的资料。 Probit:用于潜在变量服从正态分布的资料。 Cauchit:用于潜在变量存在很多极端值的资料。 * *

你可能感兴趣的:(python,多分类有序logit模型)