如何利用SPSS实现多元线性回归中哑变量设置及分析

今天给大家介绍一下SPSS的使用。我最近在学习sas软件的使用,刚好学到了多元线性回归,所以再把SPSS拿出来做一下多元线性回归分析,顺便复习一下SPSS软件的使用,大家如果想了解更多数据分析软件、统计分析、meta分析的内容,可以关注纯学术的公众号:全哥的学习生涯,分享各类数据分析方法。

其实spss的使用非常简单,关键是要有一定的统计学基础,懂得针对不同的研究设计以及不同的研究资料应该采用何种统计学方法,对于软件给出的结果,要懂得如何解释。在有了这些基础之后,就可以按照操作步骤拿着鼠标点点点啦。

定义及应用条件:

多元线性回归分析是研究一个连续型变量和其他多个变量间线性关系的统计学分析方法。多元线性回归需要满足线性、独立、正态、等方差的条件。在满足条件之后就可以对资料进行回归分析了。

自变量处理:

生成新变量:有些自变量的变化对于因变量的影响很小,比如血压变化1mmhg,或者年龄变化1岁,对于我们机体的影响很小,所以需要对变量进行一下转化,比如可以把年龄分组,每5年为一个年龄组,生成一个新变量,把这个新变量纳入回归方程进行分析,这样对于回归分析的结果会更加容易解释。

设置哑变量:假如我们的自变量为分类变量,这个时候就需要设置哑变量。如果自变量是等级变量,而且因变量在自变量每个等级上的变化不相等,也需要设置哑变量。在自变量设置完毕后就可以进行多元线性回归分析啦。

实操展示:

这里是一个探讨因变量和九个自变量之间关系的例子。首先是如何生成一个新变量,假如要把年龄变量生成一个新变量,每10岁为一组,操作如下:①点击菜单栏的转换-重新编码为不同变量(图一),②将年龄变量(x2)选入方框,在名称里输入要生成的新变量名称,点击变化量,点击旧值和新值按钮(图二),③选中范围,在下面输入10-20,在新值内填1,点击添加,在范围内输入21-30,在新值内填2,点击添加,以此类推,点击继续(图三)。


图 1
图 2
图 3

④对于需要设置哑变量的变量,点击转换-创建虚变量(图四),⑤把要创建哑变量的变量选入,点击使用值标签,点击创建主效应虚变量,在根名称中输入生成的哑变量名称(如k),点击确定(图五)。因为我的x4变量有三个分类,所以就会自动生成三个变量:k1,k2,k3(图六)。


图 4
图 5
图 6

然后就可以进行线性回归分析了。大家如果想了解更多数据分析软件、统计分析、meta分析的内容,可以关注纯学术的公众号:全哥的学习生涯,分享各类数据分析方法。⑥点击分析,点击回归,点击线性(图七),⑦把y选入因变量,将哑变量之外的变量选入自变量,点击步进,点击下一个(图八),将哑变量(k2和k3)选入自变量,点击输入(哑变量有同进同出的原则,所以这里必须选择输入按钮,不能选步进或者其他按钮)(图九),⑧点击统计,勾选回归系数的置信区间(图十),⑨点击选项,可以设置进入的P值和除去的P值,(可以取默认值也可以自行设定为其他值,但是有一个原则,就是进入的α值要小于除去的α值)(图十一)。点击继续。


图 7
图 8
图 9
图 10
图 11

结果解读:

大家如果想了解更多数据分析软件、统计分析、meta分析的内容,可以关注纯学术的公众号:全哥的学习生涯,分享各类数据分析方法。结果如下:根据显著性是否小于0.05来判断自变量对因变量的影响有没有意义,根据未标准化的系数可以写出回归方程。如果要比较各个自变量对因变量的影响大小需要看标准化系数。

图 12

你可能感兴趣的:(如何利用SPSS实现多元线性回归中哑变量设置及分析)