SPSS问卷数据处理步骤

**

SPSS问卷数据处理步骤

**

一. 准备——界面与数据准备工作
1)先处理显示界面问题,改成中文输出,优化操作过程:编辑→选项→
2)数据字典:定义变量属性(几个代表性的)——复制数据属性:数据→定义变量属性(设好以后)→数据→复制数据属性(把几个代表性的数据属性复制给其他)
3)数据验证:
①定义验证规则
数据→验证→定义规则(可以改名称然后之后加入到数据字典里)
性别只有1、2两种编码(→单变量规则【有效值:在列表中】)
年龄规定取值范围(→单变量规则【有效值:在范围内】)
关键题目取值逻辑:哪几个题目不应当同时选择9,否则作为废卷处理(→交叉变量规则→文本框中输入逻辑表达式【A1=9&B6=9&C5=9】
②进行数据验证:数据→验证→验证数据
4)标识异常个案:数据→标识异常个案(可设定异常的个数)
NOTE:
① 原理:建模(两步聚类分析,按照相似程度自动分为对等组)——评分(每个案例与其所属类别的异常度是多少,并计算相应的异常索引,接着降序排列,索引值最高的一部分被标识为异常个案)——列出原因(异常个案的偏差度指标,该指标最大的变量、数值以及对应的标准值会被作为原因列出)
② 不要迷信,这只是一个强有力的辅助工具而已,并不是绝对正确和完全符合需求的
二. 数据录入
1)数据直接从SPSS录入。(暂时不采用)
2)EXCEL数据文件汇入(文件→打开→数据)
NOTES:
1、类型-数值,标签-题目
2、“从第一行读取变量名”&范围
3.EXCEL录入数据:第一行变量名称,每行一份问卷,用1,2,3,4,5等代替答案,最后在SPSS汇入后把标签以及各种属性改了。(数据字典)
三. 计算变量
1、变量的加总和平均,把三个问卷的各个维度以及总的均值(使用MEAN函数)计算出来
2、反向题编码(转换→重新编码)
NOTES:1、“如果”更改旧值与新值 2、在输出数据部分取新变量名称按更改
四. 缺失值的侦测与插补
变量缺失值:分析→描述统计→频率表(描述统计部分)
样本缺失值:转换→计算变量→函数中点选NMISS(选变量取新名字)
插补:转换→替换缺失值(不同缺失值插补法效果不同)
五. 选择与分割观察值
1、数据→选择个案
2、数据→拆分文件
NOTES:
③ 拆分文件后各种分析将会拆成几组做(“比较组”与“分组方式”),不拆文件后记得要回来选择“分析所有个案”。
④ 之后描述性统计分析只用做一次就好了(人口统计学变量部分)。
六. 描述性统计分析
对于连续变量:
分析→描述统计→频率→将类别变量选入对话框→统计量(选中峰度和偏度)
NOTE:记得勾选“将标准化值另存为变量”
对于类别变量:
频率:(对性别、年龄、不同生源地等)或者绘制饼图
交叉表:分析→描述统计→交叉表格(变量选入)→统计量
⑤ 检查两个以上类别变量交叉所占比例
⑥ 检查两个类别之间有无关系(独立性卡方检验、Phi and Cramer s V)
NOTE:卡方检验只告诉我们有没有关系,但是P&C告诉我们关系有多大(0-1)
⑦ 同质性检定(检查不同变量所占比例是否相同)
七. 推论统计
1、差异性描述
1)独立样本T检验
分析→比较均值→独立样本T检验
NOTE:
检验变量框:三个变量总均值及其各维度(一次只做一个变量)
分组变量:性别、是否独生子女
定义组:性别和生源地都是只有两个编码:1和2,组1:1,组2:2
2)单因素方差分析
分析→比较均值→单因素方差分析
因变量:三个总变量均值及其各维度(一次只做一个变量)
因子:父母婚姻状况、不同生源地(一次只能做一个)
选项→方差同质性检验和均值图
八. 相关分析
分析→相关→(先做三个总变量之间的相关4,再做维度之间的相关,一共3*2【父母教养方式】+4【同一性】+2【生命意义感】=12)
结果出来是相关系数矩阵。
九. 回归分析
1、之前已经检验了正态分布(描述统计时)以及方差齐性检验(T/F时)
2、对数据进行标准化处理:在描述统计部分就已经完成
3、预分析用散点图矩阵先查看趋势:之前相关分析已经做了,用的就是标准化的值这一步就省略了。
4、回归分析,分析→回归→线性回归(→统计→选中共线性诊断)做三次
R方也就是拟合度(百分之六十以上),自变量能解释多少的因变量
系数:看显著性,能不能显著预测它,影响系数看正负
多元线性回归(1个方程)除了看系数和R放还要看ANOVA。
共线性诊断:特征根(约为0)和条件指数(>10)可能存在共线性问题→看相关系数矩阵,数值接近1说明可能存在多重共线性。
十. 路径分析[待定]
把维度当作显变量,三个自变量看作潜变量,画图。测量模型是他们大佬每个量表修订分析就做过的因子分析,但是这里并没有用到,否则就变成二阶模型了,那个过于复杂。
0 先绘制潜在和观察变量
1 放资料档
2 抓资料放进图里面
3 存档
4 算盘计算(默认只有非标准化)
5 标准化(在资料旁边有分析属性→OUTPUT→勾选标准化和SMC多元相关平方R方)
非标准化主要看:1、估计值有没有违反估计?2、系数估计有没有显著?
NOTE:
1、⚪上是残差值(必须是正的),观察变量□上是自己的变异数,回归估计主要看显著值(viewtext→output,主要看Estimates and Model Fit[模型配适度摘要:CMIN卡方差异值越小越好、DF越大越好表示模型越精简、P最好不显著与CMIN/DF理想值3-1之间][配适度指标:IFI、TLI、CFI,理想值>0.9甚至0.95],C.R=critical residual临界残差也就是等于spss里的P值,只要>1.96就是显著,相当于p<0.05) C.R的计算方法是Estimates 除以标准误S.E
2、显著性与标准化的值无关,非标准化看显著性,标准化看重要性。
3、残差值是正的,看Variances p显著,没有出现不可接受的值。
• 标准化系数 (-1~1之间)
– 因素负荷量 (测量权重)值为正数并且理想上>0.7, 0.6可接受
– SMC (R方)多元相关平方
• 测量变量的SMC>0.5
• 潜在变量的SMC= 0.19 (small), 0.33 (medium), 0.67(large) – 误差 (1-SMC)
– 变异数值为1
– 回归系数值愈大表示自变量影响力愈大
十一. 在SPSS如何绘制表格?(在此步骤之前已经定义了变量属性)
分析→表→设定表格(表格拖动类似于EXCEL数据透视表的旧对话框)→单击画布上的变量→摘要统计量→
一般来讲,单击或者双击表格内容就可以对其进行元素选择或者编辑
选中相应表格后右击,编辑内容→在阅读器中(嵌套)或者在单个窗口中(新)
工具栏是否出现:视图→工具栏
列宽的更改:视图→网络线
格式→表格外观(另存为可以存储自定义格式)
(改完格式后用)预设模板:系统→编辑→选项→枢轴表→(Academic[三线表模板] )

你可能感兴趣的:(数据处理)