(1)概述

数据录入三部曲:

1)定义各变量名称:即给每个变量指标起一个名字;

2)指定每个变量的各种属性:即对每个变量的一些统计特性做出指定;

3)录入数据:把每个变量的取值录入其中。

变量的存储类型

(1)概述_第1张图片
变量类型

(1)数值型

数值型数据是由0~9阿拉伯数字和其他特殊符号,如美元,逗号,圆点等组成。

(2)字符串

字符型数据默认显示宽度为8个字符位,区分大小写字母,并且不能进行数学运算

(3)日期型

用来表示日期或时间的。可选择不同的显示格式,如yy-mm-dd

可用的数据类型如下:

数值。 值为数字的变量。值以标准数值格式显示。数据编辑器接受以标准格式或科学记数法表示的数值。

逗号。 变量值显示为每三位用逗号分隔,并用句点作为小数分隔符的数值变量。数据编辑器为逗号变量接受带或不带逗号的数值,或以科学记数法表示的数值。值的小数指示符右侧不能包含逗号。

点。 变量值显示为每三位用句点分隔,并带有逗号作为小数分隔符的数值变量。数据编辑器为点变量接受带或不带点的数值,或以科学记数法表示的数值。值的小数指示符右侧不能包含句点。

科学记数法。 一个数值变量,它的值以嵌入的 E 以及带符号的 10 次幂指数形式显示。数据编辑器为此类变量接受带或不带指数的数值。指数前面可以加上带符号(可选)的 E 或 D,或只加上符号 -- 例如,123、1.23E2、1.23D2、1.23E+2 以及 1.23+2。

日期。 一种数值变量,其值以若干种日历-日期或时钟-时间格式中的一种显示。从列表中选择一种格式。输入日期时可以用斜杠、连字符、句号、逗号或空格作为分隔符。两位数年份值的世纪范围由您的“选项”设置确定(从“编辑”菜单中,选择选项然后单击数据选项卡)。

美元。 数值变量,显示时前面带美元符号 ($),每三位用逗号分隔,并用句点作为小数分隔符。可以输入带有或不带有前导美元符号的数据值。

自定义货币。 一种数值变量,其值以自定义货币格式中的一种显示,自定义货币格式是在“选项”对话框的“货币”选项卡中定义的。定义的自定义货币字符不能用于数据输入,但显示在数据编辑器中。

字符串。 字符串变量的值不是数值,因此不用在计算中。字符串值可以包含任何字符,可包含的最大字符数不超过定义的长度。字符串变量区分大小写字母。此类型又称为字母数值变量。

受限数值。 值限于非负整数的变量。在显示值时,填充先导 0 以达到最大变量宽度。可以以科学记数法输入值。

变量的测量尺度

(1)定类尺度

定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。

定类变量的特点是其值仅代表了事物的类别和属性,仅能测定类别差,不能比较各类之间的大小,没有顺序或等级,

如0代表城市,1代表农村

(2)定序变量

定序变量是对事物之间等级或书序差别的一种测度,可以比较优劣或排序,其测量值不代表绝对的数量大小,只能进行排序,不能进行数学运算。

如“学历”分为“硕士、本科、专科…”

(3)定距尺度

定距尺度是对事物类别或次序之间间距的测度。特点是不仅能将事物区分为不同类型并进行排序,还能准确支持类别之间的差距是多少。

如“温度”

(4)定比尺度

定比尺度是能够顾测算两个测度值之间的比值的一种计量尺度。

如“收入”“企业销售额”

变量名和变量值标签

(1)概述_第2张图片
变量名和变量值标签

如:1代表男,2代表女,3代表gay

缺失值

缺失属性是一个重要的且容易被忽视的变量属性,它用于定于变量缺失值。

SPSS的缺失值有两种:

1)系统缺失值

如数据漏填了,

对于数值型变量的数据,漏填了用圆点“.”表示,对于字符型的数据,漏填了默认就是空字符串。

2)用户自定义缺失值

如对于选项“不知道/拒绝回答”等用9或99表示

(1)概述_第3张图片
缺失值定义

第一个:没有缺失值

第二个:可以自定义三个数值为缺失值

第三个:可以定义一个范围内和一个具体的值为缺失值

注意事项:

1)除非您将其明显定义为缺失,否则所有字符串值包括“零”或空白值都被视为有效。

2)字符串变量的缺失值不得超过八个字节。(字符串变量的宽度定义没有限制,但定义的缺失值不得超过八个字节。)

3)若想将“零”或空白值定义为字符串变量的缺失,则在离散缺失值选项下的字段之一输入一个单空格。

角色

输入。变量将用作输入(例如,预测变量、自变量)。

目标。变量将用作输出或目标(例如,因变量)。

两者。 变量将同时用作输入和输出。

无。变量没有角色分配。

分区。变量将用于将数据划分为单独的训练、检验和验证样本。

拆分。暂不了解

默认情况下,SPSS将为所有变量分配输入角色

你可能感兴趣的:((1)概述)