三 数据文件的建立与数据的录入
学习要求:
1、认识数据的类型
1.1 常量与变量
1.2 定义一个变量
2、学会数据的输入
2.1 数据的输入方法
2.2 输入带有值标签的数据
3.1 数据的类型
3.1.1 常量与变量
1. SPSS 的常量
SPSS 中的常量就是一个数值、一个括在单(双)引号中的字符串或是按日期格式表示的日期和时间。常用的SPSS 中的常量有三种,即数值型、字符型和日期型。
(1)数值型常量
数值型常量就是程序在SPSS 语句中的数字。一般使用两种书写方式。一种是普通书写方式,如:23、34.8 等。另一种是科学计数法,多用于表示特别大或特别小的数字。如:1.23E18表示1.23×1018,2.35E-14 表示2.35×10-14等。
(2)字符串常量
字符串常量是用单引号或双引号括起来的一串字符。如果字符串中已经带有“’”,则该字符串常量必须使用双引号括起来。例如“BOY'S BOOK”。
2.SPSS 的变量
SPSS 中的变量有十个属性。如图3-1 所示。它们是:变量名(Name)、变量类型(Type)、变量长度(Width)、小数点的位数(Decimals)、变量名标签(Label)、变量值标签(Values)、缺失值(Missing)、列的显示宽度(Columns)、对齐方式(Align)、测量层次(Measure)。要定义一个变量时,至少要定义变量名和变量类型。其它属性可以定义也可以采用系统默认值。在数据窗口中单击Variable View,进入变量窗口,
即可对变量的类型、长度、小数点位数等进行定义。
图3-1 变量设置窗口
(1)变量的命名
在系统默认的情况下,SPSS 中的变量名由不多于8 个字符组成。变量名的首字符必须是字母或汉字,后面的则可以是字符或数字。但不能包含下列符号:“?”、“!”和“*”。
不能以下划线“-”和园点“.”作变量名的最后一个字符。变量名不能与SPSS 的保留字相同。SPSS 的保留字有ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、OT、WITH。如果使用了上述保留
字作变量名,系统会自动提示。系统不区分变量名的大写和小写,如abc 和ABC 被视为同一变量名。如果用汉字定义变量名最多只能使用四个汉字。在SPSS 中不能使用重复的变量名。也就是说,在一个数据文件中,不能有两个同名的变量。
(2)变量类型与默认长度
SPSS 中的变量有三种类型:数值型、字符型、日期型。在数据窗口中单击Variables View 按钮,进入变量编辑窗口,单击Type 列中某个变量所在的单元格,再单击此格中的按钮,进入Variables Type(变量类型设置)对话框,如图3-2 所示。
图3-2 变量类型设置对话框
1)数值型变量
字符串常量用单引号还是双引号
数值型变量共分五种类型,并由系统给定默认长度。变量的长度是变量值所占的字节数,即用字符作当量表示的宽度。小数点和其它分界符也计算在内。变量长度的系统默认值可以由主菜单的Edit 中的Option 中的Data 窗口重新设置。
①Numeric:标准数值型变量,默认长度为8,小数位数为2。
②Comma:带逗号的数值型变量,默认长度为8,小数位数为2。显示时整数部分自左向右每隔三位用逗号作分隔符,用圆点作小数点.
③Dot:圆点数值型变量,默认长度为8,小数位数为2。显示时整数部分自左向右每隔三位用圆点作分隔符。用逗号作小数点。
④Scientific Notation:科学计数法,默认长度为8,小数位数为2。对于数值很大或很小的变量可以使用科学计数法。输入时表示指数的字母可用E 也可用D。下面几种方式都可以被接受。如123 可以用下面几种方式输入。123、1.23E2、1.23D2、1.23E+2、1.23+2。
⑤Dollar:带美元符号的数值型变量,默认长度为8,小数位数2。其值在显示时有效数字前面带有“$”。输入时可以不输入“$”,显示时系统自动加上“$”和分隔符。
对于上述几种数值型变量,输入的小数位超过规定为数时系统自动四舍五入。使用者应根据数值的大小来指定数据的长度和小数位数。
⑥Custom Currency:自定义类型
2)日期型变量
Date:日期型变量。在SPSS 中的日期型变量即可以表示日期,也可以表示时间。在图3-2 所示的变量类型选择对话框中选择Date 后,系统会打开对话框,如图3-3 所示。
图3-3 日期型变量对话框
下面是关于日期型变量格式的几点说明:
“dd”是用两位数来表示日期。“ddd”是用三位数来表示从元月一日算起的日数。 “mm”是用数字表示的月份数。“mmm”是用英文月份单词的前三个字母表示的月份。 “yy” 是用两位数来表示的年份。“yyyy” 是用四位数来表示的年份。
“hh”表示小时。
“mm”表示分。
“ss”表示秒。
指定了日期型变量的格式后,输入时不一定按指定的格式输入。可以输入用“/”或“-”作分隔符的具体日期,回车后系统会自动转换成指定的格式。
3)字符型变量
String:长度可以任意设置,默认长度为8。长度低于8 的为短字符,大于8 的为长字符。字符型变量不能参与通常的数学运算,但可以用特殊的函数进行一些有限的转换。
可以在图3-2 所示的变量类型选择对话框中选择选项,来确定变量的类型。
(3)变量标签与变量值的标签
1)变量标签Variable labels
变量标签是对变量名附加的解释说明。由于变量名不能超过八个字符,有时不能清楚地表达变量的含义,这时要靠变量标签来对变量名加以解释。如果变量名有标签,系统在输出时以标签代替变量名输出。
2)变量值标签Value labels
大多数变量值都是以符号或数字来表示的。但对于定类变量和定序变量,用数字或符号不能够很明确地表现出变量值的意义时,可以用变量值标签来说明它们所代表的实际意义。 (4)变量的格式
变量的格式所包含的内容有:
1)Columns 是变量的显示宽度,指在数据窗口中该变量所占的字符列数,它不同与变量值的宽度。变量宽度要综合考虑变量名的宽度和变量值的宽度。变量宽度≥变量名的宽度,变量宽度≥变量值的宽度。
2) Align 是变量值在单元各中的对齐方式:有左对齐(Left)、右对齐(Right)、中间对齐 (Center)。系统默认的是右对齐。
(5)缺失值Missing
缺失值Missing:对于没有测量到的和测量、记录、录入错的数值,在SPSS 中可以处理成缺失值。对于字符型变量,系统默认的缺失值为空格。对数值型变量,系统默认的缺失值为零。可以自己定义缺失值标记。
(6)变量的层次
变量的层次有三种,Scale 是数值变量,即定距或定比变量。Ordinal 是定序变量,即定序变量。Nominal 是定类变量,即定类变量。当输入的是数字时,系统默认的是Scale,当输入的是字符串时,系统默认的是Nominal。
3.1.2 定义一个变量(准备好你的问卷,现在开始正式使用SPSS)
输入数据以前首先要定义变量。定义变量首先要定义变量名,变量类型,变量长度,变量标签,变量格式等。定义变量的步骤如下:
1.进入SPSS,新建一个数据文件。通过单击Variable View 按钮进入变量编辑窗口。 2.定义变量名(Name)。将光标移至Name 列对应的第一行,在光标格内输入变量名。系统默认的变量名的长度是8 个字符,如输入汉字是4 个汉字,超过的部分会被自动去掉。系统默认的变量名为Var00001、Var00002、Var00003 等等以此类推。如果不定义变量名,在数据编辑窗口(Data view)中直接输入数据,系统会自动生成上述变量名。如要自定义变量名,可删去上述变量名,另行输入。
3.定义变量类型(Type)。系统默认的变量类型是数值型变量(Numeric)。如要确定其它类型的变量可自己设定。方法是:将光标移至Type 列下面的相应的单元格上,用鼠标单击
右侧的 会出现如图3-2 所示的对话框。在对话框中选择需要的变量类型,然后单击“OK”
按钮予以确认。
4.定义变量宽度(Width)和小数点位数(Decimals)。在Width 列下面显示的是系统
默认的变量值的宽度。在Decimals 列的下面显示的是系统默认的小数点数。如要自己定义
变量宽度和小数点位数,可将光标移至相应位置后,在单元格的右侧出现增加和减少键。
向上的箭头是增加,向下的箭头是减少。通过单击增加和减少键来改变变量宽度和小数点位数。也可以直接输入小数点位数。
5.定义变量标签(Label)和变量值标签(Values)。
(1)定义变量标签。因为变量名不宜使用过多的字符,当变量名包含的内容比较复杂,需要对变量名进行进一步的解释说明时可以使用变量名标签。如“休闲调查”中的“娱乐1”、“娱乐2”、“娱乐3”、“满意度1”、“满意度2” “满意度3”、“满意度4”等,这些变量从变量名上看不出具体含义。对它们的说明可以写在变量标签中。不论是英文标签还是汉字标签,均可以在“Label”列下的相应格内直接输入。对上述几个变量名标签的输入结果如图3-4 所示。对与变量名的标签可以进行修改。修改变量名标签很容易,只要在Label 下的矩形框中删除原标签,重新输入即可。
图3-4 变量名标签
(2)定义变量值标签。对于定类和定序变量,变量的取值是可列有限多个,取值是以数字或字符形式出现的,每个数字或字符所代表的实际意义可以用值标签予以说明。方法是: 1)打开定义变量值标签对话框。通过单击要说明的变量名与Values 列相交的单元格,将光标
移至该格。然后单击按钮,出现定义值标签对话框,如图3-5 所示。
图3-5 定义值标签对话框
2)输入变量值标签。在上面Value 后面的窗口中输入变量值,在下面的Value 后面的窗口中输入变量值
的标签,此时Add 按钮被激活。然后单击Add 按钮,输入的变量值和变量值的标签将成对的显示在下面的窗口中。如图3-6 所示。以此类推输入完全部的标签后单击“OK”按钮。输入的标签的部分内容将显示在Values 列下相应的格内。
图3-6 定义值标签对话框
3)修改变量值的标签:修改值标签时,须先进入定义值标签对话框。在最下面的窗口中选择要修改的
值和标签,同时激活Remove 按钮。可以单击“Remove”按钮,即删除原来的值标签。可另行输入新的值标签,也可以在上面的两个窗口中改变变量值和标签,同时激活Change 按钮。单击Change 按钮,完成修改。
6.定义缺失值(Missing):
对于一个变量来说,有些取值是合理的,有些取值是不合理的。这些不合理的取值可能是由于问卷填写错误或数据输入错误造成的。这些不合理的取值一旦进入分析中,就会造成统计结果的偏差。这些不合理的取值可以通过定义缺失值的方法来消除。定义缺失值的方法如下:(1)打开定义缺失值对话框。在Variable View 窗口中,将光标移至Missing 列下与要说明
的变量名相对应的单元格上。然后单击按钮,出现定义缺失值对话框,如图3-7 所示。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。