第1章 SPSS简介
SPSS简介。SPSS是Statisticl Package for Social Science的英文缩写,即:社会科学统计分析软件包,它是当今世界上公认和流行的综合统计分析软件包。SPSS的应用面广阔,它在经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各领域均有广泛的应用。SPSS提供了一种很友好的用户界面,需什么统计功能,直接单击菜单即可。通过简单的菜单式操作,就可以方便地规范和融合搜集到的原始数据,并能实施从简单的描述性统计分析到复杂的时序分析等多种方法,对数据进行建模,返回有意义的分析结果,比如客户特征的分类、发展趋势和预测等。把这些结果对应于实际,可以帮助使用者在发掘潜在客户、制定长远规划等工作上作出更加准确的判断。
SPSS的基本统计分析功能有:频数分析、描述统计量分析、相关分析、回归分析、因子分析、聚类分析、判别分析、各种统计图形等等。
数据文件的操作与建立
一、SPSS数据文件的特点
SPSS数据文件是一种有结构的数据文件,它包括文件结构和数据两部分。
SPSS数据文件中的一列数据称为一个变量,每个变量都有名称,SPSS数据文件的结构是对每个变量及相
关属性的描述。
SPSS数据文件的建立步骤:
第一步:定义SPSS数据文件的结构;
第二步:输入数据。
二、数据文件的结构
SPSS数据文件的结构是对每列变量及其相关属性的描述,它包括:变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量度量方法等信息。
(一)如何定义一个变量
单击数据编辑窗口下面的V ariable View选项,数据窗口便处于定义变量状态,如图1-1所示:
图1-1 V ariable View界面
1、变量名(Name)
变量名是变量存取的唯一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。SPSS默认的变量名以V AR三个字母开头,后面跟补足5位的数字。如V AR00001、VAR00015等。
变量名的取名规则是:
(1)从SPSS12.0版本开始,变量名最多可写64个字符长度;
(2)首字符不能是数字,必须是24个英文字母或以下符号之一:@、#或$,其后可以是除了“?”、“!”、“*”之外的字母、数字、小数点或其他任意非标点符号的字符。下划线、圆点不能为变量名的最后一个字符。
★以“#”为首写的变量名特指草稿型变量。此种类型的变量只能在命令窗口使用,在其他地方不可用。
★以“$”为首写的变量名特指SPSS的系统变量。系统变量不可修改,而且在程序中不可用,用户定义的变量不能以“$”为首写。
(3)变量名不能与SPSS内部特有的具有特定含义的保留字符相同,如ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH,等;
(4)系统不区分变量名中的大小写字母,允许汉字作为变量名,汉字总数不能超过4个;
(5)变量名中不能包含空格。
2、变量的类型(Type)和宽度(Width)
SPSS中有三种基本的变量类型,即:数值型、字符型和日期型。每种变量类型的数据在数据编辑窗口中都有其默认的宽度和样式。
(1)数值型
数值型是SPSS常用的变量类型。数值型的数据由0-9的阿拉伯数字和其他特殊符号,如美元符号、逗号、圆点组成的。如工资、年龄、成绩等变量都可定义为数值型数据。数值型有以下六种不同的表示方法:
A、标准数值型(Numeric)
标准数值型是系统默认的数据类型。标准数值型默认的最大显示宽度是8位(含小数点及负号),小数是2位。
例如:12345678、-1234567、12345.67、-1234.56
B、逗号数值型(Comma)
逗号数值型其整数部分从个位开始每隔3位以一个逗号分隔,用圆点作小数点。它的默认最大显示宽度是8位(含逗号所占的位数),小数是2位。variable怎么记
C、圆点数值型(Dot)
圆点数值型数据其整数部分从个位开始每3位以一个圆点分隔,用逗号作小数点。如:1.234,56
D、科学记数法型(Scientific Notation)
科学记数法也是数值型数据表示方式的一种。如:270用科学记数法表示为2.7E+02,其中的E表示以10为底,+02表示10的2次方;0.00036用科学记数法记为3.6E-04, E表示以10为底,-04表示负的4次方。
科学记数法默认的显示总宽度为8。
E、美元数值型(Dollar)
美元数值型主要用来表示货币数据,在数据前附加美元符号$。默认宽度是8位,小数是2位。
F、用户自定义型(Custom Currency)
用户自定义型是用户利用菜单的Options功能来定义的。
(2)字符型(String)
由一个字符串组成。如职工号码、姓名、地点等变量都可定义为字符型数据。字符型数据的默认显示宽度为8个字符位,它不能进行算术运算,并区分大小写字母。字符串中的大写字母与小写字母,是截然不同的两个字符,这一点在使用时要特别注意。
(3)日期型(Data)
日期型数据用来表示日期或者时间。如生日、成立日期等可定义为日期型数据。日期型数据的显示格式很多,例如:dd-mmm-yy(例子15-OCT-99)、dd-mmm-yyyy(例子15-OCT-1999)、mm/dd/yy(例子10/15/90)、hh:mm:ss.s (例子01:02:34.75)等等。
下面给出关于日期型变量格式的几点说明:
★“dd”是用两位数来表示日期数;
★“ddd”是用三位数来表示从元月一日算起的日数;
★“mm”是用数字表示的月份数;
★“mmm”是用英文月份单词的前3个字母表示的月份;
★“yy”是用两位数来表示的年份;
★“yyyy”是用四位数来表示的年份;
★“hh”表示小时;“mm”表示分钟;“ss”表示秒;
★“m”用于年与日(字母y与d)之间时表示月份;用于时与秒(字母h 与s)之间时表示分钟。
指定了日期型变量的格式后,输入时不一定按指定的格式输入,可以用“/”或“_”作为具体日期的分隔符,回车后系统回自动转换成指定的格式。
SPSS以菜单的方式将所有的日期显示格式列出来供用户选择。
3、定义变量名标签(V ariable Label)
变量标签是对变量名的进一步说明,当变量名较短时,自身字符不足以表明其具体含义,而当变量比较多时更需要对变量名的含义加以详细解释。在定义变量窗口中Label下的单元格中输入标签。如name栏的“g”代表性别,则Label 栏输入“性别”。在统计分析的输出结果中,可以在与变量名相对应的位置显示该变量的标签,或者直接以变量标签替代变量名显示,这有助于理解和分析输出结果。如图1-2所示:
变量名标签
变量名标签定义对话框
4、定义变量值标签(V alue Label)
变量值标签是对变量取值所作的进一步说明。分类变量经常需要定义其取值的标签。例如对于性别数据,假定用1代表男,用0表示女。变量值标签是一个可选择的属性,可以定义,也可以不定义,但像性别之类的变量最好给出变量值标签。如图1-3所示:
变量值标签
图1-3 变量值标签定义对话框
5、变量列格式(Column Formar)
数据列格式包括变量的列宽度(Columns )和数据的对齐方式(Align)。
(1)宽度(Columns )显示数据的长度。例如:可以单击Columns下的单元格,选择列宽数值。在定义变量列格式的宽度时,要综合考虑变量类型所定义的长度和变量名所占的宽度,选择较大的一个作为该变量的列格式宽度,这样才能保证变量名和变量值都可以正常显示。
(2)对齐方式(Text Alignment):分左对齐、右对齐、中间对齐。例如:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论