第1章 SPSS简介
SPSS简介。SPSS是Statisticl Package for Social Science的英文缩写,即:社会科学统计分析软件包,它是当今世界上公认和流行的综合统计分析软件包。SPSS的应用面广阔,它在经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各领域均有广泛的应用。SPSS提供了一种很友好的用户界面,需什么统计功能,直接单击菜单即可。通过简单的菜单式操作,就可以方便地规范和融合搜集到的原始数据,并能实施从简单的描述性统计分析到复杂的时序分析等多种方法,对数据进行建模,返回有意义的分析结果,比如客户特征的分类、发展趋势和预测等。把这些结果对应于实际,可以帮助使用者在发掘潜在客户、制定长远规划等工作上作出更加准确的判断。
SPSS的基本统计分析功能有:频数分析、描述统计量分析、相关分析、回归分析、因子分析、聚类分析、判别分析、各种统计图形等等。
数据文件的操作与建立
一、SPSS数据文件的特点
SPSS数据文件是一种有结构的数据文件,它包括文件结构和数据两部分。
SPSS数据文件中的一列数据称为一个变量,每个变量都有名称,SPSS数据文件的结构是对每个变量及相关属性的描述。
SPSS数据文件的建立步骤:
第一步:定义SPSS数据文件的结构;
第二步:输入数据。
二、数据文件的结构
SPSS数据文件的结构是对每列变量及其相关属性的描述,它包括:变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量度量方法等信息。
(一)如何定义一个变量
单击数据编辑窗口下面的Variable View选项,数据窗口便处于定义变量状态,如图1-1所示:
图1-1 Variable View界面
1、变量名(Name)
变量名是变量存取的唯一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。SPSS默认的变量名以VAR三个字母开头,后面跟补足5位的数字。如VAR00001、VAR00015等。
变量名的取名规则是:
(1)从SPSS12.0版本开始,变量名最多可写64个字符长度;
(2)首字符不能是数字,必须是24个英文字母或以下符号之一:@、#或$,其后可以是除了“?”、“!”、“*”之外的字母、数字、小数点或其他任意非标点符号的字符。下划线、圆点不能为变量名的最后一个字符。
★以“#”为首写的变量名特指草稿型变量。此种类型的变量只能在命令窗口使用,在其他地方不可用。
★以“$” 为首写的变量名特指SPSS的系统变量。系统变量不可修改,而且在程序中不可用,用户定义的变量不能以“$” 为首写。
(3)变量名不能与SPSS内部特有的具有特定含义的保留字符相同,如ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH,等;
(4)系统不区分变量名中的大小写字母,允许汉字作为变量名,汉字总数不能超过4个;
(5)变量名中不能包含空格。
2、变量的类型(Type)和宽度(Width)
SPSS中有三种基本的变量类型,即:数值型、字符型和日期型。每种变量类型的数据在数据编辑窗口中都有其默认的宽度和样式。
(1) 数值型
数值型是SPSS常用的变量类型。数值型的数据由0-9的阿拉伯数字和其他特殊符号,如美元符号、逗号、圆点组成的。如工资、年龄、成绩等变量都可定义为数值型数据。数值型有以下六种不同的表示方法:
A、标准数值型(Numeric)
标准数值型是系统默认的数据类型。标准数值型默认的最大显示宽度是8位(含小数点及负号),小数是2variable怎么记位。
例如:12345678、-1234567、12345.67、-1234.56
B、逗号数值型(Comma)
逗号数值型其整数部分从个位开始每隔3位以一个逗号分隔,用圆点作小数点。它的默认最大显示宽度是8位(含逗号所占的位数),小数是2位。
C、圆点数值型(Dot)
圆点数值型数据其整数部分从个位开始每3位以一个圆点分隔,用逗号作小数点。如:1.234,56
D、科学记数法型(Scientific Notation)
科学记数法也是数值型数据表示方式的一种。如:270用科学记数法表示为2.7E+02,其中的E表示以10为底,+02表示10的2次方;0.00036用科学记数法记为3.6E-04, E表示以10为底,-04表示负的4次方。
科学记数法默认的显示总宽度为8。
E、美元数值型(Dollar)
美元数值型主要用来表示货币数据,在数据前附加美元符号$。默认宽度是8位,小数是2位。
F、用户自定义型(Custom Currency)
用户自定义型是用户利用菜单的Options功能来定义的。
(2)字符型(String)
由一个字符串组成。如职工号码、姓名、地点等变量都可定义为字符型数据。字符型数据的默认显示宽度为8个字符位,它不能进行算术运算,并区分大小写字母。字符串中的大写字母与小写字母,是截然不同的两个字符,这一点在使用时要特别注意。
(3)日期型(Data)
日期型数据用来表示日期或者时间。如生日、成立日期等可定义为日期型数据。日期型数据的显示格式很多,例如:dd-mmm-yy(例子15-OCT-99)、dd-mmm-yyyy(例子15-OCT-1999)、mm/dd/yy(例子10/15/90)、hh:mm:ss.s(例子01:02:34.75)等等。
下面给出关于日期型变量格式的几点说明:
★“dd”是用两位数来表示日期数;
★“ddd”是用三位数来表示从元月一日算起的日数;
★“mm”是用数字表示的月份数;
★“mmm”是用英文月份单词的前3个字母表示的月份;
★“yy” 是用两位数来表示的年份;
★“yyyy” 是用四位数来表示的年份;
★“hh”表示小时;“mm”表示分钟;“ss”表示秒;
★“m”用于年与日(字母y与d)之间时表示月份;用于时与秒(字母h与s)之间时表示分钟。
指定了日期型变量的格式后,输入时不一定按指定的格式输入,可以用“/”或“_”作为具体日期
的分隔符,回车后系统回自动转换成指定的格式。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论