Spss教程——[PDF澜雨制作]
第一讲SPSS概览——基本操作与数据管理
(数据管理界面用法详解)
1.数据文件(.sav)的建立与编辑
1.1新建数据文件(spss data editor)
SPSS10.0采用窗口标签把数据窗设置成两种形式:一种是数据窗口,用于输入与编辑数据,一种是变量窗口,用于编辑与修改变量。在左下角以Data view和Variable view的字样出现。
数据窗口由窗口标题栏、菜单栏、工具栏、当前数据栏、数据输入栏、数据显示区、标签控制按钮、窗口标签、显示区纵向与水平滚动条与状态栏组成。变量窗口主要由变量属性名行、变量属性数据区组成。
要建立一个数据文件,一般先在变量窗口定义变量及其属性,然后在数据窗口录入数据,最后对数据文件保存命名(扩展名为*.sav)。也可以将数据保存为其他格式的数据文件,如数据库文件、Excel文件等。例如:例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同?
患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
该资料是定量资料,设计为成组设计,因此需要建立两个变量,一个变量代表血磷值,命名为X,另一个变量代表观察对象(被试)是健康人还是克山病人,命名为group。(在变量窗口中完成),然后在数据窗口中输入数据。保存为data1.sav。
1.2从外部调用其他格式的数据文件
1.2.1 直接打开
SPSS可以直接打开许多格式的数据文件,其中就包括EXCEL各种版本的数据文件。具体操作选择菜单File==>Open==>Data或直接单击快捷工具栏上的“”按钮,系统就会弹出Open File对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,选择所需的文件类型,然后选中需要打开的文件,SPSS就会按你的要求打开你要使用的数据文件,并自动转换为数据SPSS格式。你可以另存为SAV格式的数据文件。
1.2.2 使用数据库查询打开
SPSS可以直接打开许多类型的数据文件,但这并不是说它可以打开所有类型的数据文件,比如FoxPro 3.0以上版本的*.dbf文件就不能直接打开。为此,SPSS还提供了另一个适用范围更广、但使用上较为专业的数据接口--数据库查询。选择菜单File==>Open Database==>New Query,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS
1.2.3使用文本导入向导读入文本文件
选择菜单File==>Read T ext Data,系统就会弹出Open File对话框。例如请读入数据。
2.为分析做好准备——数据文件的管理
在SPSS中,数据文件的编辑、整理等功能都被集中在了Data和Transform两个菜单项中。Data菜单各项命令及功能:
2.1定义与编辑变量、观测量的命令
Define Dates 定义与编辑一个日期或日期时间变量
Insert Variable 插入一个变量
Insert Cases 插入一个观测值
Goto Cases 定位到指定的观测值
2.2编辑文件的命令
Sort Cases 按某变量值对观测值进行排序,把数据data1.sav按变量X进行排序。
Transpose 对数据文件进行转置
Merge Files 合并数据文件(加入变量或加入观测值),合并数据文件是指将外部数据中的观测值或者变量合并到当前数据文件中去,它包括两种合并方式。(1)从外部数据文件增加观测值(Add Cases)到当前数据文件中。这种方法称为纵向合并或追加观测值。相互合并的数据文件应该有相同的变量不同的观测值。例如将bigfive2的数据合并到bigfive1中来。(2)从外部文件增加变量(Add Variables)到当前数据文件中,称为横向合并。相互合并的数据文件中包含不同的变量。例如将cha-2的变量合并到bigfive1中。Aggregate对数据文件进行分类或不分类的汇总,对数据进行汇总就是按指定的分类变量值对所有的观测值进行分组,对每组变量中所包含的各观测值求描述统计量,并生成新数据文件。在新数据文件中对应分类变量的每个值产生一个观测值。例如对bigfive1的数据按sex、sex&age汇总。
2.3进行分析前处理的命令
Split Files拆分数据文件
Select Cases选择观测值
Weight Cases对观测值进行加权处理
2.4Transform菜单的操作:
2.4.1数据转换:Transform/Count。每个受调查的学生在高中选修了多少门数学课程,将统计结果放在新变量中,假如高中共开设了代数1、代数2、几何、三角课程、积分课程共5门课程,其中1表示选课,0表示未选。
2.4.2对变量值重编码:transform/recode
2.4.3用已有变量计算产生新变量:transform/compute。compute target variable=expression(可以利用函数表达式,也可以自己用代数运算式)
作业
对stress_1进行如下操作:
(1)定义新变量求sum(为b1-b59之和),并进行排序。
(2)对b60进行重编码。
(3)按xb、nj对sum进行分类汇总。
第二讲SPSS绘图功能、描述统计分析及结果浏览窗口用法详解
1.SPSS统计绘图功能详解
SPSS具有很强的绘图功能,统计图形既可以在分析过程中产生,也可以直接在Graphs图形菜单中产生。数据类型与图形:在图形中经常出现scale 和category单词,scale翻译为“尺度、量尺”,category翻译为“分类、类别”,因此scale data就是“尺度数据、测量数据”(实际上经常当作因变量即Y轴的值),scale axis就是尺度轴或测量轴(通常是Y轴),category data是分类数据(通常是对数据进行分类的称名变量),categorical axis是分类轴(通常即为横轴)。scale data通常包括记数数据(非连续变量)和测量数据(常是连续变量),category data包括称名变量和顺序变量。
数据文件结构与图形:数据文件结构往往决定着图形的类型,同样来源于同一个资料,可以做成不同的数据文件结构。例如,要生成1985年~1994年某个城市十二个月份平均气温的图形,在这里数据结构应该包括年份、月份、表示各个城市温度的变量,见data19-01数据。为什么要这样的数据结构?我们分
析一下图形要求:1985年~1994年某个城市十二个月份平均气温的图形,在这里,测量数据应该是各个城市的温度,所以每个城市都是一个变量,平均温度从哪里来?从分类变量月份(12个月)来,月份又从分类变量年份而来,所以就形成了data19-01的数据结构。这样,每个城市温度变量下应该有120个数据。
但是如果要生成1985-1994年某个月份各城市平均气温的图形,数据格式应该是年份分类变量、城市分类变量、每个月的温度均有一个变量。见data19-02。
所以在生图形之前,我们要明确图形所需的数据结构,从而建立或调整数据文件。
SPSS统计图形类型有:Bar直条图、Line线形图、Area面积图、Pie饼图、High-Low 高低图、Pareto帕累托图、Control质量控制图、Boxplots箱式图、ErrorBar误差线图、Scatter散点图、Histogram直方图、Normal P-P正态P-P图、Normal Q-Q正态Q-Q图、Sequence序列图、Autocorrelations自回归曲线图、Cross-Correlations交互相关图、Spectral频谱图。在我们的课程中,要求大家掌握的是带有下划线的几种基本图形。在这里主要介绍Bar直条图。
1.1直条图详解
数据文件见data19-04,1988年至1992年世界各种饮料产量数据文件。变量如下:year(年代)、cont
(洲名)、country(国名)、tea(茶叶产量)、coffee(咖啡产量)、wine(葡萄酒产量)、spirits(烈酒产量)。Data19-05,1988和1991两年西欧各种饮料产量数据文件。Data19-06,1992年西欧各国各种饮料产量数据文件。
条形图类型:Graph/Bar,打开了Bar Charts主对话框。
有三种图式:
simple简单条形图(单式条图)。
clustered分组条图(复式条形图),它是由每两条或两个以上条组成一组的条形图,组与组之间有间隙,每组内条之间无间隙。
Stacked分段条形图,它是以条形的全长代表某个变量的整体,条形内部的各分段长短代表各组成部分在整体中所占比例的图形,每一段之间没有间隙并用不同线条或颜表示,各条之间有间隙。
有三种数据的表达类型(统计量的描述模式)Data in chart are:
Summaries for groups of cases观测量分类描述模式,条图反映了同一变量若干条记录的分组汇总情况。同一变量在分类变量中每一种类观测量生成一个条,有多少种分类,就有多少个条。横轴是分类变
量。Summaries of separate variables各个变量描述模式,条图反映了不同变量的汇总。它对应每个变量生成一个条图,即一个条图代表一个变量。
Values of individual cases观测值(即各个观测个体)描述模式,条图反映了个体观测值的情况。它对应分类轴变量中的每一个观测值生成一个条图。
这样根据条形图图式和统计量描述模式的选择组合,就可形成9种不同的条形图。
1.1.1观测量分类模式简单条形图
这是最简单的条形图,条形图表达的统计量可以分成两类:一类是对分类(称名)变量的描述,这类绘图
只需在Category Axis中选入某分类变量,在Bars Represent中选择前四类统计量函数中的一个即可。二是反映的是某个(单个)变量在分类变量各个类别上的汇总,这种描述方法仍以Category Axis框中的变量为分类变量,再确定对另一个变量的统计量,即在Variable框中必须输入一个统计函数的自变量,在Bars Represent中选中最后一项other summary function,change summary是选择变量的统计函数的,这一类图形表达的统计量实际上可以通过Aggregate对数据文件进行分类汇总得到。
例1:利用Data19-04生成各洲国家数目的比较条形图。操作过程:Bar/simple/Summaries for groups of
cases/N of cases/在Category Axis中选中continent变量即可。
例2:利用Data19-04生成88-92年各洲茶叶平均产量图。操作过程:Bar/simple/Summaries for groups of cases/other summary function/在Variable中选入tea变量/在Category Axis中选中continent变量/即可。当然也可以修改函数。可以在Titles中给图形写上标题。
1.1.2变量模式简单条形图
反映的是多个变量各自的汇总数据对比图。Bar Represent表达统计量框中至少要有两个或两个以上的变量。所选定的变量可以是不同的也可以是相同的变量。如果想要改变某个变量的统计函数,可以通过change summary进行选择。
例1:生成88-92年世界各地生产各类酒精饮料的总产量对比图。资料中酒精饮料为Bear、Spirits、Wine。故在Bar Represent框中要选入这三个变量,当然在函数中要选择Sum。
例2:生成88-92年茶叶的平均产量和最高产量对比图。
1.1.3观测值模式简单条形图
反映的是数据文件中个体观测值的汇总资料。在这个数据文件中观测值或个体是各个国家。如生成1992
年西欧各国咖啡生产量条形图。由两个分类变量决定国家这个分类变量下各个国家咖啡的产量图,数据结构需要改变,见Data19-06,Simple/Values of individual cases/在Bar Represent中选择coffee92/在category label中选择Variable并选择country92变量即可。也可以用Data19-04的数据,但需要选择观测值,即在Data菜单下select cases中用条件语句选择观测值if year=1992&cont=1即可。操作结果与用Data19-06的操作结果一致。
1.1.4观测量分类模式分组条形图
Clustered/Summaries for groups of cases,反映单个变量在两类分类变量上的汇总情况。如Data19-04,生成88-92年各洲每年葡萄酒平均产量。各个洲每年葡萄酒平均产量对比图。
操作过程:Clustered/Summaries for groups of cases/Variable中选择wine/分类轴为cont/cluster变量为year即可。
1.1.5变量模式分组条形图
Clustered/Summaries of separate variables反映的是多个变量在某个分类变量上的各自汇总情况对比。操作过程:在Bar Represent中选择两个或两个以上变量,在分类轴中选择某个分类变量即可。如:88-92年世界茶叶和咖啡每年总产量对比图。
1.1.6观测值模式分组条形图
Clustered/Values of individual cases反映的是在分类变量某类上各个个体所对应的两个或两个以上变量的汇总对比图。如1992年西欧各国咖啡和烈酒产量对比图。操作过程:在Bar Represent中选择两个或两个以上变量,在分类标签中选择表示个体的变量即可。
1.1.7观测量分类模式分段条形图
意义与1.1.4同,只不过把组用段来表示。Data19-04,生成88-92年各洲每年葡萄酒平均产量分段条形图。同1.1.4前面的操作相同,最后只需在stacks中输入year即可。
1.1.8变量分段模式条形图
意义与1.1.5同。88-92年世界茶叶和咖啡每年总产量分段条形图。
1.1.9观测值模式分段条形图
意义与1.1.6同。生成1992年西欧各国咖啡和烈酒产量分段条形图。
1.2线图简介
又称曲线图,是用线段的升降来说明现象变动情况的一种图形,它主要用来表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。线图的操作在很大程度上与条图是相同的。
1.2.1观测量分类模式单线图
数据文件Data19-01,生成1985-1994年北京年平均气温变化图。
1.2.2变量模式单线图
数据文件Data19-02,生成1985-1994年12座城市的月平均气温对比图。
1.2.3观测值模式单线图
数据文件Data19-02,生成1985-1994年上海1月份气温变化图。
1.2.4观测量分类模式多线图
数据文件Data19-01,生成1985-1994年武汉月平均气温变化图。
1.2.5变量模式多线图
数据文件Data19-01,生成1985-1994年几座城市年平均气温对比图。
1.2.6观测值模式多线图
数据文件Data19-02,生成1985-1994年上海10、11、12月气温线形图。
1.2.7和1.2.8以及1.2.9垂线图(略)
其他图形的学习请参见卢纹岱《SPSS for windows 统计分析》(第二版)第19章生成统计图形。2.描述统计分析法
描述统计学主要研究如何将实验或调查得到的大量数据简缩成有代表性的数字,使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。其研究方法是通过绘制统计图表及计算各种统计量来描述这组数据的各方面特征。如次数分布表与图、集中量数、差异量数、地位量数、相关量数。描述统计分析是统计分析的第一步,也是进一步推断的基础。
represent的用法对变量的描述统计(analyze/descriptive statistics/)
以bigfive1.sav中sum变量为例(平均数、标准差、直方图)
3.结果的输出与编辑
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论