SPSS统计与EXCEL统计
一、SPSS常用多变量分析技术比较汇总表
注:卡方分析:定量两个定性变量的关联程度
简单相关分析:计量两个计量变量的相关程度
独立样本T检验:比较两组平均数是否相等
ONEWAY ANOVA:可以比较三组以上的平均数是否相等,并进行多重比较检验
TWOWAY ANOVA:可以比较两因素的平均数是否相等,并检验主效应和交互效应
判别分析与logistic回归:应用于检验一组计量的自变量(可含虚拟变量)是否可以正确区别一个定性的因变量
多维量表法(MDS):试图将个体中的变异数据,经过转为为一个多维度的空间图,且转化的个体在空间中的相对关系仍与原始数据尽量配合一致。
二、SPSS常用统计技术(变量个数与测量量表)比较汇总表
注:理论模型中变量通常很难测量,这类变量称为潜变量,如绩效、满意度、忠诚度等。
PS:原本这篇想做一个SPSS学习大纲的,却没到思维导图软件,只好在WORD上整理了汇总了一些SPSS常用的方法同时也整理了一个SPSS学习的大致框架。
统计假设检验有很多,从大的方面包括参数检验与非参数检验。参数检验有我们常见的关于方程模型显著性检验的F检验,方程参数的T检验等;而非参数检验中比较常见的则包括符号检验、秩和检验以及游程检验。提到参数检验时,不得不说的一个概念就是P-值,也就是SAS&SPSS等统计软件输出结果中的做sig.值,到底什么是sig.值是什么,它与我们平时所熟悉的概率P有什么关系,最初它是怎样形成的……提到这些,不得不提到的概念有上分位点、两类错误(弃真和纳伪)以及阀值K又是怎样一回事?下面我将一一道来:
图1 α值与P值的关系图
一、相关统计概念
1.上分位点
学统计的同学都知道正态分布,而上分位点的由来正与正态分布有关。最初由标准正态分布由来,随后扩展到t分布,F分布,卡方等其他分布。下面以标准正态分布为例,设X~N(0,1),若Zα满足条件
P{X> Zα}=α,0<α<1
则称点Zα为标准正态分布的上α分位点,例如: Z0.05=1.645,Z0.005=2.57,Z0.001=3.10
2.两类错误
简单的讲两类错误是指第一类错误:"弃真"错误(其发生的概率常用α表示);第二类错误:"取伪"错误(其发生的概率常用β表示)。
3.阀值(阈值)
这里的阀值与箱型图中的阀值意思相同,都是与判断标准相关的一个临界值,由于使用目的的不同,致使形态上有些许差别。例如在检验样本均值与总体均值是否有差别时,与检验统计量比较的临界值k(这里姑且先这样定义),就是阀值。
4.显著性水平
假设检验运用了小概率原理,事先确定的作为判断的界限,即允许的小概率的标准,称为显著性水平。如果根据命题的原假设所计算出来的概率小于这个标准,就拒绝原假设;大于这个标准则接受原假设。这样显著性水平把概率分布分为两个区间:拒绝区间,接受区间。(通常假设检验时只考虑到了第一类错误,而忽视掉了第二类错误,所以将此时的假设检验称为显著性检验)
二、相关概念与P值
前面讲了那么多的统计概念,貌似与P值没什么关联,下面回到文章最初提到的问题,看看上面提到的各种概念和P值(sig.值)是怎样联系起来的,下面以正态分布均值检验为例进行说明:
假设检验的原理清楚了(上面的例子针对正态分布方差已知的情况,其他参数检验只是参照的检验统计量不同罢了),同样由上面的原理可推导出另一种检验—P值检验,P值检验是国际上流行的检验格式。该格式是通过计算P值,再将它与显著性水平α作比较,决定拒绝还是接受原假设。所谓P值就是拒绝原假设所需的最低显著性水平。P值判断的原则是:如果P值小于给定的显著性水平α,则拒绝原假设,否则,接受原假设。或者,更加直观的原则是:如果P值很小,拒绝Ho,P值很大,接受Ho.P值检验为计算机进行统计分析带来方便,P值检验无需针对不同的显著性水平,先查分布表确定临界值,然后才能进行检验判断。
在SPSS统计软件中,不论是哪个检验程序,其所显示的P值都是双尾检验的结果。若使用者欲进行的是单尾检验,其程序与双尾检验相同,但所得到的P值自行除以2,再与期望的显著水平相比较。SAS&SPSS等统计软件常用*号表示显著性水平的程度,通常一个*号表示0.1的显著水平,两个* *表示0.05的显著水平。
excel做直方图的详细步骤
以往运用的一些统计回归方法前面往往有很多的假设,而这些假设往往又是我们大多少数人在使用各种各样的统计方法前最容易忽略的问题.某日,终于能静下心来将一些最常用的方法整理了一通 .
1、统计图形判断
a、直方图(Histogram)
常用于大致判断变量数据满足的分布类型
spss大致程序:GRAPH
/HISTOGRAM(NORMAL)=var1.
/HISTOGRAM(NORMAL)=var1.
一般只要数据样本足够大,通常可以判断变量满足的大致分布类型
b、P-P图&Q-Q图
如果说直方图是大致判断数据满足的分布类型,这种判断常常依赖于统计工作者的经验,人的主观因素太大,难免有所偏差,同时也无法判断估计分布与实际分布的差距有多大,这时候常常用P-P图&Q-Q图来客观表述。
spss大致程序:
PPLOT
/VARIABLES=var1
/TYPE=P-P.
/VARIABLES=var1
/TYPE=P-P.
SPSS中提供了13种最常见的分布类型.检验数据是否较好的服从给定分布的标准有2个.第一,看P-P图上的数据点与直线的重合度.第二,看P-P趋势图上的点是否关于Y=0在一个较小的范围内上下波动.Q-Q图与P-P图的定义类似,只是P-P图比较的是真实数据与待检验分布的累计概率.而Q-Q图比较的是真实数据与待检验分布的分位点值.
2、非参数检验判断
一般而言,一个典型的统计推断过程通常由5个步骤构成,假定分布族、抽样、计算统计量和抽样分布,进行推估和检验、评价模型。
SPSS中提供了8种最常用最简单的非参数检验方法,这8种检验方法又被分为分布类型检验和分布位置检验2类。
A、分布类型检验
⑴、卡方检验
卡方检验又称卡方拟合优度检验,用于检验观测数据是否与某种概率分布的理论值相符合,进而推断观测数据是否来自该分布的样本问题。(要求变量是厕度水平为经排列或未经排列的数值型分类变量,若为连续型变量,可以通过SPSS中的recode过程将样本空间划分区间或者分类。)
⑵、二项分布检验
二项分布检验过程用于对二元变量的2个分类的观测频数与某个具有确定的概率参数的二项分布的期望频数进行比较的假设检验问题。(要求检验变量是数值型的二元变量,若不是二元变量可以将数据分成2组)
⑶、游程检验
游程检验是利用总个数获得统计推断结论的方法。 (要求检验变量必须是数量型的)。
⑷、单个样本的K-S检验
K-S检验就是kolmogorov-smirnov检验的简称,它的检验方法是以样本数据的累计频数分布与某一特定的理论分布相比较,若2者间的差距很小,则推论这样本取至某特定分布族。
B、分布位置检验
⑴、两个独立样本分布位置检验
通常用于当样本所属总体的分布类型不明却时,检验2个样本是否来自相同分布的总体。
检验方法:
Mann-whitney的U检验法,即wilcoxon秩和检验法。
Moses极端反映检验法
K-S的Z检验法
Wald-wolfowitz游程检验法
⑵、多个独立样本分布位置检验
多个独立样本分布位置检验是要检验解决多个独立样本间是否具有相同分布的问题。
检验方法:
Kruskal-wallis H检验法,他是mann-whitney U检验法的推广,是类似于单因素分析的一种检验方法。
中位数检验法
Jonckheere-terpstra检验法,用于解决位置参数某一方向的假设检验问题。
⑶、两个相关样本分布位置检验
当2个样本间的数据不再是相互独立,而是彼此相关时,可以用2个样本分布位置检验来检验2个样本是否有相同的分布。例如:检验一超市促销活动的效果等。
⑷、多个相关样本分布位置检验
通常用于检验多个相关样本间是否具有相同的分布。例如:可应用于比较厨师的手艺是否有区别。
以上所用检验变量或数据是否服从某一分布都是运用SPSS这一数据处理工具来完成,当然除了上面提到的一些常用方法外,还有很多其他的方法。
SPSS函数是一个常用程序(rountine),并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关键名称(keywordname),且绝不能写错。通常,函数的格式为:函数名称(自变量,自变量,……),某些函数可能只含有一个自变量,而有些函数则可能含有多个自变量,当一个函数含有多个自变量时,各自变量间用逗号(,)隔开,而函数的自变量通常又可分为以下三种:1)常数,如SQRT(100):2)变量名称,如MEAN(VAR1,VAR2,VAR3);3)表达式,如MIN(30,SQRT(100))。总之,SPSS函数和我们平时EXCEL里面函数格式规则并无差别。
SPSS提供了180多种函数,共可分为十多类(SPSS 17.0中大大小小分了18类)。和EXCEL一样,我们也不可能记住所有函数,只要知道一些常用函数,至于其他函数要用的时候再去查也不迟,下面本人将列举一些常用函数:
(一)算术函数
函数 | 说明 | 范例(x=2.6,y=3) |
ABS(numbexpr) | 绝对值函数 | ABS(y-x)=0.4 |
RND(numbexpr) | 四舍五入函数 | RND(x)=3 |
TRUNC(numbexpr) | 取整函数 | TRUNC(x)=2 |
SORT(numbexpr) | 平方根函数 | SQRT(y)=1.71 |
MOD(numbexpr,modulus) | 求算两数相除后的余数 | MOD(y,x)=0.4 |
EXP(numbexpr) | 以e为底的指数函数 | EXP(y)=20.09 |
LG10(numbexpr) | 以10底的对数函数 | LG10(x*10)=1.41 |
LN(numbexpr) | 自然对数函数 | LN(y)=1.1 |
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论