SPSS数据库变量的分类
数据分析通常会涉及到定量(quantitative)数据和定性(qualititative)数据,其在分析过程中的作用及相应的分析方法不尽相同。因此在定义数据库结
构时,必须明确数据库中使用的各种变量的类型(type)。
一、根据数据的运算类型不同划分
1、数值型变量(numeric)
在spss分析软件中,数值型是变量定义的缺省类型,可以进行所有的数值运算与统计分析。为了更清楚地表达长数据,数值型变量可进一步划分为以下
几类:
1)逗号变量(comma),以逗号为三位分割符号,将数据分割开来,如123,123。
2)句点变量(dot),以逗号为小数点,以圆点为三位分割符号,如
123.123,26。
3)科学计数变量(scientific notal),以10的指数形式表示,分两个部分,第一个部分为有效数字,第二个部分为10的指数值,用e表示,正指数用+号,负指数用-号,如1.23e+02代表的数值为123。科学计数主要用于一些整数位
较长的数据。
数值型变量在数据库中是最常用的,大多数的数据在没有特别要求的情况下,通常采用数值型变量定义,当数值过大,超过了定义的宽度,就会自动转
变为科学计数。
2、日期型变量(date)
根据年月日时分秒的组合方式不同,日期型变量有多种不同格式,在spss 中,当日期型变量定义之后,只有输入相应格式的日期数据才能被接受。如
<分别代表日月年,hh:mm:ss分别代表时、分、秒。
日期型变量通常用来反映对应数据产生的日期或时间,当需要了解数据产
生的日期或时间特点时,通常会定义这一数据,数据的录入可以自动产生,也
可以手工录入。
3、自定义货币变量(custom currency)
可以根据使用的货币单位定义货币变量的前缀(prefix)与后缀(suffix),
显示方式为有效数字带定义货币变量的前缀或后缀,如0。此变量为数值型变量,在使用多种货币销售或采购货物时,可使用此类变量。
4、字符型变量(string)
字符型变量是指用字母或汉字记录数据的变量,如姓名变量,其对应的数
据均是用字母或汉字表示的。对于字符型变量,只能进行字符串运算,不能进
行数字计算,通常用来表示相应数据的属性特征。在spss中由于数值型变量为缺省值,因此在通过字符串运算生成新的字符型变量时,要先对生成的新变量
进行字符类型的定义,否则就会出现错误。
二、根据数据的测量尺度不同划分
数据是用来测量目标与事件的,测量过程实际上是将给定的数值分配给被
测量的目标或事件,通过这些数值来反映被测量目标或事件的水平或实际情况。由于数值分配规则不同,测量尺度也不相同,对应变量的特征也不相同。在
spss中,有三种测量尺度的变量(measurement variable)。
1、等距或比例变量(scale)
属于最高级别的测量尺度,数值可以进行等距离划分或进行比率计算,它
可以是数值型变量、货币型变量,但不能是字符型变量。这类变量往往是连续
的或是等距离的,数值的范围无限。在数据分析中,这类数据有两种表现形式:一是连续的数据,如销售数据。二是分组数据,如将个人收入水平分成若干组,而不用连续数据表达。
2、顺序变量(ordinal)
该变量取值有明显的顺序或等级,可以是字符型变量,也可是数值型变量。这类变量的取值范围通常是有限的,而且每个数值都有特定的含义。如给某一
品牌满意度进行平价,用1、2、3、4、5分别表示非常满意、满意、一般、不
满意、非常不满意。在数据分析中,一些主观的测量,如态度测量、评分中使
用最多,有些时候,这类变量也可作为分组或分类变量,进行数据分析,如收
入类别。等距或比例变量也可转换为顺序变量,如对销售额排名,形成名次变量。
3、类别变量或名义变量(nominal/categorical)
该变量取值有明显的类别,但无顺序或等级,可以是字符型变量,也可是
数值型变量。这类变量的取值范围通常是有限的,而且每个数值都代表特定的
类别。如在进行销售数据分析时,将服装产品分为男装和女装两大类。在实际
分析中,类别变量的主要用途是进行数据分组(group)或分类。
以上这些变量类型的划分,通常在交互作图时需要特别指明,在没有特别
要求时,定义变量类型使用系统默认的等距或比例变量(scale)。这是因为等距或比例变量型变量在分析过程中不会受到限制,其他类型的变量,在很多统计
分析中会受到限制而不能使用。
三、根据对变量特征描述的方法不同划分
1、频数变量
该类变量通常使用频数来描述其特征。名义变量是最典型的频数变量,顺
序变量也可进行频数描述。
2、综述变量
该类变量通常使用汇总值、平均值、方差等来描述其特征。等距等比变量
是最典型的综述变量,顺序变量有时也可进行综述性的描述,如被试对产品的
数据库基本数据类型有哪些评价打分。当然,对于综述变量,如果将其数据按值的大小,转化成若干类,
也可作为频数变量进行频数分析,了解数据值的分布特征。
以上两种划分的目的是,在进行数据分析时,要能分清楚不同变量,其特
征的描述方法是不一样的,如果方法选择错误,统计分析结果就会失去意义。
四、根据变量之间的关系划分
1、因变量(dependent)
在进行市场分析时,通常要确定一个分析目标,并对这一目标进行预测,
被预测的变量称为因变量,在一个分析模型中,因变量一般只有一个。但在多
元分析中,因变量可有多个。
2、自变量(independent)
通常对预测变量产生影响的因素很多,在进行市场分析时,往往会根据实
际情况,确定若干影响因素,这些影响因素称为自变量,在一个分析模型中,
自变量可有多个。
为了做好数据分析工作,首先要分析市场现象,确定市场之间的相互关系,根据分析目的,在一系列市场现象中界定因变量和自变量。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。