第一章:1、何谓心理与教育统计学?学习它有何意义?
教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。(3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。
2、教育科学研究数据的特点
(1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。
3、思考题:选用统计方法有哪几个步骤?
① 要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。 ② 要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。 ③ 要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。
4、教育统计学的分类
(1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。
5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。
6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。
具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。(2)总体参数的估计方法。(3)各种非参数的统计方法等。
7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系?
教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价
值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。
8、教育统计与心理统计的异同
相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:① 在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。② 在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。
9、数据的类型
(一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。
计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。
(二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。
称名数据只说明某一事物与其它事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小。
顺序数据是指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。
等距数据是具有相等单位,但无绝对零点的数据。
比率数据既表明量的大小,也有相等单位,同时还具有绝对零点的数据。
(三)按照数据是否具有连续性,把数据划分为离散数据和连续数据。
离散数据一般取整数,在两个单位之间不能再划分细小单位。
连续数据的单位可以划得很细微,细微的程度能达到只可想象而不能看见的程度。
10、思考题:统计量与参数之间有何区别和联系?
区别:① 参数是从整个总体中计算得到的量数,通常是通过相应样本特征值来预测得到;统计量是从一个样本中计算出来的一些量数,它可以描述一组数据的情况。② 参数代表总体的特性,它是一个常数;统计量代表样本的特性,它是一个变量,随着样本的变化而变化。③ 参数与统计量之间最明显的区别是参数常用希腊字母表示,而统计量常用英文字母表示。联系:从数值计算上讲,当总体大小已知并与实验观测的总次数相同时,统计量与参数是同一统计指标;当总体为无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。通过样本统计量,对总体参数做出预测和估计。
第二章:1、统计分组应注意的事项
(1)统计分组前的准备 。将数据进行分组前,先要对观测数据做进一步的核对和校验。校核数据的目的是为了尽可能地消去记录误差,以便后续的统计分析建立在一个坚实的基础上。
(2)统计分组时应注意的问题。① 分组要以被研究对象的本质特性为基础; ② 分类标志要明确,要能包括所有的数据。
2、分组次数分布表的意义与缺点
意义:编制分组次数分布表,可将一堆杂乱无序的数据排列成序。从表中可以发现各个数据的出现次数是多少,其分布的状态如何。
缺点:分组次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。根据这样的统计表提供的数据资料计算得到的平均值,会与用原始数据计算的值有一定的出入。
3、思考题:直方图、条形图、圆形图、线性图、散点图等这些常用的统计图,根据它们表现的作用和内容,把它们可分为哪几类?
根据它们表现的作用和内容,把它们可分为五类。第一种是表现分布的图,比如直方图。第二种是表现内容的图,如条形图和圆形图。第三种是表现变化的图,这种图形的代表是线性图。第四种是表现比较的图,这几种图形都能采用。第五种是表现相关的图,如散点图。
4、条形图和直方图的区别。
(1)描述的数据类型不同。(2)表示数据多少的方式不同。(3)坐标轴上的标尺分点意义不同。(4)图形直观形状不同。
第三章:1、算术平均数的优缺点
算术平均数具备一个良好的集中量数所应具备的一些条件:
① 反应灵敏;② 严密确定; ③ 简明易懂; ④ 计算简单;⑤ 适合代数运算; ⑥ 较少受抽样变动的影响。除此之外,算术平均数还有以下一些特殊的优点:① 只知一组观察值的总和及总频数就可以求出算术平均数;② 用加权法可以求出几个平均数的总平均数;③ 用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的真值,它是总体平均数的最好估计值;④ 在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
缺点:① 易受极端数据的影响;② 若出现模糊不清的数据时,无法计算平均数。
2、算术平均数的意义、适用条件及应用原则
意义:算术平均数是应用最普遍的集中量数,它是“真值”渐近、最佳的估计值。
适用的条件:一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,这时就需要用算术平均数表示其集中趋势。
原则:① 同质性原则;② 平均数与个体数值相结合的原则;③ 平均数与标准差、方差相结合的原则。
3、中数适用的情况
(1)当一组观测结果中出现两极端数目时;(2)当次数分布的两端数据或个别数据不清楚时;(3)当需要快速估计一组数据的代表值时。
4、众数适用的情况
(1)当需要快速而粗略地寻求一组数据的代表值时;(2)当一组数据出现不同质的情况时;
(3)当次数分布中有两极端的数目时;4)当粗略估计次数分布的形态时。
第四章:1、思考题:为什么要引入差异量数来描述一组数据的特征? 直方图与条形图有何区别
在教育研究中,要全面描述数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。这些特殊性常表现为数据的变异性。因此,只有集中量数不可能真实地反映它们的分布情况。为了全面反映数据的总体情况,除了使用集中量数外,还需要引入差异量数。
2、思考题:为什么说标准差是重要而完善的差异量?
(1)标准差具有简单明了,反映灵敏,严密确定,容易计算,适合代数运算,受抽样变动的影响较少等优点。(2)标准差在避免两极端数值影响方面大大超过全距、百分位差和四分位差;在避免绝对值方面,优于平均差;在考虑单位方面,优于方差。
3、差异系数的应用
(1)同一团体不同观测值离散程度的比较(即不同单位资料差异程度的比较);(2)对于水平相差较大,但进行的是一种观测的各种团体,进行观测值离散程度的比较(即单位相同而平均数相差较大的两组资料差异程度的比较)。
应用差异系数比较相对差异大小时,应注意以下几点:
① 测量的数据要保证具有等距尺度;② 观测工具应具备绝对零; ③ 差异系数只能用于一般的相对差异量的描述,至今尚无有效的假设检验方法。
第五章:1、思考题:如何理解相关系数?
相关系数是两列变量间相关程度的数字表现形式。对于这一概念,我们可以从以下几个方面来理解:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论