第一章导论
1.2、
●描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计
方法。
●推断统计:研究的是如何利用样本数据来推断总体特征。
1.3、统计学据可以分成哪几种类型,各有什么特点?
●按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的,非数字型数据。
顺序数据:只能归于某一有序类别的,非数字型数据。
数值型数据:按数字尺度测量的观察值,结果表现为数值。
●按收集方法不同,分为:观测数据、和实验数据。
观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域。
实验数据:在试验中收集到的数据;控制条件;自然科学领域。
直方图与条形图有何区别●按时间不同,分为:截面数据、时间序列数据
截面数据:在相同或近似相同的时间点上收集的数据。
时间序列数据:在不同时间收集的数据。
1.4
●分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,
该数据表现为类别,使用文字来表述的,分类数据主要由分类尺度计量形成的。
●顺序数据:只能归于某一有序类别的非数字型数据,这些类别是有顺序的,
它是由顺序尺度计量形成的。
●数值型数据:按数字尺度测量的观察值,是使用自然或度量衡单位对事物进
行测量的结果,其结果表现为具体的数值。
第二章数据的搜集
2.2比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本
被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。
第三章数据的图表搜集
3.4直方图和条形图有何区别?
●条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积
表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义;
●直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直
方图主要展示数值型数据。
3.6饼图和环形图的不同?
饼图只能显示一个样本或总体各部分所占比例。环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
第四章习题答案
4.5简述众数、中位数和平均数的特点和应用场合。
●众数:主要用于分类数据集中趋势的度量;是一组数据的峰值;
优点:不受极值的影响。
缺点:具有不唯一性;只有数据量较大时才有效果
●中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制;优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。
●平均数:主要用于数值型数据集中趋势的度量;是一组数据的重心所在。
优点:利用了所有数据信息;数据误差相互抵消,具有无偏性;
缺点:易受极值影响;当数据分布偏斜程度较大时代表性差。
4.9测度数据分布形状的统计量有哪些?峰态系数、偏态系数。
第六章统计量及其抽样分布
6.6什么是抽样分布?
样本统计量(随机变量)的概率分布是一种理论概率分布。
第七章参数估计
7.2、简述评价估计量好坏的标准。
●无偏性:估计量抽样分布的数学期望=总体参数
●有效性:对同一参数的两个无偏点估计量,拥有更小标准差的估计量更有效。
●一致性:随着样本容量的增大,估计量的值越来越接近总体参数。
7.7简述样本量与置信水平、总体方差、估计误差的关系。
样本量越大,置信水平越高,总体方差和估计误差越小。
第八章假设检验
8.1假设检验和参数估计有什么相同点和不同点?
●相同点:是统计推断的两部分;都运用样本对总体进行推断。
●不同点:推断角度不同。
●参数估计:用样本统计量估计总体参数,总体参数估计前未知。
●假设检验:对总体参数提出假设,用样本信息验证假设成立否。
8.3什么是假设检验中的两类错误?
●α错误(弃真错误):原假设为真,却被我们拒绝了。
●β错误(取伪错误):原假设为假,却被我们接受了。
第十章方差分析
10.4方差分析中有哪些基本假定?
(1)每个总体都应服从正态分布
(2)各个总体的方差必须相同
(3)观测值是独立的
10.10方差分析中多重比较的作用是什么?
通过对总体均值之间的配对比较来进一步检验哪些均值之间存在差异。
第11章一元线性回归
11.8一元线性回归模型通常有以下几条基本的假定:
(1) 变量之间存在线性关系;
(2) 在重复抽样中,自变量x 的取值是固定的;
(3) 误差项ε是一个期望为零的随机变量;
(4) 对于所有的x 值,误差项ε的方差2σ都相同;
(5) 误差项ε是一个服从正态分布的随机变量,且相互独立。即2(0,)N εσ。
11.9参数最小二乘法的基本原理
因变量的观测值与估计值之间的离差平方和最小。 第十二章多元线性回归
12.2多元线性回归模型中有哪些基本假定?
(1)误差项ε是一个期望值为0的随机变量,即0)(=εE 。
(2)对于自变量1x ,2x ,…,k x 的所有值,ε的方差2σ都相同。
(3)误差项ε是一个服从正态分布的随机变量,且相互独立,即),0(~2σεN 。
12.3解释多重判定系数和调整的多重判定系数的含义和作用。
多重判定系数2R 是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量的变差中被估计的回归方程所解释的比例。
为避免增加自变量而高估2R ,统计学家提出用样本量n 和自变量的个数k 去
调整2R ,计算出调整的多重判定系数)1
1)(1(122-----=k n n R R a ,其意义与2R 类似,表示在用样本量和模型中自变量的个数进行调整后,在因变量的变差中被估计的回归方程所解释的比例。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。