统计学名词解释与简答题参考答案--688IT编程网

1. 分类数据是只能归于某一类别的非数字型数据，(1分)它是对事物进行分类的结果，(1分)数据表现为类别，使用文字来表述的。(1分)

2. 四分位数(quartile)也称四分位点，他是一组数据排序后处于25%和75%位置上的值。(1分)四分位数是通过3个点将全部数据等分为4部分，(1分)其中每部分包括25%的数据。(1分)

3. 方差分析（analysis of variance, ANOVA）就是通过检验各总体的均值是否相等，(1分)来判断分类型自变量对数值型因变量是否有显著影响。(2分)

4. 相关系数（correlation coefficient）是根据样本数据计算的，(1分)度量两个变量之间线性关系强度的统计量。(2分)

5. 居民消费价格指数（consumer price index， CPI）是度量居民消费品和服务项目价格水平随时间变动的相对数，(1分)反映居民家庭购买的消费品和服务价格水平的变动情况。(2分)

五、简答题

6. 简述直方图和茎叶图的区别。

答：（1）直方图虽然能很好地显示数据的分布，但不能保留原始的数值；茎叶图类似于横置的直方图，与直方图相比，茎叶图既能给出数据的分布状况，又能给出每一个原始数值，即保留了原始数据的信息。（3分）

（2）在应用方面，直方图通常用于大批量数据，茎叶图通常适用于小批量数据。（2分）

7. 回归分析主要解决那几个方面的问题？

答：（1）从一组样本数据出发，确定出变量之间的数学关系式；（1分）

（2）对这些关系式的可信程度进行各种统计检验，并从中影响某一特定变量的诸多变量中出哪些变量的影响是显著的，哪些是不显著的；（2分）

（3）利用这些所求的关系式，根据一个或几个变量的取值来估计或预测另一个特定变量的取值，并给出这种估计或预测的可靠程度。（2分

8. 简述概率抽样的定义及特点。

答：概率抽样（probability sampling）也称随机抽样，是指遵循随机原则进行的抽样，总体

中每个单位都有一定的机会被选入样本。（2分）

它具有以下几个特点：

首先，抽样时是按一定的概率以随机原则抽取样本。（1分）

其次，每个单位被抽中的概率是已知的，或是可以计算出来的。（1分）

最后，当用样本对总体目标量进行估计时，要考虑到每个样本单位被抽中的概率。

（1分）

9. 简述评价估计量好坏的标准。

答:1 无偏性; （2分）

2 有效性; （2分）

3一致性. （1分）

1.顺序数据（ran k data）是只能归于某一有序类别的（1分）非数字型数据。（2分）

2.抽样误差（sampling error）是由于抽样的随机性引起的，（1分）样本结果与总体真值之间的误差。（2分）

3.离散系数也成为变异系数（coefficient of variation），它是一组数据的标准差与其相应的平均数之比。（1分）其计算公式为：（1分）

离散系数是测度数据离散程度的相对统计量，主要是用于比较不同样本数据的离散程度。离散系数大，说明数据的离散程度也大；离散系数小，说明数据的离散程度也小。（1分）

4.置信区间（confidence interval）在区间估计中，有样本统计量所构造的总体参数的估计区间称为置信区间，（2分）其中区间的最小值称为置信下限。（1分）

5.点估计。利用估计的回归方程，对于x的一个特定值，求出y的一个估计值就是点

估计。（1分）点估计可分为两种：一是平均值的点估计；（1分）二是个别值的点估计。（1分）

五、简答题

6.简述直方图与条形图的不同点.

答：首先，条形图是用条形的长度（横置时）表示各类别频数的多少，其宽度（表示类别）则是固定的；直方图是用面积表示各组频数的多少，矩形的高度表示每一组的频数或频率，宽度则表示各组的组距，因此其高度与宽度均有意义。（2分）

其次，由于分组数据具有连续性，直方图的各矩形通常是连续排列，而条形图则是分开排列。（2分）

最后，条形图主要用于展示分类数据，而直方图则主要用于展示数值型数据。（1分）

7.简述一张好的图形应具有的基本特征。

答：（1）显示数据; （1分）

(2)让读者把注意力集中在图形的内容上，而不是制作图形的程序上; （1分）

(3)避免歪曲; （1分）

(4)强调数据之间的比较; （1分）

(5)服务于一个明确的目的, 有对图形的统计描述和文字说明。（1分）

8.简述众数、中位数和平均数的关系。

答：从分布的角度看，众数始终是一组数据分布的最高峰值，中位数是处于一组数据中间位置的值，而平均数则是全部数据算术平均。（2分）因此，对于具有单峰分布的大多数数据而言，众数、中位数和平均数之间具有以下关系：如果数据的分布式对称的，众数()、中位数（）和平均数（）必定相等，即==；（1分）如果数据是左偏分布，说明数据存在极小值，必然拉动平均数向极小值一方靠，而众数和中位数由于是位置代表值，不受极值的影响，因此三者之间的关系表现为： <<；（1分）如果数据是右偏分布，说明数据存在极大值，必然拉动平均数向极大值一方靠，则<<。（1分）

9.在多元线性回归中，选择自变量的方法有哪些？

答：变量选择的方法主要有：向前选择、（2分）向后剔除、（1分）逐步回归、（1分）最优子集等。（1分）

1. 系统抽样（systematic sampling）将总体中的所有单位（抽样单位）按一定顺序排列，（1分）在规定的范围内随机的抽取一个单位作为初始单位，（1分）然后按事先规定好的规则确定其他样本单位，这种抽样方法被称为系统抽样。（1分）

2.中心极限定理（central limit theorem）：设从均值、(有限)的任意一个总体中抽取样本量为n的样本，（1分）当n充分大时，样本均值的抽样分布近似服从均值为、方差/n的正态分布。（2分）

3.回归模型（regression model）对于具有线性关系的两个变量，（1分）可以用一个线性方程来表示他们之间的关系。（1分）描述因变量y如何依赖于自变量x和误差项的方程称为回归模型。（1分）

4. 指数平滑法（exponential smoothing）是通过对过去的观察值加权平均进行预测的一种方法，（1分）该方法使t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。（2分）

5.置信区间（confidence interval）在区间估计中，有样本统计量所构造的总体参数的估计区间称为置信区间，（2分）其中区间的最小值称为置信上限。（1分）

五、简答题

6.简述制作统计表应注意的几个问题

答：首先，要合理安排统计表的结构，比如行标题、列标题、数字资料的位置应合理安排。（2分）

其次，表头一般应包括表号、总标题和表中数据的单位等内容。（1分）

再次，表中的上下两条横线一般用粗线，中间的其他线要用细线，这样使人看起来清楚、醒目。（1分）

最后，在使用统计表时，必要时可在表的下方加上注释，特别要注明数据来源，以表示对他人劳动成果的尊重，以备读者查阅使用。（1分）

7.什么是假设检验中的两类错误？

答：一类错误是原假设为真却被我们拒绝了，犯这种错误的概率用表示，所以也称错误或弃真错误；（3分）

另一类错误是原假设为伪我们却没有拒绝，犯这种错误的概率用表示，所以也称错误或取伪错误。（2分）

8.方差分析包括哪些类型？它们有何区别？

答：根据所分析的分类型自变量的多少，方差分析可分为单因素方差分析和双因素方差分析（2分）。当方差分析中只涉及一个分类型自变量时称为单因素方差分析。在对实际问题的研究中，有时需要考虑对试验结果的影响。（2分）当方差分析中涉及两个分类型自变量时，称为双因素方差分析。（1分）

9.简述构建综合评价指数的步骤

答:(1)建立综合评价指标体系；（2分）

（2）评价指标的无量纲化处理；（1分）

（3）确定各项评价指标的权重；（1分）

（4）计算综合评价指数。（1分）

1.数值型数据（metric data）是按数字尺度测量的观察值，（2分）其结果表现为具体的数。（1分）

2.非概率抽样（non-probability sampling）是相对于概率抽样而言的，指抽取样本时不是依据随机原则，（1分）而是根据研究目的对数据的要求，（1分）采取某种方式从总体中抽出部分单位对其实施调查。（1分）

3.时间序列（time series）是同一现象在不同时间上的（2分）相继观察值排列而成的序列。（1分）

4.指数，或称统计指数，是分析社会经济现象数量变化的一种重要统计方法。指数是测定多项内容数量综合变动的相对数。（1分）这个概念中包含两个重点：第一个要点是指数的实质是测定多项内容；（1分）指数概念的第二个要点是其表现形式为动态相对数，既然是动态相对数，就涉及指标的基期对比，不同要素基期的选择就成为指数方法需要讨论的问题。（1分）

5.显著性水平(significant level)是一个统计专有名词，在假设检验中，它的含义是当原假设正确时却被拒绝的概率或风险，（1分）其实这就是前面所说假设检验中犯弃真错误的概率，（1分）它是由人们根据检验的要求确定的，通常取或，这表明，当做出接受原假设的决定时，其正确的概率为95%或99%。（1分）

五、简答题

6.简述一组数据的分布特征可以从哪几方面进行测设?

答：数据分布的特征可以从三方面进行测度和描述：

（1）是分布的集中趋势，反映各数据向其中心值靠拢或聚集的程度；（2分）

（2）是分布的离散程度，反映各数据远离其中心值的趋势；（2分）

（3）是分布的形状，反映数据分布的偏态和峰态。（1分）

7. 简述古典概型的特征。

答：（1）结果有上限。（2分）

（2）各个结果出现的可能行被认为是相同的。（3分）

8. 解释的含义和作用。

答：怎样度量它们之间的关系强度呢？可以用组间平方和（SSA直方图与条形图有何区别）占总平方和（SST）的比例大小来反映，这一比例记为，即

其平方根R就可以用来测量两个变量之间的关系强度。（3分）

的平方根(类似于第11章中介绍的相关系数r)可以用来测量自变量与因变量之间的关系强度。根据上面的结果可以计算出R=0.591404，这表明行业与投诉次数之间有中等以上的关系。（2分）

9. 简述方差分析的基本步骤

答：1 提出假设；（2分）

2 构造检验的统计量；（1分）

688IT编程网

统计学名词解释与简答题参考答案

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

统计学名词解释与简答题参考答案

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式