第一章复习
1.解释以下概念:总体、个体、样本、样本容量、变量、参数?
1. 总体是具有相同性质的个体所组成的集合,是指研究对象的全体。
直方图与条形图有何区别2. 个体是组成总体的基本单元。
3. 样本是从总体中抽出的若干个个体所构成的集合。
4. 样本容量是指样本个体的数目。
5. 变量是相同性质的事物间表现差异性的某种特征。
6. 参数是描述总体特征的数量。
7. 统计数是描述样本特征的数量。
8. 因素是指试验中所研究的影响试验指标的原因或原因组合。
2.统计数、因素、水平、处理、重复、效应、互作、试验误差?
1. 水平是指每个试验因素的不同状态(处理的某种特定状态或数量上的差别)。
2. 处理是指对受试对象给予的某种外部干预(或措施)。
3. 重复是指在试验中,将一个处理实施在两个或两个以上的试验单位上。
4. 效应是由处理因素作用于受试对象而引起试验差异的作用。
5. 互作是指两个或两个以上处理因素间的相互作用产生的效应。
6. 试验误差是指试验中不可控因素所引起的观测值偏离真值的差异,可以分为随机误差和系统误差。
3.随机误差与系统误差有何区别?
随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,是不可避免的。随机误差可以通过试验设计和精心管理设法减小,但不能完全消除。
系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的,在试验过程中是可以避免的。
4.准确性与精确性有何区别?
准确性也称为准确度,是指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。精确性也称为精确度,是指调查或试验中同一试验指标或性状的重复观测值彼此的接近程度的大小。准确性是说明测定值对真值符合程度的大小,用统计数接近参数真值的程度来衡量。
精确性是反映多次测定值的变异程度,用样本中的各个变量问的变异程度的大小来衡量。
填 空
1. 变量按其性质可以分为(连续 )变量和(非连续(离散型))变量。
2. 样本统计数是总体(参数)的估计值。
3. 试验统计学是研究生命过程中以样本来推断(总体)的一门学科。
4. 实验统计学的基本内容包括(试验设计)、(统计分析)两大部分。
5. 统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)、(现代推断统计学)3个阶段。
6. 生物学研究中,一般将样本容量(≥30)称为大样本。
7. 试验误差可以分为(随机误差)、(系统误差)两类,通过矫正或实施控制可予以消除的一类误差是(系统误差),而通过合理的试验设计和精心管理可以减小,但无法完全消除的一类误差是(随机误差)。
判 断
1.对于有限总体不必用统计推断方法。 ×
2.资料的精确性高,其准确性也一定高。 ×
3.在试验设计中,随机误差只能减小,而不可能完全消除。 √
4.统计学上的试验误差,通常是指随机误差。 √
名词解释
连续变量 非连续变量 定量变量 定性变量 因素 试验单位
第二章复习
填空
1. 资料按生物的性状特性可分为(数量性状资料)和(质量性状资料)。
2. 只要使用非全面调查的方法,即使遵守随机原则,(抽样误差)也不可避免会产生。
3. 常用的抽样方法有(随机抽样)、(顺序抽样)和(典型抽样)。
4. 在抽样调查时,抽样误差越小,用样本估计总体的可靠性就越(大)。
5. 在其他条件一定时,样本容量越大,抽样误差越(小)。
6. 按照抽样方法的不同,随机抽样又可分为(简单随机抽样)、(分层随机抽样)、(整体抽样)和(双重抽样)。
7. 直方图适合于表示(计量(连续变量))资料的次数分布。
8. 变量的分布具有两个明显基本特征,即(集中性)和(离散性)。
9. 反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。
10. 样本标准差的计算公式s=
判断
1.计数资料也称为连续性变量资料,计量资料也称为非连续性变量资料。×
2.抽样误差是抽样调查中无法避免的误差。√
3.抽样误差的产生是由于破坏了随机原则所造成的。×
4.在进行抽样调查时,样本容量越大,其抽样误差也越大。×
5.顺序抽样可以计算其抽样误差。×
6.简单随机抽样适用于个体间差异较小、所需抽取的样本单位数较小的情况。√
7.分层随机抽样通常比简单随机抽样得到结果更准确。√
8.抽样调查方法的正确与否直接关系到由样本所得估计值的准确性。√
9.条形图和折线图均适合于表示计数资料的次数分布。×
10.离均差平方和为最小。√
11.资料中出现最多的那个观测值或最多一组的中点值称为众数。√
12.变异系数是样本变量的绝对变异量。×
名词解释
数量性状资料/质量性状资料/计数资料/计量资料 抽样调查/全距(极差) 组中值 算术平均数 中位数 众数 几何平均数 方差 标准差/变异系数
单项选择(凡选项加粗处为正确答案,以后不做说明)
1.下面变量中属于非连续性变量的是()。
A.身高 B.体重 C.血型 D.血压
2.事先将全部总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样方式为()。
A.分层随机抽样B.简单随机抽样C.整抽样 D.顺序抽样
3.整抽样是对被抽中的体作全面调查,所以整抽样是()。
A.全面调查 B.非全面调查 c.一次性调查D.经常性调查
4.事先确定总体范围,并对总体的每个单位编号,然后根据随机数码表或抽签的方式来抽取调查单位数的抽样组织形式被称为()。
A.简单随机抽样 B.机械抽样 C.分层抽样 D.整抽样
5.先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样调查组织方式被称为()。
A.简单随机抽样 B.机械抽样 C.分层随机抽样D.整抽样
6.对某鱼塘不同年龄鱼的尾数进行统计分析时,可作成()图来表示。
A.条形图 B.直方图 C.多边形图 D.折线图
7.关于平均数,下列说法正确的是 ()。
A.正态分布的算术平均数与几何平均数相等
B.正态分布的算术平均数与中位数相等
C.正态分布的中位数与几何平均数相等
D.正态分布的算术平均数、中位数、几何平均数均相等
8.如果对各观测值加上一个常数c,其标准差 () 。
A.扩大以 B.扩大c倍 C.扩大 倍 D.不变
9.比较大学生和幼儿园孩子身高的变异度,应采用的指标是()。
A.标准差 B.方差 C.变异系数 D.平均数
10.测定一个苹果品种的单果重量,得到具有15个观察值的一个样本资料,计算标准差时其自由度为() 。
A.1 B.15 C.14 D.16
11.比较一个苹果品种重量(g)和体积(cm2)大小的变异程度,适宜的统计数是()。
A.极差 B.方差 c.标准差 D.变异系数
计算题
测定一小麦的穗长。结果为:8.9、6.3、8.7、8.8、9.1、6.2、8.6、7.8、9.2、8.9(cm),试求其平均数、极差、标准差和变异系数。
注:此处由于版本不兼容公式出错,看不清可以查一下书上的公式
解 本题为10个数据特征数求解问题,带入平均数、极差、标准差和变异系数的计算公式即。
第三章习题
1.试解释必然事件、不可能事件和随机事件,并分别举例。
在一定条件下必然出现的现象称为必然事件;相反,在一定条件下必然不出现的事件称为不可能事件;而在某些确定条件下可能出现,也可能不出现的事件,称为随机事件。例如,人相当一段时间不呼吸氧气就会死亡,这是必然事件;太阳从西边出来,这是不可能事件;给患者做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。
2.什么是互斥事件?什么是对立事件?什么是独立事件?试举例说明
事件A和事件B不能同时发生,那么称事件A和事件B为互斥事件,如人的ABO血型中,某个人血型可能是A型、B型、AB型、O型4种血型之一,但不可能既是A型又是B型。事件A和事件B必有一个发生,但二者不能同时发生,则称事件A与事件B互为对立事件。例如,抛一枚均匀的硬币时,向上的那面不是正面就是反面;发芽试验中种子要么发芽要么不发芽。事件A的发生与事件B的发生毫无关系,反之,事件B的发生也与事件A的发生毫无关系,则称事件A与事件B为独立事件,如第二胎生男生女与第一胎生男生女毫无关系。
3.什么是频率?什么是概率?频率如何转化为概率?
事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率;事件A在n次重复试验中发生了m次,当试验次数n不断增大时,事件A发生的频率就越来越接近某一确定值p,则p即为事件A发生的概率。二者的关系是:当试验次数n充分大时,频率转化为概率。
4什么是正态分布?什么是标准正态分布?正态分布曲线有什么特点?μ和σ对正态分布曲线有何影响?
.
水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯稻纯合体为WW,两个纯合亲本杂交后,其F1代为非糯稻杂合体Ww。
(1)现以F1代回交于糯稻亲本,在后代200株中预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率;
(2)当F1代自交,F2代性状分离,其中3/4为非糯稻,1/4为糯稻。假定F2代播种了2000株,试问糯稻和非糯稻各有多少株?
(1)F1代非糯稻杂合体Ww与糯稻亲本ww回交,后代非糯稻杂合体Ww与糯稻纯合体ww各占一半,即概率均为0.5,故在后代N=200株中预期糯稻和非糯稻均为:
0.5 x 200=100(株)。
(2)F 1代非糯稻杂合体Ww自交,后代非糯稻纯合体WW;非糯稻杂合体Ww ;糯稻纯合体ww=1:2:1,但表型非糯稻:糯稻=3:1,即非糯稻和糯稻的概率分别为0.75和0.25,故在后代N=2000株中,糯稻应为0.25×2000=500(株),非糯稻应为:0.75×2000=1500(株)。
填空
判断
1.事件A的发生与事件B的发生毫无关系,则事件A和事件B为互斥事件。.×
2.二项分布函数恰好是二项式(p+q)n展开式的第x项,故称二项分布。.×
3.样本标准差s是总体标准差σ的无偏估计值。.×
4.正态分布曲线形状与样本容量n值无关。√
5.卡方分布是随自由度变化的一组曲线。√
名词解释
概率 和事件 积事件 互斥事件 对立事件 独立事件 完全事件系/概率加法定理 概率乘法定理 无偏估计值/中心极限定理
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论