高考总复习:统计与统计案例
编稿:孙永钊 审稿:张林娟
【考纲要求】
1.随机抽样
(1)理解随机抽样的必要性和重要性;
(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
2.用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
(2)理解样本数据标准差的意义和作用,会计算数据标准差.
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.
3.变量的相关性
(1)会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;
(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).
【知识网络】
【考点梳理】
考点一、随机抽样
从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.
1.简单的随机抽样
简单随机抽样的概念:
设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
① 用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;
②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;
③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.
简单抽样常用方法:
①抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.
适用范围:总体的个体数不多.
优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.
2.系统抽样:
当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
系统抽样的步骤:
①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.
②为将整个的编号分段 (即分成几个部分),要确定分段的间隔.当是整数时(N为总体中的个体的个数,n为样本容量),;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数能被n整除,这时.
③在第一段用简单随机抽样确定起始的个体编号.
④按照事先确定的规则抽取样本(通常是将加上间隔,得到第2个编号频率分布直方图和条形图的区别,第3个编号,这样继续下去,直到获取整个样本).
要点诠释:
①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的
③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.
3.分层抽样:
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.
4.常用的三种抽样方法的比较:
类别 | 共同点 | 不同点 | 联系 | 适用范围 |
简单随 机抽样 | 抽样过程中每个个体被抽取的概率相等 | 从总体中逐个抽取 | 是后两种方法的基础 | 总体个数较少 |
系统抽样 | 将总体均分成几部分,按事先确定的规则在各部门抽取 | 在起始部分抽样时用简单随机抽样 | 总体个数较多 | |
分层抽样 | 将总体分成几层,分层进行抽取 | 各层抽样时采用简单随机抽样或系统抽样 | 总体由差异明显的几部分组成 | |
要点诠释:
(1)各种抽样的个体被抽到的概率相等;
(2)抽样过程中个体被抽到的概率相等.
5.不放回抽样和放回抽样:
在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样
随机抽样、系统抽样、分层抽样都是不放回抽样
考点二、用样本估计总体
1. 统计图表包括条形图、折线图、饼图、茎叶图.
2.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差)
(2)决定组距与组数
(3)将数据分组
(4)列频率分布表
(5)画频率分布表
3.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图
(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线
4.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离,
(2)方差: (是样本数据,是样本容量,是样本平均数)
要点诠释:现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标准差呢?(通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,这与有样本的频率分布近似代替总体分布是类似的,只要样本的代表性好,这样做就是合理的,也是可以接受的.)
5.利用频率分布直方图估计样本的数字特征
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值
(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和
(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标
6. 频率分布直方图反映样本的频率分布
(1)频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×
(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论