统计与概率
一、抽样方法
1、简单随机抽样:一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。
(1)特点:①有限性:总体个体数有限;
②逐个性:每次只抽取一个个体;
③不放回:抽取样本不放回,样本无重复个体;
④等概率:每个个体被抽到的机会相等。(如果从个体数为的总体中抽取一个容量为的样本,则每个个体被抽取的概率等于)。
(2)适用范围:总体中个数较少。
(3)注意:随机抽样不是随意或随便抽取,随意或随便抽取都会带有主观或客观的影响因素。
(4)常用方法:①抽签法(抓阄法);②随机数表法。
例1-1.用简单随机抽样的方法从含有个个体的总体中依次抽取一个容量为的样本,则个体被抽到的概率为( )。
A、 B、 C、 D、
【答案】D
【解析】一个总体含有个个体,某个个体被抽到的概率为,
∴以简单随机抽样方式从该总体中抽取一个容量为的样本,
则指定某个个体被抽到概率为,故选D。
例1-2.下面的抽样方法是简单随机抽样的是( )。
A、在某年明信片销售活动中,规定每万张为一个开奖组,通过随机抽取的方式确定号码的后四位为的为三等奖
B、某车间包装一种产品,在自动包装的传送带上,每隔分钟抽一包产品,称其重量是否合格
C、某学校分别从行政人员、教师、后勤人员中抽取人、人、人了解学校机构改革的意见
D、用抽签法从件产品中选取件进行质量检验。
【答案】D
【解析】A、B不是简单随机抽样,∵抽取的个体间的间隔是固定的,
C不是简单随机抽样,∵总体的个体有明显的层次,D是简单随机抽样,故选D。
例1-3.利用随机数表法对一个容量为编号为、、、…、的产品进行抽样检验,抽取一个容量为的样本,若选定从第行第列的数开始向右读数,(下面摘取了随机数表中的第行至第行),根据下图,读出的第个数是( )。
A、 B、 C、 D、
【答案】B
【解析】最先读到的个的编号是;向右读下一个数是,大于,舍,
再下一个数是,大于,舍;再下一个数是,大于,舍,
再下一个数是,再下一个数是,大于,大于,舍,
再下一个数是,读出的第个数是,故选B。
2、分层抽样方法:当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,常将总体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比例进行抽样,这种抽样叫做分层抽样,其中所分的各部分叫“层”。
例1-4.某校高三年级有男生人,女生人,为了解该年级学生的健康情况,从男生中任意抽取人,从女生中任意抽取人进行调查。这种抽样方法是( )。
A、简单随机抽样法 B、抽签法
C、随机数表法 D、分层抽样法
【答案】D
【解析】总体由男生和女生组成,比例为,所抽取的比例也是,故选D。
例1-5.某校高三一班有学生人,二班有学生人,现在要用分层抽样的方法从两个班抽出人参加军训表演,则一班和二班分别被抽取的人数是( )。
A、, B、,
C、, D、,
【答案】B
【解析】每个个体被抽到的概率等于,,,
故从一班抽出人,从二班抽出人,故选B。
例1-6.某单位有职工人,其中青年职工人,中年职工人,老年职工人。为了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为人,则样本容量为( )。
A、 B、
C、 D、
【答案】B
【解析】青年职工、中年职工、老年职工三层之比为,∴样本容量为,故选B。
二、总体分布、总体特征数的估计
1、数据收集的基本方法:
(1)做试验:通过设计一些合适的试验,能够直接地获得样本数据,如统计一颗骰子各点出现的频率,就可做抛掷骰子试验。
(2)查阅资料:有些数据不易直接调查到,可通过查阅图书馆文献或通过搜索因特网上的相关资料等办法获得所需数据或相关数据。
(3)设计调查问卷:问卷一般由一组有目的、有系统、有顺序的题目组成。
2、分布的意义和作用
分布图提供了表示一个变量与另一个变量如何相互关联的标准方法。
分布图是表现一些现象空间分布位置与范围的图型。包括占有空间小又零散的现象,或流动性大难于确定具体位置的现象,或性质与数量不能立即确定的现象等。
3、频率分布直方图
(1)频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图。
(2)频率分布直方图的特征
①图中各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1。
②从频率分布直方图可以清楚地看出数据分布的总体趋势。
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉。
(3)频率分布直方图求数据
①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
频率分布直方图中最高矩形的底边中点的横坐标。
②平均数:一组数据的算术平均数,即。
是频率分布直方图的“重心”,是直方图的平衡点。平均数等于频率分布直方图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和。
③中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;
把频率分布直方图分成两个面积相等部分的平行于轴的直线横坐标。
在样本中,有的个体小于或等于中位数,也有的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛。它们的的优缺点:
(4)绘制频率分布直方图的步骤:
例1-7.辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速的众数,中位数的估计值为( )。
A、,
B、,
C、,
D、,
【答案】D
【解析】选出直方图中最高的矩形求出其底边的中点即为众数,
求出从左边开始小矩形的面积和为对应的横轴的左边即为中位数,
最高的矩形为第三个矩形,∴时速的众数为前两个矩形的面积为,
由于,则,∴中位数为,故选D。
4、茎叶图
将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图。
(1)茎叶图的优缺点:
优点:①所有信息都可以从茎叶图上得到;
②茎叶图便于记录和表示。
缺点:分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便。
(2)茎叶图的制作步骤:画直方图的四个步骤
①将每个数据分为“茎”(高位)和“叶”(低位)两部分;
②将最小的茎和最大的茎之间的数按小大次序排成一列;
③将各个数据的叶按大小次序写在茎右(左)侧;
第1步中,如果是两位数字,则茎为十位上的数字,叶为个位上的数字,如,茎:,叶:;如果是三位数字,则茎为百位上的数字,叶为十位和个位上的数字,如,茎:,叶:。
对于重复出现的数据要重复记录,不能遗漏,同一数据出现几次,就要在图中体现几次。
例1-8.某篮球运动员在某赛季各场比赛的得分情况:、、、、、、、、、、、、。请绘制篮球运动员在某赛季各场比赛的得分情况茎叶图。
【解析】绘制茎叶图如下。
例1-9.甲乙两位同学最近五次模考数学成绩茎叶图如图,则平均分数较高和成绩比较稳定的分别是( )。
A、甲、甲
B、乙、甲
C、甲、乙
D、乙、乙
【答案】A
【解析】,,,,
∴平均分数较高的是甲,成绩较为稳定的是甲,故选A。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论