《第九章 统计》章末复习
【体系构建】
【题型探究】
随机抽样方法的应用
【例1】 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,干事20人,上级机关为了了解机关人员对政府机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?
[解] 用分层随机抽样抽取.
∵20∶100=1∶5,∴=2,=14,=4,
即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人.
∵副处级以上干部与干事人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,…,69编号,然后用随机数法抽取14人.
【跟踪训练】
1.某学校有教师200人,男学生1 200人,女学生1 000人.现用分层随机抽样的方法从全体师生中抽取一个容量为n的样本,若女学生一共抽取了80人,则n的值为(  )
A.193   B.192   C.191   D.190
B [1 000×=80,求得n=192.]
频率分布直方图及应用
【例2】  某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:
[107,109),3株;[109,111), 9株;[111,113),13株;
[113,115),16株;[115,117),26株;[117,119),20株;
[119,121),7株;[121,123),4株;[123,125],2株.
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)据上述图表,估计数据在[109,121)范围内的可能性是百分之几?
[解] 
分组
画直方图的四个步骤
频数
频率
累积频率
[107,109)
3
0.03
0.03
[109,111)
9
0.09
0.12
[111,113)
13
0.13
0.25
[113,115)
16
0.16
0.41
[115,117)
26
0.26
0.67
[117,119)
20
0.20
0.87
[119,121)
7
0.07
0.94
[121,123)
4
0.04
0.98
[123,125]
2
0.02
1.00
合计
100
1.00
(2)频率分布直方图如下:
(3)由上述图表可知数据落在[109,121)范围内的频率为:0.94-0.03=0.91,即数据落在[109,121)范围内的可能性是91%.
【跟踪训练】
在本例中由得到的频率分布直方图估计树苗的高度(cm)的平均数.
[解] 由频率分布直方图可得树苗的高度(cm)的平均数的估计值为
003×108+0.09×110+0.13×112+0.16×114+0.26×116+0.20×118+0.07×120+0.04×122+0.02×124=115.46(cm)
用样本估计总体分布的方法
(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.
(2)借助图表,可以把抽样获得的庞杂数据变得直观,凸显其中的规律,便于信息的提取和交流.
数据的集中趋势和离散程度的估计
【例3】 甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)求甲成绩的80%分位数;
(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由?
[解] (1)把甲的成绩按照从小到大的顺序排列可得:
78 79  81 82 84 88 93 95
因为一共有8个数据,所以8×80%=6.4,不是整数,所以甲成绩的80%分位数是第7个数据93.
(2)(78+79+81+82+84+88+93+95)=85,
(75+80+80+83+85+90+92+95)=85.
s[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
s[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,
s<s,∴甲的成绩较稳定,派甲参赛比较合适.
用样本的数字特征估计总体的方法
为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体相应的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,处于中间位置的数,如果数据的个数是偶数,中间两个的数据的平均数;平均数就是所有样本数据的平均值,用表示;标准差是反映样本数据离散程度大小的最常用统计量,其计算公式是s.有时也用标准差的平方来代表标准差.
【跟踪训练】
2.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为(  )
分数
5
4
3
2
1
人数
20
10
30
30
10
A.3  B.  C.3  D.
B [∵=3,∴s2[(x1)2+(x2)2+…+(xn)2]
(20×22+10×12+30×12+10×22)=s.]

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。