第九章 统计
考点1.简单随机抽样
全面调查(普查)、抽样调查
1.全面调查(普查):对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
总体:调查对象的全体.
个体:组成总体的每一个调查对象.
2.抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计推断的调查方法.
样本:从总体中抽取的那部分个体.
样本量:样本中包含的个体数.
常见的两种简单随机抽样方法
(1)抽签法
抽签法:把总体中的N画直方图的四个步骤个个体编号,把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将号签放在一个不透明容器中,充分搅拌后,每次从中不放回地抽取一个号签,连续抽取n次,使与号签上的编号对应的个体进入样本,就得到一个容量为n的样本.
②优缺点
优点:简单易行,当总体较小时,号签搅拌均匀很容易,个体有均等的机会被抽取,从而能保证样本的代表性
缺点:当总体较大时,费时、费力,且号签很难被搅拌均匀,产生的样本代表性差,导致抽样的不公平
(2)随机数法
(1)用随机试验生成随机数
(2)用信息技术生成随机数:计算器生成随机数;电子表格软件生成随机数;R统计软件生成随机数.
优缺点
优点:简单易行,它很好的解决了抽签法中遇到的当总体个数较多时制签难、号签很难被搅拌均匀的问题
缺点:当总体较大时,需要的样本容量较大时,不太方便
点2:用样本估计总体
频率分布直方图
作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的差.
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求取整,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组
4.列频率分布表
各小组的频率=.
5.画频率分布直方图
纵轴表示实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×=频率.
常见统计图表的特点与区别
扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数频率,条形图适用于描述离散型数据,直方图适用于描述连续型数据.折线图主要用于描述数据随时间的变化趋势.
百分位数
1.百分位数定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.常用的百分位数
(1)四分位数:第25百分位数第50百分位数第75百分位数.
(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.
3.计算一组n个数据的第p百分位数的一般步骤如下:
第1步,按从小到大排列原始数据;
第2步,计算in×p%
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
3.平均数:如果n个数x1x2xn,那么(x1x2xn)叫做这n个数的平均数.
频率分布直方图中平均数、中位数、众数的求法
1.样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应相等.
3.将最高小矩形所在的区间中点作为众数的估计值.
方差、标准差
1.假设一组数据为x1x2xn,则这组数据的平均数,方差为s2(xi)2,标准差s.
2.如果总体中所有个体的变量值分别为Y1Y2YN,总体平均数为,则称S2(Yi)2为总体方差,S为总体标准差.
如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为Y1Y2Yk,其中Yi出现的频数为fi(i=1,2,k),则总体方差为S2i(Yi)2.
3.如果一个样本中个体的变量值分别为y1y2yn,样本平均数为,则称s2(yi)2为样本方差,s为样本标准差.
4.标准差刻画了数据的离散程度波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。