一、基本概念
(1)频数
频数就是某个类别或某个小组中的数据个数,也称次数。例如根据测试成绩,将学生分为优、良、及格、不及格四个组,如果18个同学为优,那么这组的频数就是18。
(2)频率或比例
频率就是一个总体(或者样本中),某一类别或某一小组中数据个数(即频数)占总数据个数的比重,也称为比例。例如根据测试成绩,将100个学生分为优、良、及格、不及格四个组,如果四个组人数分别为18、52、21、9,那么四个组的频率分别为0.18、0.52、0.21、0.09。比例通常用于反应总体的构成情况,一个数据中各部分比例之和为1。
(3直方图与条形图有何区别)百分比
百分比就是一个总体中某一类别或某一小组中数据个数(频数)占总体数据的比重乘以100,各个小组百分比之和为100,即频率乘以100。它是将对比的基数抽象为100而计算出来的,用
%号表示,数值表示每100个分母中包含多少个分子。上面例子中,优、良、及格、不及格四个组的百分比分别为18%、52%、21%、9%。
(4)比率
比率就是各个不同类别或小组的数值之间的比值。例如,上面例子中,优与良的比率为18/52≈0.35。
2、累积频数
累积频数就是将各类别或组的频数逐级累加起来,这样可以很清楚的看出某一类别或组以上或以下的频数之和。
3、统计图
(1)条形图:用宽度相同的条形的高度或者长短来表示数据多少的图形。条形图既可以横置也可以纵置,纵置时也可以称为柱形图。
(2)饼图:用圆形以及圆内扇形的角度来表示数值大小的统计图,也称为圆形图。
(3)环形图:是一个“空心圆”,它用环上的一段来表示总体或样本中各部分数据。
(4)直方图:就是用矩形的宽度和高度来表示频数分布的图形。
(5)折线图:以直方图为基础,把直方图顶部的中点用直线一次连接起来,然后把原有的直方图抹掉就是折线图,也称为频数多边形图。
(6)线图:在平面直角坐标系中用折线表示数量随着时间的变化趋势和特征。
二、基本方法
1、数据整理
(1)数据审核
数据的审核是指从数据的完整性、准确性、适用性及时效性等方面对数据进行检查,保障数据质量,为之后进一步的分析打下基础。即审核数据是否完整、是否真实正确、是否符合研究需要、是否之后。
(2)数据筛选
数据筛选是指将不符合要求的数据或者有明显错误的数据剔除掉,或者将某些不符合研究需要的数据剔除掉,只留下符合需要的数据。数据经过筛选后使其结果符合研究需要,为以后研究打下良好基础。
(3)数据排序
数据排序是指按照一定顺序对数据进行排列,为数据分组、分析数据提供方便。有时候数据排序本身就是分析的目的之一,例如我们对全国各省按照平均预期寿命进行排序,这样各省既可以看出自己的排序,又可以了解与其他省在生活水平、医疗水平等方面的差异。
2、数据分组
数据分组就是根据研究需要,按照某种标准将原始数据分为不同的组,分组后的数据叫做分组数据。包括单变量分组和组距分组,其中组距分组又包括等距分组和不等距分组两类。
具体分组步骤为:(1)对数据进行排序(使用计算机分组时不用排序);(2)确定分组,规律为:K=1+lgn/lg2 (其中n为数据总个数);(3)确定组距。
3、统计图绘制
(1)条形图的绘制
在绘制条形图时,如果将类别放在纵轴,即条形图横置,称为条形图;如果将类别放在横轴,即纵置,称为柱形图。绘制条形图是既可以绘制成二维平面图,也可以绘制成三维立体图。
(2)饼图的绘制
条形图主要是显示各类别中数据多少,而饼图则主要是显示总体中各类别的比例,即总体的构成问题,这对于研究结构性问题非常有用。因而,在绘制饼图时,总体中各类别所占百分比就用圆内扇形的角度表示,既可以显示各类别的频数,同时也可以显示各类别占总体的比例,更加直观形象。
(3)环形图的绘制
环形图也更形象的展示出各部分占总体的比例,即总体的构成问题。环形图既可以用频数表示,也可以用各部分占总体的百分比显示。
(4)直方图的定义
在平面直角坐标系中,我们用横轴表示数据分组,用纵轴表示频数或频率,各个组的频数与频率形成一个小矩形,就是直方图。
(5)折线图的定义
折线图的两个终点要与横轴相交,具体绘制时,将第一个矩形顶部中点与竖边中点用直线连接并延长使其与横轴相交,同样,最后一个矩形顶部中点与竖边中点连接并延长到与横轴相交。这样折线下围成的面积与原来直方图的相等,保证两者表示的频数分布是一致的。
当分组数据所分的组数越多时,组距就越小,这时绘制的折线图就会越来越光滑,逐渐形成一条平滑的曲线,这就是频数分布曲线。
(6)线图的绘制
绘制线图时一般将时间放在横轴,将指标数据放在纵轴。一般情况下,纵轴数据应从0开始,如果数据与0差距很大,可以采取折断的符号将纵轴断开。图形的长宽比例要适合,一般情况下使横轴略大于纵轴,绘成长方形。
三、其他重点难点
1、等距分组与不等距分组
在分组时,如果各组组距相等,则称为等距分组;如果各组组距不相等,则称为不等距分组。
在分析人口时,我们可以将年龄换分为0~4岁、5~9岁、10~14岁等等,每组为5岁,这就是等距分组。但有时候将人口分为婴幼儿组(0~6岁),少年儿童组(7~17岁),中青年组(18~59岁),老年人组(60岁及以上),该分类中各组组距不相等,这就是不等距分组。
2、直方图与条形图的区别
条形图与直方图都是用矩形表示,外表有些相似,但是两者是不同的。区别为:
(1)适用范围不同,条形图适用于所有类型数据,而直方图只适用于数值型数据。
(2)条形图中条形的宽度是固定的,是用条形的长度(或高度)表示各类别频数的多少;而直方图则是用矩形的面积表示各类别频数的多少,矩形的宽度和高度均有意义,宽度表示
组距,高度表示每一组的频数或频率,而且宽度是不固定的,只有等距分组时宽度是固定的。
(3)条形图中各条形是分开排列的,而直方图中由于分组数据是连续的,因而直方图的矩形通常是紧密排列的。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论