第一章 绪 论
思考题
1.什么是统计学?请简要说明一下它的发展过程。 统计学是关于数据搜集、整理、归纳、分析的方法论科学。 统计学的发展主要经历了三个阶段:
(1)17 世纪中叶至 18世纪,统计学的产生和形成阶段;
(2)18 世纪末至 20 世纪中叶,统计推断方法和理论体系确立的阶段;
(3)20 世纪 50 年代以来,统计理论、方法和应用进入了一个全面发展的阶段。
2.统计学、统计数据,以及统计活动之间有什么关系? 统计活动直接影响统计数据的数量和质量; 统计学是统计实践活动的理论概括, 同 时,它又用理论和方法研究分析统计实践活动, 统计学和统计活动是理论与实践的关系。
3.统计学的研究方法有哪些,它们有怎样的关系?并举例说明。 主要方法有两个:
(1)描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说 明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2)推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体 的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者 是现代统计学的主要内容。由于现实问题中,要获得总体数据存在很大的难度,能够获 得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它 已成为统计学的核心内容。当然,描述统计的重要性不可忽略,通过它得到可靠的统计 数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得 出符合实际情况的结论。
4.简要说明总体、样本、变量的概念。 总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素; 样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素; 变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。
5.简述 SPSS 统计软件的特点和应用领域。
(1)特点: 第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标, 通过菜单命令的选择、 对话框参数设置、 点击功能按钮来完成, 不需要用户记忆大量的操作 命令。菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。
第二,具有完善的数据转换接口, 可以方便地和 Windows 其他应用程序进行数据共享和 交换。可以读取 Excel 、FoxPro 、Lotus 等电子表格和数据库软件产生的数据文件,可以读 取 ASCII 数据文件。
第三, 提供强大的程序编辑能力和二次开发能力, 方便高级用户完成更为复杂的统计分
析任务的需要,具有丰富的内部函数和统计功能。
第四, 附带丰富的数据资料实例和完善的使用指南, 为用户学习掌握软件的使用方法提
供更多的方便。软件启动后,用户可直接上网访问 SPSS公司主页获得更多的帮助和信息。
(2)应用领域:社会科学、自然科学、经济管理、商业金融、医疗卫生、体育运动等。
6.SPSS软件的数据编辑器包括哪些内容?
(1)标题栏,显示当前工作文件名称。
(2)主菜单栏,排列SPSS的所有菜单命令。
(3)工具栏,排列系统默认的标准工具图标按钮,此栏图标按钮可以通过单击 View 菜单的
Toolbars 命令选择隐藏、显示或更改。
(4)状态栏,状态栏位于 SPSS窗 口底部,它反映了工作状态。当用户将光标置于不同的区 域时或者进行不同的操作时将显示不同的内容。
(5)数据编辑栏,用户通过键盘输入的数据首先显示在这里。
(6)数据显示区域。 它是一个二维的表格, 编辑确认的数据都将在这里显示, 其中每一个矩 形格为单元格( Cell ),其中边框加黑的单元格称为选定单元格。数据显示区域的左边缘排 列观测量序号,上边缘排列要定义的各变量名。
7.调查表明, 顾客每周花在某超市蛋糕的平均费用是 30 元,他们选择经常购买蛋糕的 主要原因是该蛋糕味道很好。要求:
(1) 总体是什么?
(2) 该项研究所使用的方法是描述统计方法还是推断统计方法?
(1)总体是所有的购买蛋糕的顾客;
(2)推断统计方法。
第二章 数据整理和描述
思考题
1.获取统计数据有哪两种途径?
一种是直接向调查对象搜集反映调查单位的统计数据,一般称为原始数据或第一手数 据;另一种是搜集已经加工、整理过的、说明总体现象的数据,一般称为次级数据或 第二手数据。
2.统计数据的搜集有哪几种方法? 直接观察法、访问法、报告法、问卷法。
3.对统计数据进行搜集时,有哪几种组织方式? 普查、抽样调查、重点调查、典型调查。
4.什么是数据分组?数据分组的方式有哪几种?
(1)统计数据分组是根据统计研究目的,按某一标志将数据分别列入不同的组,使组 与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组 内各单位之间具有某些共同的特征。
(2)统计数据分组可以按品质标志分组和按数量标志分组。
一) 按品质标志分组就是按照事物的性质和属性特征进行分组。 一般来言, 按品质标
志分组的操作比较容易,分组也相对稳定。如人口按性别分组、职工按文化程度分组 等;
二)按数量标志分组,就是按照事物的数量特征进行分组。例如,企业按职工人数、 产值、产量等标志分组,人口按年龄分组等。
5.简述组距、组限、组数与组中值的含义以及它们的计算方法。
(1) 组距是指各组中最大变量值与最小变量值之差,用 i 表示。计算方法为: i=R/n, 其中,n表示组数,R表示变量最大值与最小值之差 (即全距);
(2)组限是指限定各组组距的数值。各组的较大值称上限,较小值称下限;
(3)组数是指数据被分成的组个数。计算方法为:
n 1 3.322lg N
式中:n表示组数;N表示变量值个数;
(4) 组中值是上限到下限之间的中点数值,其计算公式为: 组中值=(上限 +下限) /2
频率分布直方图和条形图的区别6.向上积累和向下积累的数据有什么区别?
累计频数 (或频率 )可以是向上累计频数 (或频率 ) ,也可以是向下累计频数 (或频率)。
(1) 向上累计频数 (或频率 ) ,通常是指由变量值小的组向变量值大的组依次累计;
(2) 向下累计频数 (或频率 ) ,通常是指由变量值大的组向变量值小的组依次累计。
7.什么是频数分布?试描述频数分布表的编制过程。
(1) 分布数列是指在统计分组的基础上,将总体的所有单位按一定标志分组整理,并 按一定顺序排列,形成总体单位在各组的分布;
(2) 一、确定变量数列的形式。 根据变量的类型和变量值的多少及现象本身的特点确定是编制单项数列还是编制组距 数列。
二、组距式变量数列编制方法: 计算全距、确定组数、确定组距、确定组限、计算组中值、计算累计频数和累计频率。
8.对统计数据进行描述时,有哪几种统计图表表达方式? 有统计表和统计图,其中统计图包括:直方图、折线图、曲线图。
9.直方图和折线图有什么区别和关系? 折线图可以在直方图的基础上,将直方图的每个长方形的顶端中点用折线连点而成。
如果不绘直方图,也可以用组中值与频数求出坐标点,连接而成。 它们与横轴围成的区域面积相等。
10.请举出自己实际生活中的一组数据,对它进行分组,然后绘制直方图、折线图以 及箱线图,分析该组数据的结构特征。
略
练习题
1.某地区7月份的气温数据(单位:摄氏度)如下:
28 | 31 32 29 31 33 30 32 34 29 | 32 30 38 | 38 37 39 34 36 | 36 33 | |
34 | 30 37 36 32 38 35 | 30 34 35 | 35 | ||
(1) | 对以上数据进行适当的分组; | ||||
⑵ | 绘制直方图,说明该城市气温分布的特点。 | ||||
解: | (1)频数分布如下:[28,30) | 3; [30,32) | 6; [32,34) 6; | [34,36) 7; [36,38) 5 | ;[38,40) |
4;
(2)直方图略。从直方图可以看出,该地区 7月份气温集中在34~36摄氏度的天数最多,其
次多的时间集中在 30~32摄氏度或32~34摄氏度。
2.某人的家位于城市的 A地,工作单位位于城市的 B地,为了确定 A、B两地的车程,他 记录了 60天(来回共乘车120次)内往返于A、B两地所花的时间(单位:分钟),所得数据如 下:
98 | 101 | 120 | 112 | 94 | 96 | 89 | 108 | 106 | 111 | 113 | 109 |
108 | 112 | 99 | 93 | 98 | 100 | 87 | 89 | 125 | 120 | 118 | 103 |
117 | 111 | 119 | 100 | 105 | 108 | 98 | 96 | 110 | 123 | 117 | 115 |
109 | 103 | 92 | 99 | 88 | 80 | 83 | 86 | 93 | 98 | 90 | 120 |
93 | 98 | 90 | 111 | 109 | 103 | 108 | 112 | 123 | 120 | 109 | 118 |
92 | 91 | 89 | 87 | 95 | 121 | 119 | 123 | 108 | 99 | 103 | 92 |
97 | 95 | 102 | 108 | 113 | 99 | 114 | 89 | 95 | 106 | 109 | 100 |
108 | 112 | 109 | 123 | 121 | 110 | 110 | 124 | 108 | 109 | 113 | 96 |
123 | 105 | 109 | 112 | 96 | 98 | 108 | 112 | 99 | 90 | 93 | 96 |
99 | 96 | 105 | 111 | 120 | 98 | 92 | 103 | 102 | 90 | 113 | 120 |
(1)利用SPSS对以上数据进行排序。
(2)以组距10进行等距分组,编制频数分布表,并绘制直方图。
解:⑴略
(2)频数分布表如下:[80,90) 10,[90,100) 37,[100,110) 33,[110,120) 25,[120,130)
15; 直方图略。
3.某百货公司冬天连续 60天的销售额数据如下(单位:万元):
372 | 338 | 403 | 321 | 286 | 357 | 328 | 309 | 329 | 318 | 368 | 349 |
369 | 372 | 353 | 380 | 331 | 347 | 302 | 308 | 383 | 326 | 329 | 333 |
342 | 349 | 351 | 324 | 369 | 362 | 370 | 319 | 342 | 356 | 393 | 382 |
401 | 396 | 377 | 379 | 380 | 356 | 352 | 349 | 363 | 370 | 321 | 316 |
322 | 320 | 336 | 343 | 389 | 369 | 375 | 398 | 359 | 364 | 354 | 350 |
(1)用SPSS对以上数据进行适当的分组,编制频率分布表。
(2)计算出累积频数和累积频率。
(3)绘制直方图和折线图。
解:(1)、(2)
分组 | 频数 | 频率分布表 | 向下累积 | 向上累积 |
[285,300) | 1 | 1/60 | 1 | 60 |
[300,315) | 3 | 1/20 | 4 | 59 |
[315,330) | 12 | 1/5 | 16 | 56 |
[330,345) | 7 | 7/60 | 23 | 44 |
[345,360) | 13 | 13/60 | 36 | 37 |
[360,375) | 11 | 11/60 | 47 | 24 |
[375,390) | 8 | 2/15 | 55 | 13 |
[390,405) | 5 | 1/12 | 60 | 5 |
⑶略。
4.为评价某餐馆服务质量,随机调查了 120个顾客对它的评价。评价服务质量的等级分为
五种:A.优;B.较好;C.中等;D.较差;E.极差。调查结果如下表所示:
A | C | C | B | D | B | E | C | D | C | A | B | D | C | C |
D | B | C | B | C | C | E | D | A | A | C | D | D | E | D |
B | B | D | C | C | D | A | B | D | E | E | B | C | C | E |
D | A | C | D | E | B | B | A | C | A | C | E | B | B | A |
B | C | C | D | E | D | E | B | A | A | C | B | C | A | E |
A | A | C | D | C | C | B | E | B | C | D | E | A | E | B |
C | C | B | E | D | C | B | A | B | E | E | D | B | A | C |
B | A | C | C | D | A | D | B | E | C | B | D | D | B | E |
(1)编制频率分布表;
(2)绘制条形图,出对该餐馆评价等级的分布。
解:(1)频率分布表如下:
评价等级 | 频数 | 频率 |
A | 19 | 19/120 |
B | 27 | 9/40 |
C | 32 | 4/15 |
D | 23 | 23/120 |
E | 19 | 19/120 |
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论