第1章 统计与统计数据
1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章 数据的图表展示
2.1(1) 属于顺序数据。
(2)频数分布表如下
服务质量等级评价的频数分布
服务质量等级
家庭数/频率
频率/%
A
14
14
B
21
21
C
32
32
D
18
18
E
15
15
合计
100
100
  (3)条形图(略)
  (4)帕累托图(略)。
2.2(1)频数分布表如下
40个企业按产品销售收入分组表
按销售收入分组
/万元
企业数
/个
频率
/%
向上累积
向下累积
企业数
频率
企业数
频率
100以下
100~110
110~120
120~130
130~140
140以上
5
9
12
7
4
3
12.5
22.5
30.0
17.5
10.0
7.5
5
14
26
33
37
40
12.5
35.0
65.0
82.5
92.5
100.0
40
35
26
14
7
3
100.0
87.5
65.0
35.0
17.5
7.5
合计
40
100.0
  (2)某管理局下属40个企分组表
按销售收入分组/万元
帕累托图制作步骤excel
企业数/个
频率/%


先进企业
良好企业
一般企业
落后企业
11
11
9
9
27.5
27.5
22.5
22.5
合计
40
100.0
2.3频数分布表如下
某百货公司日商品销售额分组表
按销售额分组/万元
频数/天
频率/%
25~30
30~35
35~40
40~45
45~50
4
6
15
9
6
10.0
15.0
37.5
22.5
15.0
合计
40
100.0
    直方图(略)。
2.4茎叶图如下
数据个数
1
8
8
9
3
2
0
1
1
3
3
6
8
8
8
9
9
9
12
3
1
3
5
6
9
5
4
1
2
3
6
6
7
6
5
0
1
2
7
4
  箱线图(略)。
2.5(1)排序略。
(2)频数分布表如下
              100只灯泡使用寿命非频数分布
按使用寿命分组/小时
灯泡个数/只
频率/%
650~660
2
2
660~670
5
5
670~680
6
6
680~690
14
14
690~700
26
26
700~710
18
18
710~720
13
13
720~730
10
10
730~740
3
3
740~750
3
3
合计
    (3)直方图(略)。 
(4)茎叶图如下
65
1
8

66
1
4
5
6
8
67
1
3
4
6
7
9
68
1
1
2
3
3
3
4
5
5
5
8
8
9
9
69
0
0
1
1
1
1
2
2
2
3
3
4
4
5
5
6
6
6
7
7
8
8
8
8
9
9
70
0
0
1
1
2
2
3
4
5
6
6
6
7
7
8
8
8
9
71
0
0
2
2
3
3
5
6
7
7
8
8
9
72
0
1
2
2
5
6
7
8
9
9
73
3
5
6
74
1
4
7
2.6(1)频数分布表如下
按重量分组
频率/包
40~42
2
42~44
3
44~46
7
46~48
16
48~50
17
52~52
10
52~54
20
54~56
8
56~58
10
58~60
4
60~62
3
合计
100
(2)直方图(略)。
(3)食品重量的分布基本上是对称的。
2.7(1)频数分布表如下
按重量误差分组
频数/个
10~20
0
20~30
5
30~40
7
40~50
8
50~60
13
60~70
9
70~80
6
80~90
2
合计
50
    (2)直方图(略)。
2.8(1)属于数值型数据。
(2)分组结果如下
分组
天数/天
-25~-20
6
-20~-15
8
-15~-10
10
-10~-5
13

-5~0
12
0~5
4
5~10
7
合计
    (3)直方图(略)。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10(1)茎叶图如下
A班
树茎
B班
数据个数
树 叶
树叶
数据个数
0
3
59
2
1
4
4
0448
4
2
97
5
122456677789
12
11
97665332110
6
011234688
9
23
98877766555554443332100
7
00113449
8
7
6655200
8
123345
6
6
632220
9
011456
6
0
10
000
3
(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
2.11(略)。
2.12(略)。
2.13(略)。
2.14(略)。
2.15箱线图如下:(特征请读者自己分析)
第3章 数据的概括性度量
3.1 (1)
(2)
(3)
(4)左偏分布。
3.2 (1)
(2)
(3)
(4)
(5)略。
3.3 (1)略。
(2)
(3)
(4)选方法一,因为离散程度小。
3.4 (1)=274.1(万元);Me=272.5 。
(2)QL=260.25;QU=291.25。
(3)(万元)。
3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
3.6 (1)=426.67(万元);(万元)。
(2)
3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。
3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。
    (2) 男生:=27.27(磅),(磅);
          女生:=22.73(磅),(磅);
    (3)68%;
(4)95%。
3.9 通过计算标准化值来判断,,说明在A项测试中该应试者比平均分数高
出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。
3.10 通过标准化值来判断,各天的标准化值如下表
日期
周一
周二
周三
周四
周五
周六
周日
标准化值Z
3
-0.6
-0.2
0.4
-1.8
-2.2
0
周一和周六两天失去了控制。
3.11 (1)离散系数,因为它消除了不同组数据水平高地的影响。
    (2)成年组身高的离散系数:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。