二、主观题(共4道小题) |
6. 指出下面的数据类型: (1) 年龄 数值型数据 (2) 性别 分类型数据 (3) 汽车产量 数值型数据 (4) 员工对企业某项改革措施的态度(赞成、中立、反对) 顺序数据 (5) 购买商品时的支付方式(现金、信用卡、支票) 分类数据 | |
| |
7. 某研究部门准备抽取2000个职工家庭推断该城市所有职工家庭的年人均收入。要求: (1)描述总体和样本。 总体是“该城市所以的职工家庭” 样本是“抽取的2000个职工家庭" (2)指出参数和统计量。 参数是“城市所有职工家庭的年人均收入” 统计量是“抽取的2000个职工家庭"计算出的年人均收入 | |
| |
8。 一家研究机构从IT从业者中随机抽取1 000人作为样本进行调查,其中60%回答他们的月收入在5 000元以上,50%的人回答他们的消费支付方式是用信用卡。要求: (1)这一研究的总体是什么? 总体是所有的IT从业者 (2)月收入是分类变量、顺序变量还是数值型变量? 顺序变量 (3)消费支付方式是分类变量、顺序变量还是数值型变量? 分类变量 (4)这一研究涉及截面数据还是时间序列数据? 截面数据 | |
| |
9。 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。要求: (1)这一研究的总体是什么? 总体是所有网上购物者 (2)“消费者在网上购物的原因"是分类变量、顺序变量还是数值型变量? 分类变量 (3)研究者所关心的参数是什么? 所有网上购物者的月平均花费 (4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量? 统计量 (5)研究者所使用的主要是描述统计方法还是推断统计方法? 推断统计法 第二次作业 | |
| |
二、主观题(共1道小题) |
31. 自填式、面访式、电话式各有什么长处和弱点? | |
自填式;优点:1调查组织者管理容易,2成本低,可进行大规模调查,3对被调查者,可选择方便时间答卷,减少回答敏感问题压力。缺点:1返回率低,2不适合结构复杂的问卷,调查内容有限,3调查周期长,4在数据搜集过程中遇见问题不能及时调整。 面访式;优点:1回答率高,2数据质量高,3在调查过程中遇见问题可以及时调整。缺点:1成本比较高,2搜集数据的方式对调查过程的质量控制有一定难度,3对于敏感问题,被访者会有压力。 电话式;优点:1速度快,2对调查员比较安全,3对访问过程的控制比较容易。缺点:1实施地区有限,2调查时间不能过长,3使用的问卷要简单,4被访者不愿回答时,不易劝服. | |
第三次作业 二、主观题(共5道小题) |
16。 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本.服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B | E | C | C | A | D | C | B | A | E | D | A | C | B | C | D | E | C | E | E | A | D | B | C | C | A | E | D | C | B | B | A | C | D | E | A | B | D | D | C | C | B | C | E | D | B | C | C | B | C | D | A | C | B | C | D | E | C | E | B | B | E | C | C | A | D | C | B | A | E | B | A | C | E | E | A | B | D | D | C | A | D | B | C | C | A | E | D | C | B | C | B | C | E | D | B | C | C | B | C | | | | | | | | | | |
要求: (1)指出上面的数据属于什么类型。 顺序类型 (2)用Excel制作一张频数分布表。 (3)绘制一张条形图,反映评价等级的分布。 (4)绘制评价等级的帕累托图。 | |
| |
17. 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 | 124 | 129 | 116 | 100 | 103 | 92帕累托图制作步骤excel | 95 | 127 | 104 | 105 | 119 | 114 | 115 | 87 | 103 | 118 | 142 | 135 | 125 | 117 | 108 | 105 | 110 | 107 | 137 | 120 | 136 | 117 | 108 | 97 | 88 | 123 | 115 | 119 | 138 | 112 | 146 | 113 | 126 | | | | | | | | | | |
要求: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率 按销售收入分组 | 频数 | 向下累计频数 | 向下累计频率 | 向上累计频数 | 向上累计频率 | 85~95 | 3 | 3 | 7.50% | 0 | 100.00% | 95~105 | 6 | 9 | 22。50% | 37 | 92。50% | 105~115 | 9 | 18 | 45.00% | 31 | 77.50% | 115~125 | 11 | 29 | 72。50% | 22 | 55.00% | 125~135 | 4 | 33 | 82。50% | 11 | 27。50% | 135~145 | 5 | 38 | 95.00% | 7 | 17。50% | 145~155 | 2 | 40 | 100.00% | 2 | 5。00% | | | | | | |
(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 按销售收入分组(万元) | 企业数(个) | 频率(%) | 先进企业 | 11 | 27.50% | 良好企业 | 11 | 27。50% | 一般企业 | 9 | 22.50% | 落后企业 | 9 | 22.50% | | | |
| |
| |
18。 一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下: 单位:g 57 | 46 | 49 | 54 | 55 | 58 | 49 | 61 | 51 | 49 | 51 | 60 | 52 | 54 | 51 | 55 | 60 | 56 | 47 | 47 | 53 | 51 | 48 | 53 | 50 | 52 | 40 | 45 | 57 | 53 | 52 | 51 | 46 | 48 | 47 | 53 | 47 | 53 | 44 | 47 | 50 | 52 | 53 | 47 | 45 | 48 | 54 | 52 | 48 | 46 | 49 | 52 | 59 | 53 | 50 | 43 | 53 | 46 | 57 | 49 | 49 | 44 | 57 | 52 | 42 | 49 | 43 | 47 | 46 | 48 | 51 | 59 | 45 | 45 | 46 | 52 | 55 | 47 | 49 | 50 | 54 | 47 | 48 | 44 | 57 | 47 | 53 | 58 | 52 | 48 | 55 | 53 | 57 | 49 | 56 | 56 | 57 | 53 | 41 | 48 | | | | | | | | | | |
要求: (1)构建这些数据的频数分布表。 重量(g) | 频率 | 比率(%) | 向上累计 | 40—45 | 8 | 8 | 8 | 45—50 | 37 | 37 | 45 | 50—55 | 34 | 34 | 79 | 55-60 | 18 | 18 | 97 | 60—65 | 3 | 3 | 100 | 合计 | 100 | 100 | 100 | | | | |
(2)绘制频数分布的直方图。 (3)说明数据分布的特征。 答:由图表可知食品重量主要是分布在45—55之间,它的分布呈现两头小中间大的钟形分布中的偏态分布,符合正常的分布规律。 | |
| |
19。 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下: 考试成绩 | 人数 | 甲班 | 乙班 | 优 良 中 及格 不及格 | 3 6 18 9 4 | 6 15 9 8 2 | | | |
要求: (1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。 (2)比较两个班考试成绩分布的特点。 从上面的图形可以看出,甲班同学的成绩主要分布在中,乙班同学的成绩主要分布在良;甲班的不及格人数比乙班不及格人数多。 (3)画出雷达图,比较两个班考试成绩的分布是否相似。 从上图可知,甲乙班的考试成绩是不相似的。 | |
| |
20。 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算): 单位:亿元 年份 | 国内生产总值 | | 第一产业 | 第二产业 | 第三产业 | 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 | 58478.1 67884.6 74462.6 78345.2 82067.5 89468.1 97314.8 105172.3 117390.2 136875.9 | 11993 13844.2 14211.2 14552.4 14471.96 14628.2 15411.8 16117.3 16928.1 20768.07 | 28538 33613 37223 38619 40558 44935 48750 52980 61274 72387 | 17947 20428 23029 25174 27038 29905 33153 36075 39188 43721 | | | | | | | | | | | | |
要求: (1)用Excel绘制国内生产总值的线图。 (2)绘制第一、二、三产业国内生产总值的线图。 (3)根据2004年的国内生产总值及其构成数据绘制饼图。 | |
| |
第四次作业 二、主观题(共7道小题) |
18。 随机抽取25个网络用户,得到他们的年龄数据如下: 单位:周岁 19 | 15 | 29 | 25 | 24 | 23 | 21 | 38 | 22 | 18 | 30 | 20 | 19 | 19 | 16 | 23 | 27 | 22 | 34 | 24 | 41 | 20 | 31 | 17 | 23 | | | | | |
要求; (1)计算众数、中位数: Mo=19和23;Me=23 (2)根据定义公式计算四分位数。 QL=19,QU=26。5 (3)计算平均数和标准差; (4)计算偏态系数和峰态系数: (5)对网民年龄的分布特征进行综合分析: 样本数据的均值是24岁,单标准差较大,说明网民年龄之间差异较大;从偏值和峰度系数来看,网民年龄呈现右偏尖峰分布。 | |
| |
19. 某银行为缩短顾客到银行办理业务等待的时间.准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式的等待时间(单位:分钟)如下: 5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 要求: (1)画出第二种排队方式等待时间的茎叶图。 (2)计算第二种排队时间的平均数和标准差。 (3)比较两种排队方式等待时间的离散程度。 因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式, 得第一种排队方式的离散系数为0.274;第二种排队方式的离散系数为0。102,所以第一种排队方式等待的离散程度大于第二种排队方式。 (4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。 选择第二种,因为平均等待时间短,而且离散程度小。 | |
| |
20。 在某地区抽取120家企业,按利润额进行分组,结果如下: 按利润额分组(万元) | 企业数(个) | 200~300 300~400 400~500 500~600 600以上 | 19 30 42 18 11 | 合 计 | 120 | | |
要求: (1)计算120家企业利润额的平均数和标准差。 平均数是426。67,标准差是116.48. (2)计算分布的偏态系数和峰态系数. | |
| |
21. 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg.请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? 女生的体重差异大,因为女生体重的离散系数为0.1,男生体重的离散系数为0.08。 (2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。 (3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间? 男生中有68%的人体重在55kg一65kg之间 (4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间? 女生中有95%的人体重在40kg一60kg之间 | |
| |
22。 一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制? 时间 | 周一 周二 周三 周四 周五 周六 周日 | 产量(件) | 3 850 3 670 3 690 3 720 3 610 3 590 3 700 | | |
| |
| |
用标准分数判断: 时间 | 周一 | 周二 | 周三 | 周四 | 周五 | 周六 | 周日 | 标准化值 | 3 | -0.6 | -0。2 | 0。4 | —1.8 | —2.2 | 0 | | | | | | | | |
周一和周六失去控制 23. 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量: 单位:个 方法A | 方法B | 方法C | 164 167 168 165 170 165 164 168 164 162 163 166 167 166 165 | 129 130 129 130 131 ]30 129 127 128 128 127 128 128 125 132 | 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125 | | | |
要求: (1)你准备采用什么方法来评价组装方法的优劣? 方法A组装优先理由是平均数较大,离散数较小,分布较为紧密,分析较方便,具有代表性。 (2)如果让你选择一种方法,你会作出怎样的选择?试说明理由。 我选第一种,单位时间的产量是后面第二种的130%,最小值也比后面的最大值高出很多,很明显生产效率很高,作为老板必须选这个的,前提是产品质量必须一样。 | |
| |
| |
发表评论