第五章学业测试
1.单选题
(1)从互联网产生大数据的角度来看,大数据具有的特征是 (      )。
A. “4V"特征:火量(Voluome)、多样(Variety)、低价值密度(Value)、
高速(Velocity )
B.样本渐趋于总体,精确让住于模糊,相关性重于因果
C.分布式存储,分布式并行计算
D.没有特征
(2)下列可以用于分析数据趋势的是 (      )。
A.饼图
B.折线图
数据可视化是什么
C.动态热力图
D.词云图
(3)数据分析的方法不包括(    )
A.线性分析
B.关联分析
C.聚类分析
D.数据分类
(4)下列关于大数据的特征,说法正确的是(      )。
A.数据价值密度高
B. 数据类型少
C.数据基本无变化
D.数据体量巨大
(5)数据特征探索的主要任务是对数据进行预处理,以下不属于该过程的是()
A.数据清洗
B.异常数据处理
C.数据缺失处理
D.数据分类处理
(6)海军军官通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能
发生的地点。这体现了大数据分析理念中的()
A.在教据基础上倾向于全体数据而不是抽样数据
B.在分析方法上更注重相关分析而不是因果分析
C.在分析效果上更追完效率而不是绝对精确
D.在数据规模上强调相对数据而不是绝对教据
(7)大数据时代已经在悄悄地改变我们的日常生活,也使人们日常生活更为便如移动支付、网络约车出行、网络购物、网络预约挂号等。以下不属于大数据分析的是(    )
A. 特征探索
B.关联分析
C.聚类与分类
D.建模分析
(8)电子警察采用拍照的方式来约束车辆的行为,其拍照的过程属于(    )
A. 数据分析
B.数据采集
C.数据分类
D.数据可视化表达
(9)某超市曾经研究销售数据,发现买商品入的人购买商品B的概率很大,这种属于数据的(      )
A.聚类分析
B.关联分析
C.分类分析
D.回归分析
(10)数据采集的基本方法包括(    )、网络数据采集法和其他数据采集法。
A.数据库采集法
B. 访问记录采集法
C. 数据目录采集法
D.系统日志采集法
(11)下列关于聚类分析的说法,错误的是(  )
A.可以从数据点集合中随机选择K个点作为初始的聚集中心
B.对其他的每个数据点,以此判断其与K个中心点的距离,距离最近的表明它属于这项聚类
C.聚类分析,必须先设定分类的标准,否则无法准确分类
D.重新计算新的聚簇集合的平均值既中心点
(12)K-平均算法属于(    )分析方法。
A.聚类
B. 关联
C.分类
D. 回归
(13)网络数据采集法,主要通过网络爬虫或网站公开API的方式获取,网络爬虫从网页的(  )开始获取。
A. HTML
B. WWW
C. URL
D. XML
(14)大数据时代,数据应用的关键是(    )
A.数据收集
B.数据存储
C.数据分析
D.数据再利用
(15)为了弘扬和传承中华民族勤俭节约的传统美德,引导同学们进步深化节约粮食的意识和行为习惯,学生会开展了“我为食堂提建议”的活动。请根据学生会开展该活动的几个步骤,排出最合理的顺序(  )
①根据数据分析结果,撰写数据分析报告,对食堂提出合理化建议;②学生会成员去学校食堂收集数据,并制作调查问卷的题目:③利用图表形式直观展示分析数据;④对问卷进行回收整理,将无效的问卷进行
剔除;⑤学生会成员对就餐同学们进行问卷调查:⑥对调查数据和食堂数据进行分析与处理。
A. ②⑤④⑥③①
B. ②①⑤③⑥①
C. ⑤②④⑥③①
D. ⑤④②③⑥①
2.思考题
(1)若要求你对本班同学喜欢看的书籍进行分类统计,并对其进行数据分析,你会如何做? 谈谈你的想法。
(2)大数据正在改变社会很多行业的工作方式,医疗大数据可以更好地为惠者服务。请
思考医疗大数据对医疗行业发展的作用。
(3)在智慧城市和智慧交通城市建设中,每天产生海量的交通大数据,这些数据为城
市、交通的管理提供决策支持。请从数据采集、数据分析、数据可视化表达三个方面,分析大数据在智慧城市和智慧交通建设中的实现方法。
(4)当用户登录某网站购买、浏览、收藏了某些书籍后、再次登录该网站时,会发现网
页上增加了“你可能感兴趣的书”以及“购买此商品的顾客也同时购买”之类的推送条目,如图5-16所示。
图5-16网站推送条目
问题1:网站给用户自动推荐商品的依据是什么? 采用了什么分析方法?
问题2:网站数据可能对用户产生哪此影响?
(5)某公司推出了嵌有多种传感器、能够测量生命体征数据的T恤,该公司称为"Fit衫”,从而使专业医护人员能够以低成本频繁监测患者体质,提供更加有效的预防性医疗保健。“Fit衫” 利用内嵌的各种传感器测量或记录用户的数据,例如利用体温传感器测量体温,利用生物电传感器收集心电、脑电数据,利用热通量传感器监测热量消耗能力……“Fit衫” 里的传感器所测得的心率、活动量以及心电图等数据可显示在平板电脑的显示器上。
问题1:请你简单描述“Fit衫”主要是通用什么方法和工具来收集数据。
问题2:在收集数据的过程中,如何才能避免侵犯他人的知识产权和隐私、请谈谈你的看法。
(6)学校使用“五能评价雷达图”,让每个同学们的道德素养、学能素养、创新素养、身
体素养、心理素养的达成度一日了然。以下是李明同学的“五能评价雷达图”,如图5-17所示。请你对李明同学的综合索质发展情况进行简述。
图5-17五能评价雷达图
(7)由大数据产生的争辩中,一部分人十分抵触将私人行为暴露在公众视野中,另一部分人却认为人类行为数据就好比自然资源,应该无私地提供给企业、政府和医疗单位等,从而革新服务和产品反哺人类。
请小组内展开讨论,谈谈你们的观点。
(8)数据可视化表达的工具多种多样,且各具特,如何选择一款适合的工具对提高学习效率至关重要。请小组内展开讨论,思考并分享其中一款数据可视化表达工具的优缺点。
3.情境题
(1)智能手环作为一种智能可穿戴设备,可以记录用户日常生活中的锻炼、睡眠、身体状况等实时数据,并利用数据给用户提供健康建议。简要分析智能手环采集数据的过程,并分析智能手环是如何利用采集的数据给子用户建议的。
图5-18智能手环

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。