数据分析练习题
一.选择题(共17小题)
1.“抖音”APP 会针对用户喜好推送视频。该推送功能是基于对大数据的分析,在进行大数据分析时不需要的操作是(  )
A.收集、分析用户在不同视频上停留的时间   
B.分析关键词所属的视频类别   
C.采集用户搜索的关键词   
D.统计用户使用抖音的时间
2.一份有效的数据分析报告,能够帮助用户(  )
A.了解事物发展现状,预判事物发展趋势   
B.有效判断所需解决问题的影响因素   
C.有针对性地选择解决问题的方案   
D.以上都是
3.某市交通部门对12路公交线一天内不同时段客流量进行分析,以便高峰时段提高该公交线路出行频次来缓解压力。此过程使用了下列哪种数据分析(  )
A.对比分析    B.平均分析    C.聚类分析    D.关联分析
4.如图所示,使用的数据分析基本方法是(  )
A.对比分析法    B.平均分析法    C.结构分析法    D.统计分析法
5.(  )是项目研究结果的展示,也是数据分析结论的有效承载形式。
A.数据分析    B.数据可视化表达   
C.数据分析报告    D.数据运算
6.以下哪一个选项不是数据分析主要应用场景。(  )
A.现状分析    B.数据运算    C.原因分析    D.预测分析
7.数据分析的常见方法包括(  )
A.对比分析、关联分析、平均分析   
B.对比分析、平均分析、交叉分析   
C.交叉分析、关联分析、平均分析   
D.关联分析、对比分析、交叉分析
8.如图所示是李琳上学期的成绩,求平均分并做对比后,她选择等级考的科目为物理化学和历史三科,用到的数据分析法是(  )
A.对比分析法、结构分析法   
B.结构分析法、平均分析法   
C.平均分析法、对比分析法   
D.图表分析法、结构分析法
9.下列关于数据分析报告叙述错误的是(  )
A.数据分析报告是项目研究结果的展示   
B.数据分析报告是数据分析结论的有效承载形式   
C.通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来   
D.数据分析报告不能为决策者提供科学、严谨的决策依据
10.某男同学的体重80KG,身高170cm,请问,以下能用来判断该同学偏肥或偏瘦最有效的数据分析方法是(  )
A.聚类分析    B.关联分析    C.数据分类    D.以上都不行
11.字节跳动公司的抖音APP利用强大的算法对用户观看内容的大数据进行分析,为用户提供适合用户需求的内容。其算法对数据处理的过程属于(  )
A.数据分析    B.数据采集   
C.数据分类    D.数据可视化表达
12.数据分析的处理工具错误的(  )
A.Access    路由器telnet命令B.Excel    C.python    D.SQL
13.对学生的期末考试成绩进行数据分析,下列软件中比较合适的是(  )
A.Word    B.Excel    C.Photoshop    D.Flash
14.大数据时代,数据应用的关键是(  )tcpip协议分别是tcp ip体系结构中的什么协议
A.数据收集    B.数据存储    C.数据分析    D.数据再利用
15.下列关于聚类分析的说法,错误的是(  )
A.可以从数据点集合中随机选择K个点作为初始的聚集中心   
B.对其他的每个数据点,以此判断其与K个中心点的距离,距离最近的表明它属于这项聚类   
C.聚类分析,必须先设定分类的标准,否则无法准确分类   
D.重新计算新的聚簇集合的平均值既中心点
16.要对学生的期中考试成绩进行数据分析,比较合适的软件是(  )
A.Photoshop    B.WPS    C.Excel    D.Word
17.大数据时代已经在悄悄地改变我们的日常生活,也使人们日常生活更为便捷,如移动支付、网络约车出行、网络购物、网络预约挂号等。以下不属于大数据分析的是(  )
A.特征探索    抖音python入门教程B.关联分析    C.聚类与分类    D.建模分析
二.多选题(共1小题)
(多选)18.要对学生的期中考试成绩进行数据分析,比较合适的软件是(  )
A.Word    B.Excel    C.Photoshop    D.WPS
三.填空题(共1小题)
19.数据分析方法中,     就是分析并发现存在于大量数据之间的关联性或者相关性,从而描述一个事物中某些属性同时出现的规律和模式。
四.判断题(共3小题)
20.贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法,利用朴素贝叶斯算法可以实现新闻敏感词的屏蔽功能。贝叶斯分类属于大数据分析技术中的数据分类技术。      (判断对错)
21.多媒体课件属于数字化可视化表达工具的 keypress是什么意思中文     (判断对错)
22.特征探索、关联分析、聚类与分类和建立模型等都属于数据分析。      (判断对错)
五.简答题(共2小题)
23.项目:探究高一各学科相关性分析
[项目情境]
在信息化浪潮的推动下,互联网技术不断发展,云计算、移动互联网、大数据和人工智能
等新兴技术崭露头角。使用数据挖掘相关技术对中学教学活动中产生的数据进行收集与处理,获取有利于教学的相关信息,也是推进智慧教育的举措之一。在教学过程中,学科考试成绩能够在一定程度反映学生的认知发展水平,某校对高一年级学生的成绩进行数据处
理,分析各学科之间的关联度出优势学科,对教学及学生选科有重要的参考价值。
[项目综述]
(一) 概述项目目的、方法和过程。根据要求,回答问题。
(1)数据分析需要使用恰当的方法和工具,对数据进行各种分析。我们可以通过      寻数据之间的关联性或相关性,可以通过      在分类标准未知的情况下进行数据自动分类,可以根据分类准则通过      对未知数据进行预测。(选填:数据分类、关联分析、聚类分析)
(2)本项目主要通过模拟大数据采集与分析方法,采用      (选填:数据分析、关联分析、聚类分类)的方法进行数据分析,试图分析高一年级学生各 学科之间的关联度,出两到三门优势学科,作为指导教学及学生选科的重要参考依据。
(3)确定需要收集的数据为历年高一年级期中期末的各学科成绩,在数据收集、发布、传播、共享时,为保护学生的隐私应采用      (选填:数据精度处理、人工干扰、匿名处理、访问控制)等技术手段。
(4)选用Python语言作为数据分析工具,需要通过调用诸如标准模块、自定义模块以及第三方扩展库的支持,从而高效的完成数据采集处理、分析、可视化。数据分析步骤有数据呈现数据分类/关联分析/聚类分析数据采集分析报告数据预处理,正确的顺序是      。(写出序号即可)
[项目实施]
(一)数据采集与预处理
Ⅰ、(24分)图1﹣1为记录历年高中各科成绩的部分文件,图1﹣2为获取所有高一成绩并写人指定文件“高﹣考试成绩总.xlsx“的部分程序代码。图1﹣3为获取的高一考试成绩的部分数据内容。根据要求,回答问题。
(1)观察图1﹣2,该程序用      结构嵌套      结构(选填:顺序、选择、循环)描述算法,实现从若干个xlsx文件中筛选出高一成绩并保存 为数据文件,其中在Python语言中表示判断数据大小关系的运算符“==”表示       ( 选填:不等于等于)。补充程序代码中缺失的语句,应在下划线处填写      
(2)对采集的数据进行有效存储,以便对数据进行分析和使用。海量的数据几乎包含一切形式的结构化、半结构化以及非结构化的数据。网络中的音视频、图片、地理位置、网络日志等数据属于      数据,如图1﹣3,“高一考试成绩总.xlsx“中的数据属于      数据。(选填:结构化、非结构化)
(3)在数据分析之前,需要运用      方法(选填:特征探索、关联分析、聚类分析、数据分类)对数据进行预处理,发现和处理缺失值以保证数据的完整,还需要对异常数据进行清理,分析是否有冗余数据等。观察图1﹣3,“201”属于      数据,虚线部分属于      数据(选填:缺失值、异常值、冗余值),应当删除数据所在      (选填:行、列)。
(4)观察图1﹣3表格的数据,在收集数据的过程中,你认为哪些数据可以不采集?为什么?
(二)数据分析与可视化
Ⅱ.(14分)运用Python语言编程进行数据分析与可视化表达,分析部分结果如图2﹣1、2﹣2。根据要求,回答问题。
(1)观察图2﹣1,该校学生地理物理生物同时优秀的概率最      ,政治、物理、化学同时优秀的概率较低。
(2)为便于理解数据之间的关系,使用数据可视化工具可以图表形式直观呈现。如折线图可以表示关于      的分析、散点图可以表示关于      的分析、数据地图可以表示关于    
西北工业大学遭美国nsa网络攻击 的分析(选填:逻辑关系、空间关系、趋势)。如图2﹣2所示选用      图将数据分析可视化呈现。
(3)下列关于数据可视化的描述中,正确的是      。(多选)
A.可视化也可以将数据以地图、动画等形式表示
B.可视化可以有效提升数据分析的效率
C.可视化可以让人们快速抓住要点信息
D.可视化可以帮助人们发现数据背后的价值
(三)分析报告
Ⅲ.(7分)在数据分析中,使用数据可视化工具可以直观的呈现数据之间的关系,寻数据之间的内在规律,最终实现数据的应用。
(1)观察图2﹣2,说说你从图中发现了什么?挖掘出哪些信息?
(2)结合自己的学习和生活,谈一谈数据的重要性。(100字左右)
24.若要求你对本班同学喜欢看的书籍进行数据分析,并得出结论,请选择下面一个项目主题,应用所学知识,完成项目要求。
(1)对本班学生阅读书籍的类别进行数据分析,并得出结论。
论坛类的asp代码(2)对本班学生阅读书籍的时长分配(小时)进行数据分析,并得出结论。
(3)对本班学生书籍阅读量与学业成绩之间的关系进行数据分析,并得出结论。
参考答案
一.选择题(共17小题)
1.D; 2.D; 3.A; 4.C; 5.C; 6.B; 7.B; 8.C; 9.D; 10.C; 11.A; 12.C; 13.B; 14.C; 15.C; 16.C; 17.D;
二.多选题(共1小题)
18.BD;
三.填空题(共1小题)
19.关联分析;
四.判断题(共3小题)
20.√; 21.×; 22.√;
五.简答题(共2小题)
23.关联分析;聚类分析;数据分类;关联分析;匿名处理;③⑤②①④;循环;选择或分支;等于;”高一”;非结构化;结构化;特征探索;异常值;缺失值;行;高;趋势;逻辑关系;空间关系;柱形(状);ABCD;
24.从项目需求分析、数据采集、数据保存、数据预处理、数据分析、数据可视化表达等六方面回答。
【项目需求分析】:需要采集的项目数据。例如:书名、图书类别、出版时间、来源(网购、书店购买、图书馆借阅、向他人借阅)、同学姓名、性别、选择图书的理由、阅读图书的时间分布、、、

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。