绪论单元测试
1.本课程中关于大数据处理与分析部分的学习内容有:( )
A:Mapreduce的编程模型
B:大数据分析的常用算法
C:大数据分析过程
D:大数据分析分析工具
答案:ABCD
A:Mapreduce的编程模型
B:大数据分析的常用算法
C:大数据分析过程
D:大数据分析分析工具
答案:ABCD
第一章测试
2.大数据的基本特征包括( )。
A:数据的价值密度但商业价值高
B:数据增长速度快
C:数据来源和数据数据类型多样化
D:数据规模大
答案:ABCD
A:数据的价值密度但商业价值高
B:数据增长速度快
C:数据来源和数据数据类型多样化
D:数据规模大
答案:ABCD
3.下面说法正确的是( )。
A:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称
B:大数据是第三次信息化浪潮以后产生的数据
C:大数据就是数据容量达到1T以上的数据
D:大数据指数据而不包括数据的分析结果
二维数组下标怎么理解答案:A
A:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称
B:大数据是第三次信息化浪潮以后产生的数据
C:大数据就是数据容量达到1T以上的数据
D:大数据指数据而不包括数据的分析结果
二维数组下标怎么理解答案:A
4.下面哪些技术属于大数据技术。( )
A:快速传输数据的技术。
B:网盘数据存储技术
C:从各种数据源中采集数据的技术。
D:人脸识别技术。
答案:ABC
A:快速传输数据的技术。
B:网盘数据存储技术
C:从各种数据源中采集数据的技术。
D:人脸识别技术。
答案:ABC
5.如何理解“大数据分析是相关性分析而不是因果分析”。( )
A:不仅要知其然,还要知其所以然。
A:不仅要知其然,还要知其所以然。
B:不仅要进行相关分析分析,也要进行因果关系分析。
C:发现两个现象的相关性后,经过进一步深入研究,出因果关系,就会实现技术创新。
D:相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。
答案:ABCD
C:发现两个现象的相关性后,经过进一步深入研究,出因果关系,就会实现技术创新。
D:相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。
答案:ABCD
6.大数据的特征Variety是指:( )
A:数据变化多端
B:数据来源广泛
C:数据格式多样
D:数据用途丰富
答案:BC
A:数据变化多端
B:数据来源广泛
C:数据格式多样
D:数据用途丰富
答案:BC
第二章测试
7.在Python中,语句print(3 < 5 > 2)的输出结果为False。( )
A:错
B:对
A:错
B:对
答案:A
8.已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。( )
A:对
B:错
答案:A
A:对
B:错
答案:A
9.扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来合并数据。( )
A:对
B:错
答案:B
A:对
B:错
答案:B
10.已知x = [1,2]和y = [3,4],那么x+y的结果是( )。
A:3
B:7
C:[4, 6]
A:3
B:7
C:[4, 6]
D:[1, 2, 3, 4]
答案:D
答案:D
11.Pandas中常用的数据结构包括( )。
A:Panel
B:List
C:DataFrame
D:Series
答案:ACD
A:Panel
B:List
C:DataFrame
D:Series
答案:ACD
第三章测试
12.文件系统的优点不包括( )。
A:文件的逻辑结构与物理结构脱钩,具有了一定的独立性
B:操作系统为用户使用文件提供了友好界面
C:用户的程序与数据可分别存放在外存储器上,实现以文件为单位的数据共享
D:数据的组织不存在大量的数据冗余
A:文件的逻辑结构与物理结构脱钩,具有了一定的独立性
B:操作系统为用户使用文件提供了友好界面
C:用户的程序与数据可分别存放在外存储器上,实现以文件为单位的数据共享
D:数据的组织不存在大量的数据冗余
答案:D
13.数据仓库的主要特点( )。
A:集成性
B:分布式存储
C:面向主题
D:相对稳定
答案:ACD
A:集成性
B:分布式存储
C:面向主题
D:相对稳定
答案:ACD
14.NoSQL即“不是SQL”,非关系型数据库,是对不同于传统的关系型数据库的统称。( )
A:错
B:对
答案:A
A:错
B:对
答案:A
15.Hadoop应用在以下方面?( )。
A:能源开采
B:移动数据
A:能源开采
B:移动数据
C:在线旅游
D:电子商务
答案:ABCD
D:电子商务
答案:ABCD
16.MongoDB采用BSON(Binary JSON)来进行文档的存储与编码传输,BSON支持的常见数据类型包括?( )。
A:ObjectID
B:Time
C:Arrays
D:Double
答案:ACD
A:ObjectID
B:Time
C:Arrays
D:Double
答案:ACD
第四章测试
17.根据处理时间的要求,可以把业务划分为:( )
A:离线业务
B:近线业务
A:离线业务
B:近线业务
C:其余选项都是
D:在线业务
答案:C
D:在线业务
答案:C
18.下面哪些技术属于数据融合技术?( )
A:特征编码
B:数据规约
C:数据归一化处理
D:特征离散化
E:统一计量单位
F:统一数据编码
答案:BCEF
A:特征编码
B:数据规约
C:数据归一化处理
D:特征离散化
E:统一计量单位
F:统一数据编码
答案:BCEF
19.以下不属于聚类分析的算法有:( )
A:模糊算法
B:层次聚类算法
A:模糊算法
B:层次聚类算法
C:K-Means算法
D:线性回归算法
答案:D
D:线性回归算法
答案:D
20.Hadoop MaReduce中的Map和Reduce阶段的输入输出都是<key, value>键值对形式。( )
A:对
B:错
答案:A
A:对
B:错
答案:A
21.监督学习是最常见的机器学习问题之一,监督学习算法进一步可以分为分类问题与回归问题两大类。( )
A:对
B:错
答案:A
A:对
B:错
答案:A
第五章测试
22.市场上已经出现了很多数据可视化软件和工具,下面不是大数据可视化工具的是( )。
A:Echarts
B:Tableau
C:Premiere
D:Excel
答案:C
A:Echarts
B:Tableau
C:Premiere
D:Excel
答案:C
23.科学可视化一般分为( )。
A:体可视化
B:颜可视化
C:流场可视化
D:大规模数据可视化
答案:ACD
A:体可视化
B:颜可视化
C:流场可视化
D:大规模数据可视化
答案:ACD
24.可视化是对数据的透彻理解、深入分析和综合采集,主要包括以下哪些环节。( )。
A:数据获取
A:数据获取
B:数据处理
C:可视化模式
D:可视化应用
答案:ABCD
C:可视化模式
D:可视化应用
答案:ABCD
25.信息可视化一般适用于大规模非数字型信息资源的可视化表达。( )
A:对
B:错
答案:A
A:对
B:错
答案:A
26.我们没有办法改变标签云的形状。( )
A:错
B:对
答案:A
A:错
B:对
答案:A
第六章测试
27.CRISP-DM的方案实施主要工作内容是:( )
A:设计算法和模型,进行大数据分析。
B:组织开发阶段开始分析程序的开发
C:收集数据并进行数据预处理。
D:固化可重复的分析过程并发布结果
答案:D
A:设计算法和模型,进行大数据分析。
B:组织开发阶段开始分析程序的开发
C:收集数据并进行数据预处理。
D:固化可重复的分析过程并发布结果
答案:D
28.CRISP-DM适合于什么样的人?( )。
A:大数据用户和大数据开发的IT人员
B:大数据用户
C:大数据管理人员
D:大数据开发的IT人员
答案:A
A:大数据用户和大数据开发的IT人员
B:大数据用户
C:大数据管理人员
D:大数据开发的IT人员
答案:A
29.“全校最热门图书分析”这属于以下哪些主题?( )。
A:个性化图书推荐
A:个性化图书推荐
B:面向读者或图书管理人员的服务
C:借阅信息分析
D:知识问答
答案:BC
C:借阅信息分析
D:知识问答
答案:BC
30.DataFrame.describe函数可以为我们提供哪些信息。( )
A:通过unique查看不重复的离散值数目,可以知道是否需要云重复值
B:通过count提供每一列非空值的数量,各列相互比较就要可以知道是否存在空值
C:通过top可以统计出现次数最多的离散值,直接判断哪些书的借阅次数最多
D:对数据有一个描述性统计概貌。
E:通过freq可以知道出现次数最多的的值出现的次数
答案:ABCDE
A:通过unique查看不重复的离散值数目,可以知道是否需要云重复值
B:通过count提供每一列非空值的数量,各列相互比较就要可以知道是否存在空值
C:通过top可以统计出现次数最多的离散值,直接判断哪些书的借阅次数最多
D:对数据有一个描述性统计概貌。
E:通过freq可以知道出现次数最多的的值出现的次数
答案:ABCDE
31.关于主题词,下面哪些说法是正确的。( )
A:如果一个词条在某个图书分类中出现的频次很多,而在其它分类中出现的次数很少,这个词条可能是主题词。
A:如果一个词条在某个图书分类中出现的频次很多,而在其它分类中出现的次数很少,这个词条可能是主题词。
B:一本最多只能有2个主题词。
C:如果一个词条在多个分类中都现出,则认为是通用词,不是主题词。
D:一本文学类书籍可以有多个主题词。
答案:AC
C:如果一个词条在多个分类中都现出,则认为是通用词,不是主题词。
D:一本文学类书籍可以有多个主题词。
答案:AC
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论