第一章测试
1.大数据的英文描述是( )
A:Big data
B:Large data
C:Great data
D:Heavy data
答案:A
2.下面最大的储存单位是( )
A:TB
B:KB
C:PB
D:GB
答案:C
3.大数据之父是( )
A:维克托·迈尔-舍恩伯格
B:姚期智
C:查尔斯·巴赫曼
D:詹姆斯·高斯林
答案:A
4.大数据的特点包括( )
A:Value
B:Variety
C:Velocityhbase属于什么数据库
D:Volume
答案:ABCD
5.第一次正式提出大数据概念和第一次用社会调查的方式分析大数据对人们生活影响的期刊是( )和( )
A:Science
B:PNAS
C:Nature
D:Cell
答案:AC
6.大数据是只和互联网相关的计算机技术。
A:错
B:对
答案:A
7.企业中大部分的数据都是非结构化数据。
A:对
B:错
答案:A
8.大数据技术的基础是由阿里巴巴首先提出的。
A:错
B:对
答案:A
9.大数据人才需要数学、统计学、数学分析、商业分析和自然语言处理的多方面的学习。
A:对
B:错
答案:A
10.大数据对网络安全没有威胁。
A:错
B:对
答案:A
第二章测试
11.目前,企业的数据架构存在的最大比例问题是( )
A:运营成本高
B:高耗能
C:拓展性差
D:资源利用率低
答案:C
12.目前,企业数据分析处理面临的主要问题是缺少数据全方位分析方法。
A:错
B:对
答案:B
13.地图导航根据以往的行程记录,绘制了最优路程,标明了可能堵车的地点,这表现了大数据分析理念中的( )
A:注重相关性而不是因果性
B:注重效率而不是准确
C:注重相对性而不是绝对性
D:注重全体而不是局部
答案:A
14.最早提出大数据研发计划的国家是( )
A:日本
B:美国
C:中国
D:法国
答案:B
15.大数据可能被运用的行业有( )
A:医疗
B:农业
C:金融
D:教育
答案:ABCD
16.2015年9月18日云南省启动我国首个大数据综合试验区的建设工作。
A:对
B:错
答案:B
17.大数据的价值密度很高。
A:对
B:错
答案:B
18.日本政府将IT产业,尤其是大数据及云计算作为促进经济增长,解决内部矛盾一个关键。
A:对
B:错
答案:A
19.非结构化数据对企业也富有价值。
A:对
B:错
答案:A
20.企业的日数据生成量可达到1TB。
A:对
B:错
答案:A
第三章测试
21.HDFS中文件存储的基本节点是( )
A:BaseNode
B:NameNode
C:DataNode
D:WholeNode
答案:C
22.下面不属于ETL的功能是( )
A:加载
B:转换
C:抽取
D:翻译
答案:D
23.自然语言处理的范畴包括( )
A:关联分析
B:机器翻译
C:离值检测
D:中文自动分词
答案:BD
24.Apache Hadoop所涉及的核心技术包括( )
A:HDFS
B:EMC
C:Hbase
D:MapReduce
答案:ACD
25.HDFS的主要结构包括( )
A:DataNode
B:Client
C:Server
D:NameNode
答案:ABD
26.下列算法中属于聚类算法的是( )
A:Apriori
B:k-distance
C:DBSCAN
D:K-means
答案:CD
27.Hadoop可以运行在任何普通的PC机上。
A:错
B:对
答案:B
28.Client是获取分布式文件的应用程序
A:错
B:对
答案:B
29.Hadoop是一种集中式存储和计算技术。
A:错
B:对
答案:A
30.聚类之前的样本没有类别
A:错
B:对
答案:B
第四章测试
31.Modeler在2009年被( )收购后对产品的性能和功能进行了大幅度的改进和提升。
A:微软
B:谷歌
C:IBM
D:苹果
答案:C
32.Modeler数据挖掘功能将复杂的统计方法和( )技术结合到一起。
A:软件工程
B:机器学习
C:信息安全
D:大数据
答案:B
33.Modeler可以将模型保存为( )的通用格式,支持对其进行二次开发。
A:PB
B:CKPT
C:PKL
D:PMML
答案:D
34.下面( )是基本数据流的节点。
A:导入节点
B:变量文件节点
C:导出节点
D:选择节点
答案:BCD
35.Modeler中的常用节点选项面板包括:( )。
A:字段选项
B:建模选项
C:图形选项
D:源
E:记录选项
答案:ABCDE
36.Modeler和Statistics是相互独立的两个数据分析软件。
A:错
B:对
答案:A

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。