《大数据技术原理及应用》题目--688IT编程网

大数据技术原理与应用

第一卷

一:判断题（每小题5分）

1:对于大数据而言，最基本、最重要的要求就是减少错误、保证质量。因此，大数据收集的信息量要尽量精确。

A:对 B:错

答案：B

2:Spark是一个高效的分布式计算系统，它有MapReduce所有优点，同时性能与Hadoop一样高。

A:对 B:错

答案：B

3:信息生命周期管理是据生命周期管理的来源，最早由英国企业提出。

A:对 B:错

答案：B

4:简单随机抽样，是从总体 N 个对象中任意抽取 n 个对象作为样本，最终以这些样本作为调查对象。在抽取样本时，总体中每个对象被抽中为调查样本的概率可能会有差异。

A:对 B:错

答案：B

5:大数据预测能够分析和挖掘出人们不知道或没有注意到的模式，确定判断事件必然会发生。

A:对 B:错

答案：B

二:单选题（每小题5分）

6:数据清洗的方法不包括______

A缺失值处理 B噪声数据清除 C一致性检查 D重复数据记录处理

答案：D

7:大数据的基本特征不包括______

A数据量大 B数据类型繁多 C处理速度快 D价值密度高

答案：D

8:HDFS中当前block大小为128M，如果当前要上传到HDFS中的文件大小为300M，那么在存储时会分配_______个block进行存储

A1 B2 C3 D4

答案：C

9:下列______程序通常与NameNode在一个节点启动

hbase工作原理A SecondNameNode B DataNode C TaskTracker D JobTracker

答案：D

10:配置Hadoop时，JAVA_HOME包含在______配置文件中

l B hadoop-env.sh l D configuration.xs

答案：B

11:在数据生命周期管理实践中______是执行方法

A数据存储和备份规范 B数据管理和维护 C数据价值发觉和利用 D数据应用开发和管理

答案：B

12:HBase系统基本架构中主服务器Master的作用是______

A包含访问HBase的接口，同时在缓存中维护着已经访问过的Region位置信息，用来加快后续数据访问过程 B可以帮助选举出一个Master作为集的总管，并保证在任何时刻总有唯一一个Master在运行 C主要负责表和Region的管理工作 D是HBase中最核心的模块，负责维护分配给自己的Region，并响应用户的读写请求

答案：C

13:Hadoop具有特性不包括______

A高可靠性 B高效性 C高可扩展性 D低容错性，

答案：D

14:YARN的http端口默认是______

A80 B8080 C 8090 D8088

答案：D

15:大数据时代，数据使用的关键是______

A数据收集 B数据存储 C数据分析 D数据再利用

答案：D

三:多选题（每小题5分）

16:大数据人才整体上需要具备______等核心知识

A数学与统计知识 B计算机相关知识 C马克思主义哲学知识 D市场运营管理知识 E在特定业务领域的知识

答案：ABE

17:下列关于数据生命周期管理的核心认识中，正确的是______

A数据从产生到被删除销毁的过程中，具有多个不同的数据存在阶段 B在不同的数据存在阶段，数据的价值是不同的 C根据数据价值的不同应该对数据采取不同的管理策略 D数据生命周期管理旨在产生效益的同时，降低生产成本

答案：ABC

18:数据研究经历了几种范式，包括______

A实验 B理论 C计算 D数据

答案：ABCD

19:按照涉及自变量的多少，可以将回归分析分为______

A线性回归分析 B非线性回归分析 C一元回归分析 D多元回归分析

答案：CD

20:大数据产业发展特点______

A规模较大 B规模较小 C增速较快 D增速缓慢 E多产业交叉融合

答案：ACE

第二卷

一:判断题（每小题5分）

1:HDFS能提供高吞吐量的数据访问，非常适合于大规模数据集上的应用。

A:对 B:错

答案：A

2:利用数据融合、数学模型、仿真技术等，可以逼近事物的本质，可以揭示出原来没有想到或难以展现的关联，大大提升政府决策的科学性。

A:对 B:错

答案：A

3:Pig是一个基于Hadoop的大规模数据分析平台，它为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

A:对 B:错

答案：A

4:信息生命周期管理是据生命周期管理的来源，最早由英国企业提出。

A:对 B:错

答案：B

5:Spark是一个高效的分布式计算系统，它有MapReduce所有优点，同时性能与Hadoop一样高。

A:对 B:错

答案：B

二:单选题（每小题5分）

6:信息技术发展史上的第二次信息化浪潮发生在______

A1950年前后 B1980年前后 C1995年前后 D2010年前后

答案：C

7:HBase系统基本架构中主服务器Master的作用是______

答案：C

8:YARN架构中整个集同一时间提供服务的ResourceManager有______个，负责集资源的统一管理和调度。

A1 B2 C3 D4

答案：A

9:支撑大数据业务的基础是______

A数据科学 B数据应用 C数据硬件 D数据人才

答案：B

10:云数据库的特性不包括______

A动态可扩展 B高可用性 C高性能 D较高的使用代价

答案：D

11:下面______程序负责 HDFS 数据存储。

A NameNode B Jobtracker C Datanode D SecondaryNameNode

答案：C

12:下列关于Hadoop API的说法错误的是______

A Hadoop的文件API不是通用的，只用于HDFS文件系统 B Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的 CFileStatus对象存储文件和目录的元数据 D FSDataInputStream是java.io.DataInputStream的子类

答案：A

13:下列关于聚类挖掘技术的说法中，错误的是______

A不预先设定数据归类类目，完全根据数据本身性质将数据聚合成不同类别 B要求同类数据的内容相似度尽可能小 C要求不同类数据的内容相似度尽可能小 D与分类挖掘技术相似的是，都是要对数据进行分类处理

答案：B

14:YARN的http端口默认是______

A80 B8080 C 8090 D8088

答案：D

15:下列______程序通常与NameNode在一个节点启动

A SecondNameNode B DataNode C TaskTracker D JobTracker

答案：D

三:多选题（每小题5分）

16:在网络爬虫的爬行策略中，应用最为基础的是______

A深度优先遍历策略 B广度优先遍历策略 C高度优先遍历策略 D反向链接策略

答案：AB

17:大数据产业包含______关键技术

A批处理计算 B流计算 C图计算 D查询分析计算

答案：ABCD

18:数据研究经历了几种范式，包括______

A实验 B理论 C计算 D数据

答案：ABCD

19:数据再利用的意义在于______

A挖掘数据的潜在价值 B实现数据重组的创新价值 C利用数据可扩展性拓宽业务领域 D优化存储设备，降低设备成本

答案：ABC

20:大数据人才整体上需要具备______等核心知识

A数学与统计知识 B计算机相关知识 C马克思主义哲学知识 D市场运营管理知识 E在特定业务领域的知识

答案：ABE

688IT编程网

《大数据技术原理及应用》题目

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

《大数据技术原理及应用》题目

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式