《大数据技术原理和应用操作》试卷A卷及答案--688IT编程网

《大数据技术原理和应用操作》试卷A卷

一、单选题（每题2分，共计20分）

1.下列选项中，用于获取Zookeeper所包含的信息的Shell命令是（）。

A、ls

B、ls2

C、r

D、get

2.MapReduce处理数据的工作流程大致分为（）步。

A、两

B、三

C、四

xml技术的主要应用

D、五

3.下列选项中，关于HDFS的架构说法正确的是（）。

A、HDFS采用的是主备架构

B、HDFS采用的是主从架构

C、HDFS采用的是从备架构

D、以上说法均错误

4.下列选项中，若是哪个节点关闭了，就无法访问Hadoop集（）。

A、namenode

B、datanode

C、secondary namenode

D、yarn

5.下列选项中，Hadoop2.x版本独有的进程是（）。

A、JobTracker

B、TaskTracker

C、NodeManager

D、NameNode

6.下列选项中，存放Hadoop配置文件的目录是（）。

A、include

B、bin

C、libexec

D、etc

7.下列选项中，最早提出“大数据”这一概念的是（）。

A、贝恩

B、麦肯锡

C、吉拉德

D、杰弗逊

8.HDFS中的Block默认保存（）份。

A、3份

B、2份

C、1份

D、不确定

9.下列选项中，主要用于决定整个MapReduce程序性能高低的阶段是（）。

A、MapTask

B、ReduceTask

C、分片、格式化数据源

D、Shuffle

10在配置Linux网络参数时，固定IP地址是将路由协议配置为（）。

A、static

B、dynamic

C、immutable

D、variable

二、多选题（每题2分，共计20分）

下列选项中，属于Hadoop优势的有（）。

A、扩容能力强

B、可靠性

C、低效率

D、高容错性

下列哪项可以作为集的管理？

A、Puppet

B、Pdsh

C、Cloudera Manager

D、Zookeeper

下列选项中，属于Hadoop版本系列的有（）。

A、Hadoop4

B、Hadoop2

C、Hadoop1

D、Hadoop3

Hadoop提供的自定义配置时编辑的配置文件中，包含（）。

A、l

B、l

C、l

D、l

下列说法中，关于crontab表达式说法正确的是（）。

A、通过执行crontab表达式可以执行定时任务

B、crontab表达式是由6个参数决定

C、Crontab表达式是由5个参数决定

D、以上说法均正确

在Zookeeper选举过程中，一共有四种状态，分别是（）。

A、竞选状态

B、随从状态

C、观察状态

D、领导者状态

下列选项中，属于Sqoop指令的参数有（）。

A、import

B、output

C、input

D、export

下列选项中，关于Hadoop集说法正确的是（）。

A、Hadoop集包含Worker节点

B、Hadoop集包含Master节点

C、Hadoop集包含Slave节点

D、Hadoop集包含HMaster节点

下列选项中，属于Google提出的处理大数据的技术手段有（）。

A、MapReduce

B、MySQL

C、BigTable

D、GFS

Hive数据表插入数据时，insert（）table ……，括号中可使哪些关键字？

A、into

B、append

C、overwrite

三、判断题（对的打“√”，错的打“×”；每题1分，共10分）

1.由于Hadoop是使用Java语言编写的，因此可以使用Java API操作Hadoop文件系统。( )

2.大数据提供的是一些描述性的信息，而创新还是需要人类自己实现。( )

3.带有倒排索引的文件我们称为倒排索引文件，简称倒排文件。( )

4.Hadoop集执行完MapReduce程序后，会输出_SUCCESS和part-r-00000结果文件。( )

5.传统文件系统存储数据时，若文件太大，会导致上传和下载非常耗时。( )

通过使用虚拟机软件（如VMware Workstation），可以在同一台电脑上构建多个Linux 虚拟机环境。( )

6.Zookeeper的选举机制，实际上是采用算法FastLeaderElection，投票数大于半数则胜出的机制。( )

7.在Hadoop的解压目录下的bin目录，存放的是Hadoop的配置文件。( )

8.Hadoop HA是集中启动两台或两台以上机器充当NameNode，避免一台NameNode节点发生故障导致整个集不可用的情况。( )

9.在安装配置windows平台hadoop，配置后直接运行是没有问题的。( )

四、填空题（每题2分，共计20分）

1.Flume的核心是把数据从数据源通过数据采集器（Source）收集过来，再将收集的数据通过【】汇集到指定的接收器（Sink）。

2.Sqoop连接器，它用于实现与各种关系型数据库的连接，从而实现数据的【】和导出操作。

3.Hive的安装模式分为【】、本地模式、远程模式三种形式。

4.VMware提供了两种类型的克隆，分别是完整克隆和【】。

5.Hadoop支持在【】系统和Windows系统上进行安装使用。

6.Hadoop的解压目录下【】目录存放的是Hadoop管理脚本，包含HDFS和YARN中各类服务的启动/关

闭脚本。

7.一般关于日志文件产生都是根据【】而决定。

8.在部署Sqoop时，需要在sqoop-env.sh配置文件中添加【】环境。

9.当出现【】时，说明Hadoop集已经被格式化成功。

10.Flume分为两个版本，分别是Flume-og、【】。

六、简答题（每题6分，共计30分）

1.启动Hive方式有哪些？

2.简述大数据在零售行业应用的具体表现。

简述event。

3.简述单点故障的产生。

4.简述如何检查Namenode是否正常运行。

688IT编程网

《大数据技术原理和应用操作》试卷A卷及答案

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

《大数据技术原理和应用操作》试卷A卷及答案

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式