《大数据技术原理和应用操作》试卷A卷
一、单选题(每题2分,共计20分)
1.下列选项中,用于获取Zookeeper所包含的信息的Shell命令是()。
A、ls
B、ls2
C、r
D、get
2.MapReduce处理数据的工作流程大致分为()步。
A、两
B、三
C、四
xml技术的主要应用
D、五
3.下列选项中,关于HDFS的架构说法正确的是()。
A、HDFS采用的是主备架构
B、HDFS采用的是主从架构
C、HDFS采用的是从备架构
D、以上说法均错误
4.下列选项中,若是哪个节点关闭了,就无法访问Hadoop集()。
A、namenode
B、datanode
C、secondary namenode
D、yarn
5.下列选项中,Hadoop2.x版本独有的进程是()。
A、JobTracker
B、TaskTracker
C、NodeManager
D、NameNode
6.下列选项中,存放Hadoop配置文件的目录是()。
A、include
B、bin
C、libexec
D、etc
7.下列选项中,最早提出“大数据”这一概念的是()。
A、贝恩
B、麦肯锡
C、吉拉德
D、杰弗逊
8.HDFS中的Block默认保存()份。
A、3份
B、2份
C、1份
D、不确定
9.下列选项中,主要用于决定整个MapReduce程序性能高低的阶段是()。
A、MapTask
B、ReduceTask
C、分片、格式化数据源
D、Shuffle
10在配置Linux网络参数时,固定IP地址是将路由协议配置为()。
A、static
B、dynamic
C、immutable
D、variable
二、多选题(每题2分,共计20分)
下列选项中,属于Hadoop优势的有()。
A、扩容能力强
B、可靠性
C、低效率
D、高容错性
下列哪项可以作为集的管理?
A、Puppet
B、Pdsh
C、Cloudera Manager
D、Zookeeper
下列选项中,属于Hadoop版本系列的有()。
A、Hadoop4
B、Hadoop2
C、Hadoop1
D、Hadoop3
Hadoop提供的自定义配置时编辑的配置文件中,包含()。
A、l
B、l
C、l
D、l
下列说法中,关于crontab表达式说法正确的是()。
A、通过执行crontab表达式可以执行定时任务
B、crontab表达式是由6个参数决定
C、Crontab表达式是由5个参数决定
D、以上说法均正确
在Zookeeper选举过程中,一共有四种状态,分别是()。
A、竞选状态
B、随从状态
C、观察状态
D、领导者状态
下列选项中,属于Sqoop指令的参数有()。
A、import
B、output
C、input
D、export
下列选项中,关于Hadoop集说法正确的是()。
A、Hadoop集包含Worker节点
B、Hadoop集包含Master节点
C、Hadoop集包含Slave节点
D、Hadoop集包含HMaster节点
下列选项中,属于Google提出的处理大数据的技术手段有()。
A、MapReduce
B、MySQL
C、BigTable
D、GFS
Hive数据表插入数据时,insert()table ……,括号中可使哪些关键字?
A、into
B、append
C、overwrite
三、判断题(对的打“√”,错的打“×”;每题1分,共10分)
1.由于Hadoop是使用Java语言编写的,因此可以使用Java API操作Hadoop文件系统。( )
2.大数据提供的是一些描述性的信息,而创新还是需要人类自己实现。( )
3.带有倒排索引的文件我们称为倒排索引文件,简称倒排文件。( )
4.Hadoop集执行完MapReduce程序后,会输出_SUCCESS和part-r-00000结果文件。( )
5.传统文件系统存储数据时,若文件太大,会导致上传和下载非常耗时。( )
通过使用虚拟机软件(如VMware Workstation),可以在同一台电脑上构建多个Linux 虚拟机环境。( )
6.Zookeeper的选举机制,实际上是采用算法FastLeaderElection,投票数大于半数则胜出的机制。( )
7.在Hadoop的解压目录下的bin目录,存放的是Hadoop的配置文件。( )
8.Hadoop HA是集中启动两台或两台以上机器充当NameNode,避免一台NameNode节点发生故障导致整个集不可用的情况。( )
9.在安装配置windows平台hadoop,配置后直接运行是没有问题的。( )
四、填空题(每题2分,共计20分)
1.Flume的核心是把数据从数据源通过数据采集器(Source)收集过来,再将收集的数据通过【】汇集到指定的接收器(Sink)。
2.Sqoop连接器,它用于实现与各种关系型数据库的连接,从而实现数据的【】和导出操作。
3.Hive的安装模式分为【】、本地模式、远程模式三种形式。
4.VMware提供了两种类型的克隆,分别是完整克隆和【】。
5.Hadoop支持在【】系统和Windows系统上进行安装使用。
6.Hadoop的解压目录下【】目录存放的是Hadoop管理脚本,包含HDFS和YARN中各类服务的启动/关
闭脚本。
7.一般关于日志文件产生都是根据【】而决定。
8.在部署Sqoop时,需要在sqoop-env.sh配置文件中添加【】环境。
9.当出现【】时,说明Hadoop集已经被格式化成功。
10.Flume分为两个版本,分别是Flume-og、【】。
六、简答题(每题6分,共计30分)
1.启动Hive方式有哪些?
2.简述大数据在零售行业应用的具体表现。
简述event。
3.简述单点故障的产生。
4.简述如何检查Namenode是否正常运行。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。