选择题
1、关于MapReduce的描述错误的是()
A、MapReduce框架会先排序map任务的输出
B、通常,作业的输入输出都会被存储在文件系统中
C、通常计算节点和存储节点是同一节点
D、一个Task通常会把输入集切分成若干独立的数据块
2、关于基于Hadoop的MapReduce编程的环境配置,下面哪一步是不必要的()
A、安装linux或者在Windows下安装Cgywin
B、安装java
C、安装MapReduce
D、配置Hadoop参数
3、关于基于Hadoop的MapReduce编程的环境配置,下面哪一步是不必要的()
A、配置java环境变量
B、配置Hadoop环境变量
C、配置Eclipse
D、配置ssh
4、下列说法错误的是()
A、MapReduce中maperconbiner reducer 缺一不可
B、在JobConf中InputFormat参数可以不设
C、在JobConf中MapperClass参数可以不设
D、在JobConf中OutputKeyComparator参数可以不设
5、下列关于mapreduce的key/value对的说法正确的是()
A、输入键值对不需要和输出键值对类型一致
B、输入的key类型必须和输出的key类型一致
C、输入的value类型必须和输出的value类型一致
D、输入键值对只能映射成一个输出键值对
6、在mapreduce任务中,下列哪一项会由hadoop系统自动排序()
A、keys of mapper's output
B、values of mapper's output
C、keys of reducer’s output
D、values of reducer's output
7、关于mapreduce框架中一个作业的reduce任务的数目,下列说法正确的是()
A、由自定义的Partitioner来确定
B、是分块的总数目一半
C、可以由用户来自定义,通过JobConf。setNumReducetTask(int)来设定一个作业中reduce的任务数目
D、由MapReduce随机确定其数目
8、MapReduce框架中,在Map和Reduce之间的combiner的作用是()
A、对Map的输出结果排序
B、对中间过程的输出进行本地的聚集
C、对中间结果进行混洗
D、对中间格式进行压缩
9、MapReduce框架分为Map和Reduce,下列对Reduce阶段叙述正确的是()
A、主要分为shuffle和sort这2个阶段
B、这个阶段过程中,key的分组规则是不可更改的
C、其中的shuffle 和sort是同时进行的
D、Reduce 数目的增加不会增加系统的开销
10、Hadoop中,Reducer的三个阶段是()
A、Shuffle——Sort—-Reduce
B、Shuffle——Reduce—-Sort
C、Reduce-—Shuffle--Sort
D、Sort—-Shuffle——Reduce
11、请问在Hadoop体系结构中,按照由下到上顺序,排列正确的是()sort命令排序
Pig Hive Crunch都是运行在MapReduce , Spark ,或者Tez之上的处理框架
Avro是一个克服了Writable部分不足的序列化系统
A、Common Hive HDFS
B、Common MapReduce Pig
C、HDFS MapReduceHBase
D、HDFS Avro HBase
12、关于Hadoop下列说法错误的是()
A、HDFS采用了Master/Slave的架构模型
B、Namenode负责维护文件系统的命名空间
C、Datanode执行比如打开、关闭、重命名文件操作
D、HDFS暴露了文件系统的命名空间,允许用户以文件的形式在上面存储数据
13、下面哪个选项不是我们需要Hadoop的主要原因()
A、我们需要处理PB级别的数据
B、为每个应用建立一个可靠的系统是很昂贵的
C、几乎每天都有结点坏掉
D、把一个任务分割成多个子任务的方式是不好的
14、hadoop中下面哪项操作是不需要记录进日志的()
A、打开文件
B、重命名
C、编译文件
D、删除操作
15、hadoop中,下面关于向文件系统中添加一个文件的过程,错误的是()
A、需要创建路径的父目录
B、需要创建一个新的INode文件
C、将新的INode文件加入到name space中去
D、将所有操作记录到EditLog中去
16、在安装配置好Hadoop集后,查看Namenode节点的端口是以下哪个()
A、50030
B、50070
C、60010
D、60030
17、下面哪个不是Hadoop的输出数据格式()
A、文本输出
B、二进制输出
C、单一输出
D、多输出
18、要在HDFS的根目录中建立一个叫hadoo的目录,下面哪一条命令是正确的()
A、mkdirhadoo
B、mkdir /hadoo
C、hadoopmkdirhadoo
D、hadoop fs –mkdir /hadoo
19、下面有关NameNode 安全模式(safe mode)说法错误的是()
A、name space处于安全模式时只能被读取
B、NameNode 启动时自动进入安全模式
C、调用setSafeMode()函数能够打开或关闭安全模式
D、安全模式下不能够复制或删除文件中的数据块
20、以下情况除哪项发生时balancer便会自动退出()
A、集平衡或者没有数据块可以移动
B、在连续三次迭代中没有块移动
C、与namenode传输时发生异常
D、另一个balancer在运行
21、下列说法错误的是()
A、Partitioner负责控制map输出结果key的分割
B、Reporter用于MapReduce应用程序报告进度
C、OutputCollector收集Mapper或Reducer输出数据
D、Reduce的数目不可以是0
22、下列说法错误的是()
A、JobServer是用户作业和JobTracker交互的主要接口
B、JobClient为用户提供提交作业功能
C、JobClient提供访问子任务报告和日志功能

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。