2021大数据知识竞赛考试题及答案
1、以下哪项不属于大数据的特征?
数据量大 |
数据类型复杂 |
单位处理数据的速度高 |
数据价值密度高【正确答案】 |
2、以下哪项不属于大数据流式处理典型业务应用场景?
实时营销 |
实时服务 |
实时监控 |
用户画像【正确答案】 |
3、以下不属于Hadoop内核的组成部分的是
HDFS |
MapReduce |
Hbase【正确答案】 |
YARN |
4、HDFS默认的当前工作目录是/user/$USER,fs.default.name的值需要在下列哪一个配置文件内说明?
l |
l【正确答案】 |
l |
以上均不是 |
5、下列哪一项不属于HDFS相对于分布式系统而言特有的特性?
高容错 |
大文件存储 |
大量的随机读应用【正确答案】 |
高吞吐量 |
6、下列存储HDFS某一时段NameNode内存元数据信息的是
l |
fsimage【正确答案】 |
edits |
fstime |
7、以下哪个不是HDFS的守护进程?
secondarynamenode |
datanode |
mrappmaster/yarnchild【正确答案】 |
namenode |
8、关于 SecondaryNameNode 哪项是正确的?
它是 NameNode 的热备 |
它是内存没有要求 |
它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间【正确答案】 |
SecondaryNameNode 应与 NameNode 部署到一个节点 |
9、以下哪一项不属于HDFS集中的namenode职责
维护HDFS集的目录树结构 |
维护HDFS集的所有数据块的分布、副本数和负载均衡 |
负责保存客户端上传的数据【正确答案】 |
响应客户端的所有读写数据请求 |
10、以下哪一项属于SecondaryNamenode的作用
监控Namenode |
管理Datanode |
合并fsimage和editlogs【正确答案】 |
支持Namenode HA |
11、下面哪个程序负责 HDFS 中实际数据的存储
NameNode |
Jobtracker |
Datanode【正确答案】 |
secondaryNameNode |
12、关于HDFS集中的DataNode的描述不正确的是
DataNode之间不是独立的,相互之间会有通信和数据传输 |
存储客户端上传的数据的数据块 |
一个DataNode上存储的所有数据块可以有相同的【正确答案】 |
响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑 |
13、如果我们现有一个hadoop集,默认存储文件3份,并且大文件会按照128M的数据块大小进行切割分散存储,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集中产生多少个数据块(包括副本)?
200 |
40000 |
400 |
1200【正确答案】 |
14、下列选项中,哪一项是存储HDFS某一时段NameNode内存元数据信息?
l |
fsimage【正确答案】 |
edits |
fstime |
15、HBase底层依靠什么进行数据的存储
HDFS【正确答案】 |
Hive |
Memory |
MapReduce |
16、下列选项中,哪个选项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构?
GFS |
MapReduce【正确答案】 |
Chubby |
BitTable |
17、Mapreduce擅长哪个领域的计算
离线批处理【正确答案】 |
DAG计算 |
流式计算 |
实时计算 |
18、在MapReduce中哪一个阶段,把Mapper的输出数据归并整理后分发给Reducer处理
Shuffle【正确答案】 |
Map |
Reduce |
Sort |
19、关于MapReduce原理,下面说法错误的是
分为Map和Reduce两个阶段 |
Map阶段由一系列Map任务组成 |
Reduce阶段由一系列Reduce任务组成 |
Map阶段与Reduce阶段没有任何依赖关系【正确答案】 |
20、下列哪个程序通常与 NameNode 在同一个节点启动
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论