⼤数据平台搭建期末复习题(选择)0112下⾯哪个程序负责 HDFS 数据存储。
secondaryNameNode
NameNode
Jobtracker
Datanode (答案)
HDFS是基于流数据模式访问和处理的超⼤⽂件的需求⽽开发的,适合读写的任务是?
多次写⼊,少次读
⼀次写⼊,少次读
⼀次写⼊,多次读(答案)
多次写⼊,多次读
以下哪⼀项属于⾮结构化数据。
财务系统数据
⽇志数据
视频监控数据(答案)
企业ERP数据
下列关于MapReduce不正确的是?
MR只能⽤Java语⾔编写(答案)
MR是⼀种计算框架
MR隐藏了并⾏计算的细节,便于使⽤
MR来源于Google的学术论⽂
HDFS 中的 block 默认保存⼏个备份。
不确定
1
2
3 (答案)
下列哪项通常是集的最主要瓶颈。
磁盘IO (答案)
CPU
⽹络
内存
Hadoop作者是下列哪⼀位?
Grace Hopper
Martin Fowler
Kent Beck
Doug cutting (答案)
以下哪⼀项不属于Hadoop可以运⾏的模式。
分布式模式
伪分布式模式
互联模式(答案)
单机模式
⼤数据的特点不包括下⾯哪⼀项?
多结构化数据
价值密度⾼(答案)
增长速度快
巨⼤的数据量
HDFS2.x 默认 Block Size⼤⼩是多少。
128MB (答案)
64MB
32MB
256MB
关于Secondary NameNode的描述哪项是正确的?secondaryNameNode应与NameNode部署到⼀个节点
它的⽬的是帮助NameNode合并编辑⽇志,减少NameNode启动时间(答案)它对内存没有要求
它是NameNode的热备
配置Hadoop集只需要修改l配置⽂件就可以。
错误(答案)
正确
namenode默认的WebUI访问端⼝号是多少
8020 (答案)
50070
50020
9000
在Hadoop1.x版本中,MapReduce程序是运⾏在YARN集之上。
错误(答案)
正确
以下不是Linux⽂件数据块分配⽅式的是
链式分配
连续分配
键值分配(答案)
索引分配
Hadooop是⽤Java语⾔开发的。
正确(答案)
错误
不定项选择题
常见的⼤数据相关服务包括:
数据的统计分析(答案)
数据分类
数据查询分析(答案)
数据的可视化(答案)
以下属于分布式存储系统的特性的有
易⽤(答案)
⾼性能(答案)
低成本(答案)
可扩展性(答案)
以下属于Apache HDFS的特点的有
适合GB级数据的存储(答案)
⾼容错性(答案)
良好的扩展性(答案)
功能强⼤,操作简单、易⽤(答案)
配置Hadoop集时,下列哪个Hadoop配置⽂件需要进⾏修改?l (答案)
ifcfg-eth0
profile
hadoop-env.sh (答案)
在simple03节点上执⾏启动命令,NameNode进程会在哪个节点simple04
simple05
simple03 (答案)
hadoop分布式集搭建simple06
以下哪个命令组成是错误的?
hadoop namenode -format
hadoop fs -cat /hadoop/
stop.sh (答案)
hdfs dfsadmin -report
hadoop dfs chmod –R 755 /
hadoop dfs chmod –R 755
hadoop dfs chmod –R 755 /tmp (答案)
hadoop chown –R 755 /tmp
在vim中保存退出的命令是
:nohl
:wq (答案)
:q
q!
下列选项中哪些是Hadoop2.x版本独有的进程?
JobTracker
NodeManager (答案)
TaskTracker
NameNode
⼀个gzip⽂件⼤⼩175MB,客户端设置Block⼤⼩为128MB,请问其占⽤⼏个Block?
2 (答案)
4
1
3
下⾯关于MapReduce模型中Map⽅法与Reduce⽅法的描述正确的是?
Map与Map之间不是相互独⽴的
Reduce与Reduce之间不是相互独⽴的
⼀个Map操作就是对每个Reduce所产⽣的⼀部分中间结果进⾏合并操作
⼀个Map⽅法就是对⼀部分原始数据进⾏指定的操作(答案)
如果我们现有⼀个安装2.7.4版本的Hadoop集,在不修改默认配置的情况下存储200个每个200M的⽂本⽂件,请问最终会在集中产⽣多少个数据块(包括副本)?
1200 (答案)
40000
400
200
HDFS有⼀个gzip⽂件⼤⼩175MB,客户端设置Block⼤⼩为128MB。当运⾏mapreduce任务读取该⽂件时input split⼤⼩为?
175MB (答案)
128MB
⼀个Map读取128MB,另外⼀个Map读取47MB
启动hadoop所有进程的命令是
start-hadoop.sh
start-hdfs.sh
start-all.sh (答案)
start-dfs.sh
下列哪个不是HDFS的守护进程?
datanode
MRappMaster (答案)
secondarynamenode
namenode
下列哪个属性是l中的配置?
fs.defaultFS
mapreduce.framework.name
当判断isDirectory不存在的⽂件,返回的值是
true
false (答案)
1
假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是
start-hdfs.sh,stop-hdfs.sh
start-hdfs.sh,stop-dfs.sh
start-dfs.sh,stop-dfs.sh (答案)
start-dfs.sh,stop-hdfs.sh
String s=”青春⽆悔”; int index=s.indexOf(‘春’); 执⾏后,返回字符’春’的位置是
2
3
1 (答案)
MapReduce适⽤于下列哪个选项?
可以串⾏处理的应⽤程序
可以并⾏处理的应⽤程序(答案)
任意可以在Windows Server 2008上的应⽤程序
任意应⽤程序
分布式⽂件系统HDFS采⽤了主从结构模型,由计算机集中的多个节点构成的,这些节点分为两类,存储元数据和存储具体数据分别为从节点,主节点
名称节点,主节点
名称节点,数据节点(答案)
数据节点,名称节点
在Hadoop中定义的主要公⽤InputFormat中,默认是哪⼀个?
SequenceFileInputFormat
KeyValueInputFormat
TextInputFormat (答案)
从互联⽹上的多个⽹页中,获取指定位置的数据,通常使⽤哪种数据采集⽅法?
⽇志
传感器
众包
爬⾍(答案)
以下HDFS相关的shell命令不正确的是
hadoop fs -ls <path>:显⽰<path>指定的⽂件的详细信息
hdfs dfs -rm <path>:删除路径<path>指定的⽂件
hadoop dfs mkdir <path>:创建<path>指定的⽂件夹(答案)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论