头歌hadoop开发环境搭建答案习题
hadoop分布式集搭建一、选择题
1.下列有关Hadoop的说法正确的是(ABCD)。
A.Hadoop最早起源于Nutch
B.Hadoop中HDFS的理念来源于谷歌发表的分布式文件系统(GFS)的论文
C.Hadoop中MapReduce的思想来源于谷歌分布式计算框架MapReduce的论文
D.Hadoop是在分布式服务器集上存储海量数据并运行分布式分析应用的一个开源的软件框架
2.使用Hadoop的原因是(ABCD)。
A.方便:Hadoop运行在由一般商用机器构成的大型集上或者云计算服务上
B.稳健:Hadoop致力于在一般商用硬件上运行,其架构假设硬件会频繁失效,Hadoop可以
从容地处理大多数此类故障
C.可扩展:Hadoop通过增加集节点,可以线性地扩展以处理更大的数据集
D.简单:Hadoop允许用户快速编写高效的并行代码
3.Hadoop的作者是(B)。
A.MartinFowler B.DougCutting C.KentBeck D.GraceHopper
4.以下关于大数据特点的描述中,不正确的是(ABC)。
A.巨大的数据量 B.多结构化数据 C.增长速度快 D.价值密度高
二、简答题
1.Hadoop是一个什么样的框架?
答:Hadoop是一款由Apache基金会开发的可靠的、可伸缩的分布式计算的开源软件。它允许使用简单的编程模型在跨计算机集中对大规模数据集进行分布式处理。
2.Hadoop的核心组件有哪些?简单介绍每一个组件的作用。
答:核心组件有HDFS、MapReduce、YARN。
HDFS(HadoopDistributedFileSystem,Hadoop分布式文件系统)是Hadoop的核心组件之一,作为最底层的分布式存储服务而存在。它是一个高度容错的系统,能检测和应对硬件故障,可在低成本的通用硬件上运行。
MapReduce是Hadoop的一个分布式计算框架,也是一种大规模数据集并行运算的编程模型,主要用于处理海量数据的运算。MapReduce主要包括map(映射)和reduce(规约)两部分。它是一个分布式运算程序的编程框架,其核心功能是将用户编写的业务逻辑代码和自带的默认组件整合成一个完整的分布式运算程序,并发运行在Hadoop集上。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论