一、 单项选择题(共10小题,每小题2分,共计20分)
1. 大数据价值密度的高低与数据总量大小成反比,这是大数据的那个特点?( )
(A)Volume(数据量大) (B)Variety(数据类型多)
(C)Velocity(流转速度快) (D)Value(价值密度低)
2. Hadoop 2.x比1.x相比,有什么显著变化?( )
(A)增加DataNode (B)增加NameNode HA
(C)增加了资源管理器YARN (D)支持Wire-compatibility
3. Google GFS的Master上保存了GFS的三种元数据,以下那种元数据不能通过日志文件恢复( )。
(A)命名空间 (B)Chunk与文件名的映射表
(C)Chunk副本的位置信息 (D)以上都不能
4. 关于YARN组件说法错误的是( )
(A)YARN采用master/slave架构
(B)主节点上运行主服务ResourceMananger
(C)从节点上运行从服务NodeManager
(D)YARN中引入了一个逻辑概念——槽Slot,它将各类资源抽象化
5. 关于Hadoop MapReduce的执行过程,以下哪个顺序正确?( )
(A)输入→Reduce→Shuffle→Map→输出
(B)输入→Map→Shuffle→Reduce→输出
(C)输入→Shuffle→Map→Reduce→输出
(D)输入→Map→Reduce→Shuffle→输出
6. 只启动HDFS,启动成功后,查看JPS,下面那个进程不在其中?( )
(A)HMaster (B)DataNode (C)Secondary NameNode (D)NameNode
7. 下面选项不属于Amazon提供的云计算服务的是( )。
(A)弹性计算云服务EC2 (B)简单存储服务S3
(C)简单队列服务SQS (D)Net服务
8. 下列关于Hive的介绍错误的是( )。
(A)Hive本身不存储和处理数据,依赖HDFS存储数据,依赖MapReduce处理数据
(B)Hive是构建在Hadoop之上的一个数据仓库工具
(C)数据仓库Hive不需要借助于HDFS等就可以完成数据的存储
(D)Hive起源于Facebook内部信息处理平台
9. ZooKeeper在集模式下运行,那么在部署ZooKeeper集时,至少有几个节点?( )
(A)4 (B)3 (C)2 (D)1
10. 以下不属于Gossip协议优点的是( )。
(A)分布式容错 (B)收敛速度快 (C)去中心化 (D)最终一致性
二、 填空题(共5小题,每空1分,共计10分)
1. Amazon S3存储系统的基本结构中,涉及到的两个基本概念分别是 和 。
2. ZooKeeper的集角除Leader外还有 ,其被分为 、 。
3. Hadoop集中MapReduce的底层数据存储在 云数据库服务。
4. Hadoop集中的HDFS来源于Google云计算的 。
5. 云计算提供的三种主要服务类型分别是: 、 、 。
三、判断题(共10小题,每小题1分,共计10分,正确打√,错误打×)
1. Hadoop集必须使用高性能服务器来搭建。( )
2. HDFS比较适合存储大量零碎的小文件。( )
3. HBase的一个表可以存放到多个Region服务器上。( )
4. 云计算是通过网络按需提供可动态伸缩的廉价计算服务。( )
5. Hive的元数据和真实数据都存储在HDFS上。( )
6. 云计算按照部署模式划分,可以分为公有云、私有云和混合云。( )
7. ZooKeeper中数据节点ZNode的组织方式类似于Unix的文件系统,但ZNode的读写不具有原子性。( )
8. SaaS虽然能够提高部署的速度,但是其实现和升级的成本也大大增加了。( )
9. HBase使用ZooKeeper实现集管理功能。( )
10. Bigtable对存储在其中的数据不做任何解析,一律看做字符串。( )
四、简答题(共5小题,每题6分,共计30分)
1. YARN核心组件及其功能。
2. 容灾备份定义是什么?按照容灾系统对灾难的抵抗程度怎么划分?
3. 云数据中心的特征有哪些?
4. 解释下面Hive语句的功能:
CREATE EXTERNAL TABLE IF NOT EXISTS goods (
echange STRING,
symbol STRING,
ymd STRING,
price_open FLOAT,
price_high FLOAT,
}
PARTITIONED BY (year INT, month INT, day INT)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
5. 虚拟机隔离机制主要包括哪些?
五、论述题(共3小题,每题10分,共计30分)
1.请论述手工部署全分布模式Hadoop集的完整过程。(10分)
2.请论述云计算与大数据、物联网、人工智能、移动互联网之间的关联性。(10分)
3.请论述Hive与关系型数据库的区别?(10分)
参考答案与评分标准
一、单项选择题(每题2分,共10题,共20分)
题号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
答案 | D | C | C | D | B | A | D | C | B | B |
二、填空题(每空1分,共10分)
1. 桶(Bucket) 、 对象(Object) (中英文均可)
2. Learner 、Follower 、 Observer(顺序可互换)
3. HDFS
4. GFS
5. SaaS(软件即服务)、 PaaS(平台即服务)、 IaaS(基础设施即服务)(中英文均可)
三、判断题(每题1分,共10题,共10分,正确打√,错误打×)
题号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
答案 | × | × | √ | √ | × | √ | × | × | √ | √ |
四、 简答题(每题6分,共5题,共30分)
(注意: 答案不唯一, 只要思路正确, 解释有理有据即可)
1.【答案】
YARN核心组件包括三个,如下:
ResourceManager:处理客户端请求,启动/监控ApplicationMaster,监控NodeManager和资源分配与调度。(【答案】,2分)
ApplicationMaster:为应用程序申请资源,并分配给内部任务,任务调度、监控与容错。(【答案】,2分)
NodeManager:单个节点上的资源管理,处理来自ResourceManager的命令,处理来自ApplicationMaster的命令。(【答案】,2分)
2.【答案】
容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。(2分)
按照容灾系统对灾难的抵抗程度可以划分为数据级容灾(2分)和应用级容灾。(2分)
3. 【答案】
(1)高设备利用率(1.5分)
(2)绿节能(1.5分)
(3)高可用性(1.5分)
(4)自动化管理(1.5分)
4. 【答案】
创建一个外部表goods ,包含5个字段(echange类型为STRING, symbol类型为STRING, ymd类型为STRING, price_open类型为FLOAT, price_high类型为FLOAT)(【答案】,2分)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论