一、 单项选择题(共10小题,每小题2分,共计20分)
1. 大数据价值密度的高低与数据总量大小成反比,这是大数据的那个特点?(  )
    (A)Volume(数据量大)          (B)Variety(数据类型多)
    (C)Velocity(流转速度快)        (D)Value(价值密度低)
2. Hadoop 2.x比1.x相比,有什么显著变化?(  )
    (A)增加DataNode                (B)增加NameNode HA
    (C)增加了资源管理器YARN      (D)支持Wire-compatibility
3. Google GFS的Master上保存了GFS的三种元数据,以下那种元数据不能通过日志文件恢复(    )。
(A)命名空间                    (B)Chunk与文件名的映射表
(C)Chunk副本的位置信息        (D)以上都不能
  4. 关于YARN组件说法错误的是(  )
    (A)YARN采用master/slave架构
    (B)主节点上运行主服务ResourceMananger
    (C)从节点上运行从服务NodeManager
    (D)YARN中引入了一个逻辑概念——槽Slot,它将各类资源抽象化
  5. 关于Hadoop MapReduce的执行过程,以下哪个顺序正确?(  )
(A)输入→Reduce→Shuffle→Map→输出
(B)输入→Map→Shuffle→Reduce→输出
(C)输入→Shuffle→Map→Reduce→输出
(D)输入→Map→Reduce→Shuffle→输出
  6. 只启动HDFS,启动成功后,查看JPS,下面那个进程不在其中?(  )
    (A)HMaster    (B)DataNode    (C)Secondary NameNode        (D)NameNode
7. 下面选项不属于Amazon提供的云计算服务的是(    )。
(A)弹性计算云服务EC2            (B)简单存储服务S3           
(C)简单队列服务SQS              (D)Net服务
8. 下列关于Hive的介绍错误的是(  )。
(A)Hive本身不存储和处理数据,依赖HDFS存储数据,依赖MapReduce处理数据
(B)Hive是构建在Hadoop之上的一个数据仓库工具
(C)数据仓库Hive不需要借助于HDFS等就可以完成数据的存储
(D)Hive起源于Facebook内部信息处理平台
9. ZooKeeper在集模式下运行,那么在部署ZooKeeper集时,至少有几个节点?(  )
    (A)4        (B)3        (C)2        (D)1
10. 以下不属于Gossip协议优点的是(    )。
(A)分布式容错    (B)收敛速度快    (C)去中心化  (D)最终一致性
二、 填空题(共5小题,每空1分,共计10分)
1. Amazon S3存储系统的基本结构中,涉及到的两个基本概念分别是             
2. ZooKeeper的集角除Leader外还有        ,其被分为               
3. Hadoop集中MapReduce的底层数据存储在        云数据库服务。
4. Hadoop集中的HDFS来源于Google云计算的         
5. 云计算提供的三种主要服务类型分别是:                           
三、判断题(共10小题,每小题1分,共计10分,正确打√,错误打×)
1. Hadoop集必须使用高性能服务器来搭建。(  )
2. HDFS比较适合存储大量零碎的小文件。(  )
3. HBase的一个表可以存放到多个Region服务器上。(  )
4. 云计算是通过网络按需提供可动态伸缩的廉价计算服务。(    )
5. Hive的元数据和真实数据都存储在HDFS上。(  )
6. 云计算按照部署模式划分,可以分为公有云、私有云和混合云。(    )
7. ZooKeeper中数据节点ZNode的组织方式类似于Unix的文件系统,但ZNode的读写不具有原子性。(  )
8. SaaS虽然能够提高部署的速度,但是其实现和升级的成本也大大增加了。(  )
9. HBase使用ZooKeeper实现集管理功能。(  )
10. Bigtable对存储在其中的数据不做任何解析,一律看做字符串。(    )
四、简答题(共5小题每题6分,共计30分)
1. YARN核心组件及其功能。
2. 容灾备份定义是什么?按照容灾系统对灾难的抵抗程度怎么划分?
3. 云数据中心的特征有哪些?
4. 解释下面Hive语句的功能:
  CREATE EXTERNAL TABLE IF NOT EXISTS goods (
    echange      STRING,
    symbol      STRING,
    ymd        STRING,
    price_open    FLOAT,
    price_high    FLOAT,
  }
  PARTITIONED BY (year INT, month INT, day INT)
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
5. 虚拟机隔离机制主要包括哪些?
五、论述题(共3小题,每题10分,共计30分)
1.论述手工部署全分布模式Hadoop集的完整过程。(10分)
2.请论述云计算与大数据、物联网、人工智能、移动互联网之间的关联性。(10分)
3.论述Hive与关系型数据库的区别?(10分)
参考答案与评分标准
一、单项选择题(每题2分,共10题,共20分)
题号
1
2
3
4
5
6
7
8
9
10
答案
D
C
C
D
B
A
D
C
B
B
    二、填空题(每空1分,共10分)
    1.   桶(Bucket)   对象(Object)  (中英文均可)
    2. Learner Follower Observer(顺序可互换)
    3. HDFS
    4.   GFS
    5. SaaS(软件即服务) PaaS(平台即服务) IaaS(基础设施即服务)(中英文均可)
三、判断题(每题1分,共10题,共10分,正确打√,错误打×)
题号
1
2
3
4
5
6
7
8
9
10
答案
×
×
×
×
×
四、 简答题(每题6分,共5题,共30分)
(注意: 答案不唯一, 只要思路正确, 解释有理有据即可)
1.【答案】
YARN核心组件包括三个,如下:
ResourceManager:处理客户端请求,启动/监控ApplicationMaster,监控NodeManager和资源分配与调度。(【答案】,2分)
ApplicationMaster:为应用程序申请资源,并分配给内部任务,任务调度、监控与容错。(【答案】,2分)
NodeManager:单个节点上的资源管理,处理来自ResourceManager的命令,处理来自ApplicationMaster的命令。(【答案】,2分)
2.【答案】
容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。(2分)
按照容灾系统对灾难的抵抗程度可以划分为数据级容灾(2分)和应用级容灾。(2分)
3. 【答案】
(1)高设备利用率(1.5分)
(2)绿节能(1.5分)
(3)高可用性(1.5分)
(4)自动化管理(1.5分)
4. 【答案】
创建一个外部表goods ,包含5个字段(echange类型为STRING, symbol类型为STRING, ymd类型为STRING, price_open类型为FLOAT, price_high类型为FLOAT)(【答案】,2分)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。