题库(第一、三、八章)
第一章
单选题
1、大数据的数据量现在已经达到了哪个级别?(  C  )
A、GB
B、TB
C、PB
D、ZB
2、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?(  A  )
A、“The Google File System”
B、“MapReduce: Simplified Data Processing on Large Clusters”
C、“Bigtable: A Distributed Storage System for Structured Data”
D、“The Hadoop File System”
3、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?(  B  )
A、“The Google File System”
B、“MapReduce: Simplified Data Processing on Large Clusters”
C、“Bigtable: A Distributed Storage System for Structured Data”
D、“The Hadoop File System”
4、2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文是?(  C  )
A、“The Google File System”
B、“MapReduce: Simplified Data Processing on Large Clusters”
C、“Bigtable: A Distributed Storage System for Structured Data”
D、“The Hadoop File System”
5、对于GFS架构,下面哪个说法是错误的?(A)
A、GFS Master节点管理所有的文件系统所有数据块。
hbase属于什么数据库
B、GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)。块的冗余度默认为3。
C、GFS Master还管理着系统范围内的活动,比如块服务器之间的数据迁移等
D、GFS Master与每个块服务器通信(发送心跳包),发送指令,获取状态
6、下面哪个选项不是HDFS架构的组成部分?(D)
A、NameNode
B、DataNode
C、SecondaryNameNode
D、GFS
7、狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?(D)
A、HDFS
B、MapReduce
C、Yarn
D、HBase
8、与Hadoop 1.x相比,Hadoop 2.x采用全新的架构,最明显的变化就是增加了哪个组件?( D )
A、MapReduce
B、Pig
C、HBase
D、Yarn
9、建立在Hadoop文件系统之上的分布式的列式数据库?( A )
A、HBase
B、Hive
C、YARN
D、Mahout
10、下面哪个选项不属于Google的三驾马车?( A )
A、HDFS
B、MapReduce
C、BigTable
D、GFS
多选题
1、下面哪些是大数据的基本特征?( ABCD )
A、数据体量大
B、数据类型多
C、处理速度快
D、价值密度低
2、Hadoop能够使用户轻松开发和运行处理大数据的应用程序,那它主要有下面哪些特点( ABCD )
A、高可靠性
B、高扩展性
C、高效性
D、高容错性
判断题
(  ×  ) 1、Google的在大数据解决方案是开源的。
(  √  ) 2、GFS分布式文件系统有两个基本组成部分,一个是客户端(Client),一个是服务端(Server)
(  √  ) 3、上传的数据块保存在GFS上,在保存过程中需要水平复制,水平复
制需要考虑两个要求:可靠性、可用性
(  ×  ) 4、HDFS的采用了“分而治之”的思想。
(  √  ) 5、MapReduce是的最早提出是Google为了解决PageRank的问题(  √  ) 6、Hbase是非关系型数据库,是面向列的。
第三章
单选题
1、HDFS首先把大数据文件切分成若干个小的数据块,再把这些数据块分别写入不同的节点,这些负责保存文件数据的节点被称为?(B)
A、NameNode
B、DataNode
C、SecondaryNameNode
D、Block
2、名称节点(NameNode)是HDFS的管理者,它的职责有3个方面,下面哪个选项不是NamdeNode的职责?(D)
A、负责管理和维护HDFS的命名空间(NameSpace)
B、管理DataNode上的数据块(Block)
C、接收客户端的请求
D、负责保存数据块
3、数据节点(DataNode)负责存储数据,一个数据块会在多个DataNode中进行冗余备份,那么HDFS默认存储几份?(C)
A、1
B、2
C、3
D、5
4、下面哪个选项不属于DataNode的职责?(C)
A、保存数据块
B、启动DataNode线程,向NameNode定期汇报数据块信息
C、管理数据块
D、定期向NameNode发送心跳信息保持联系
5、向HDFS上传文件,正确的shell命令是?(B)
A、hdfs dfs -get
B、hdfs dfs -put
C、hdfs dfs -appendToFile
D、hdfs dfs -copyToLocal
6、对于HDFS文件读取过程,描述不正确的是?( A)
A、HDFS客户端通过Configuration对象的open()方法打开要读取的文件
B、DistributedFileSystem负责向远程的名称节点(NameNode)发起RPC调用,得到文件的数据块信息,返回数据块列表
C、通过对数据流反复调用read()方法,把数据从数据节点传输到客户端
D、当客户端读取完数据时,调用FSDataInputStream对象的close()方法关闭输入流
7、HDFS能够在出错的情况下保证数据存储的可靠性,常见的出错情况不包括?(D)
A、数据节点(DataNode)出错
B、名称节点(NameNode)出错
C、数据本身出错
D、以上选项都不包括
8、考虑到安全和效率,Hadoop设计了机架感知(rack-aware)功能,下面关于

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。