(完整版)hadoop习题册--688IT编程网

第一章大数据概述

1.互联网的发展分为______个阶段。

A．一 B.三 C.二 D.四

2.下列不属于大数据特点的是（）。

A.种类和来源多样化 B.数据量巨大 C.分析处理速度快 D.价值密度高

3.互联网发展的第_____个时代为智能互联网。

A.3.0 B.4.0 C.1.0 D.2.0

4.关于大数据叙述不正确的一项是（）。

A.大数据=“海量数据”+“复杂类型的数据”

B.大数据是指在一定时间对内容抓取、管理和处理的数据集合

C.大数据可以及时有效的分析海量的数据

D.数据包括结构化数据、半结构化数据、结构化数据。

5.下列数据换算正确的一项为（）。

A.1YB=1024EB

B.1TB=1024MB

C.1PB==1024EB

D.1024ZB=1EB

6.结构化数据的表现形式为______。

A.文本 B.视图 C.二维表 D.查询

7.结构化的数据，先有________,再有_________.

A.数据结构

B.结构数据

C.内容结构

D.结构内容

8.结构化的数据，先有________,再有_________.

A.数据结构

B.结构数据

C.内容结构

D.结构内容

9.软件是大数据的_________。

A.核心 B.部件 C.引擎 D.集合

10.大数据技术不包括( )。

A.数据计算 B.数据存储 C.数据冗余 D.数据采集

11.大数据的特点不包括（）。

A.数量大 B.类型少 C.速度快 D.价值高

第二章 Hadoop简介

1.下列对云栈架构层数不正确的一项为________。

A.三层云栈架构

B.四层云栈架构

C.五层云栈架构

D.六层云栈架构

2.下列______不是云计算三层架构的概括。

A.IaaS B.PaaS C.SaaP D.SaaS

3.IaaS基础设施及服务可以称为______。

A.弹性计算 B.效用计算 C.有效计算 D.随需应用

4.四层云栈模式，是将三层模式中的_________进行分解，分为两层，一层为硬件层，一层为虚拟资源层。

A.硬件部分 B.虚拟化部分 C.基础设施 D.平台

5.五层云栈模式，第五层为______。

A.固件/硬件层 B.云基本资源层 C.云应用程序层 D.云软件环境层

6.大数据是_____的应用。

A.人工智能 B.云计算 C.物联网 D.互联网

7.hadoop______中第一阶段的输出可以作为下一阶段的输入。

A.应用场景 B.分布式计算 C.分阶段计算 D.高效处理

8. .hadoop______中将海量数据分割于多个节点，由每个节点并行计算，将得到的结果归并

到输出。

A.应用场景 B.分布式计算 C.分阶段计算 D.高效处理

9.下列选项中不是hadoop特点的是_____。

A.可靠性 B.扩容能力 C.高效率 D.成本高

10.hadoop能可靠地存储和处理_____字节数据。

A.TB B.PB C.YB D.ZB

11.hadoop集可以用___种模式进行。

A.四 B.三 C.五 D.二

12.hadoop集不可以在_____________进行。

A.联机模式 B.单机模式 C.虚拟分布模式 D.完全分布模式

13.________模式：hadoop安装时的默认模式，不对配置文件进行修改。

A.联机 B.单机 C.虚拟分布 D.完全分布

14.________模式：在一台机器上用软件模拟多节点集。

A.联机 B.单机 C.虚拟分布 D.完全分布

15.________模式：Hadoop安装运行在多台主机上，构成一个真实的hadoop集，在所有的节点上都安装JDK和hadoop，相互通过高速局域网连接。

A.联机 B.单机 C.虚拟分布 D.完全分布

16.完全分布式，各节点之间设置________，将各个从节点生成的公钥添加到主节点的信任列表。

A.SSH B.JDK C.hadoop D.HDFS

17.完全分布式，不需要修改的配置文件为_______。

A.l l C.hadoop-env.sh l

18.HDFS架构中有两个_________。

A.DataNodes B. JobTracke C.NameNode D.SecondayNameNode

19.下列不是hadoop核心组件的是________。

A.JobTracker B.TaskTracker C.HDFS D.Hbase

20._______存储Hadoop集中所有存储节点上的文件，为海量提供存储。

A.JobTracker B.TaskTracker C.HDFS D.HBase

第四章 HDFS文件系统

1.___________是指跨多台计算或服务器的文件或文件夹，数据存储在多台机器而不是单台机器上。

A.分布式存储 B.分页式存储 C.链式存储 D.顺序存储

2.下列关于hadoop系统架构叙述不正确的一项为________。

A.由一台Intel x86处理器的服务器或PC机组成。

B.部署在低成本Intel/linux硬件平台上。

C.通过高速局域网构成一个计算集。

D.各个节点上运行Linux操作系统。

3.主节点程序__________。

A.NameNode B.DataNode C.SecondaryNameNode D.Jobtracker

4hbase属于什么数据库. 从节点程序__________。

A.NameNode B.DataNode C.SecondaryNameNode D.Jobtracker

5.HDFS结构不包括________。

A.Master体系结构 B.主从服务器 C.元数据服务器 D.存储服务器

6.HDFS分布式文件系统的特点为____________。

A.半透明性 B.低可用性 C.可扩展性 D.支持一个应用程序并发访问

7.HDFS中的block默认保存____份。

A.3 B.2 C.1 D.不确定

8.下列_______通常与NameNode在一个节点启动。

A.SecondaryNameNode

B.DataNode

C.TaskTracker

D.Jobtracker

9.HDFS每个文件被划分成______大小的多个block，属于同一个文件的blocks分散存储在不同DataNode上。

A.32MB

B.64MB

C.128MB

D.无法确定

10.下面哪个程序负责HDFS 数据存储？（）

A.NameNode

B.JobTracker

C.DataNode

D.SecondaryNameNode

E.tasktracker

11.NameNode是HDFS系统中的管理局节点，它管理文件系统的命名空间，记录每个文件数据块在DataNode上的位置和副本信息、协调客户端对文件的访问、记录命名空间内的改动

和空间本身属性的改动。

A.错误 B.正确

12.HDFS是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠行、高扩展性、高吞吐率等特征，适合的读写任务是________。

A.一次写入，少次读取

B.多次写入，少次读取

C.多次写入，多次读取

D.一次写入，多次读取

13.关于HDFS的文件写入，正确的是_________。

A.支持多用户对同一文件的写操作

B.用户可以在文件任意位置进行修改

C.默认将文件复制成三份存放

D.复制的文件块默认存在同一机架上

14. Client在HDFS上进行文件写入时，namenode根据文件大小和配置情况，返回部分datanode信息，谁负责将文件划分为多个Block，根据DataNode的地址信息，按顺序写入到每一个DataNode块

A.Client

B.Namenode

C.Datanode

D.Secondary namenode

15. HDFS无法高效存储大量小文件，想让它能处理好小文件，比较可行的改进策略不包括

A．利用SequenceFile、MapFile、Har等方式归档小文件

B．多Master设计

C． Block大小适当调小

D．调大namenode内存或将文件系统元数据存到硬盘里

16. 在HDFS的数据读取过程中，客服端首先调用________的实例的open()方法打开一个文件。

A.DistributedFileSystem B.FileSystem C.FSDataOutputSystem D.OutputSystem

17.在HDFS的数据读取过程中，DistributedFileSystem获取这些信息后，生成一个__________对象实例返回给客户端。

A.DistributedFileSystem B.FSDataInputSystem

C.FSDataOutputSystem D.InputSystem

18.在HDFS的数据读取过程中，客户端读取完所有数据块后，调用___________的close()接口关闭这个文件。

A.DistributedFileSystem B.FSDataInputSystem

C.FSDataOutputSystem D.InputSystem

19.在HDFS的数据写入过程中，客服端首先调用________的实例的create()方法打开一个文件。

A.DistributedFileSystem B.FileSystem C.FSDataOutputSystem D.OutputSystem

20. 在HDFS的数据写入过程中，客户端写完所有数据块后，调用___________的close()方法结束这次文件写入操作。

A.DistributedFileSystem B.FSDataInputSystem

C.FSDataOutputSystem D.InputSystem

21.HDFS的错误检测不包括_________。

A.NameNode检测 B.DataNode检测 C.数据错误检测 D.冗余检测

第五章 MapReduce原理与编程

1.MapReduce应用于__________的数据处理。

A.小规模 B.中小规模 C.大规模 D.超大规模

2.MapReduce能处理的海量数据大于______。

A.1TB B.10GB C.10TB D.1PB

688IT编程网

(完整版)hadoop习题册

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

(完整版)hadoop习题册

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式