第一章 大数据概述
1.互联网的发展分为______个阶段。
A.一    B.        C.二        D.四
2.下列不属于大数据特点的是(   )。
A.种类和来源多样化    B.数据量巨大     C.分析处理速度快        D.价值密度高
3.互联网发展的第_____个时代为智能互联网。
A.3.0    B.4.0    C.1.0    D.2.0
4.关于大数据叙述不正确的一项是(   )。
A.大数据=“海量数据”+“复杂类型的数据”
B.大数据是指在一定时间对内容抓取、管理和处理的数据集合
C.大数据可以及时有效的分析海量的数据
D.数据包括结构化数据、半结构化数据、结构化数据。
5.下列数据换算正确的一项为( )。
A.1YB=1024EB
B.1TB=1024MB
C.1PB==1024EB
D.1024ZB=1EB
6.结构化数据的表现形式为______
A.文本    B.视图    C.二维表    D.查询
7.结构化的数据,先有________,再有_________.
A.数据    结构
B.结构    数据
C.内容    结构
D.结构    内容
8.结构化的数据,先有________,再有_________.
A.数据    结构
B.结构    数据
C.内容    结构
D.结构    内容
9.软件是大数据的_________
A.核心    B.部件    C.引擎    D.集合
10.大数据技术不包括(    )
A.数据计算    B.数据存储    C.数据冗余    D.数据采集
11.大数据的特点不包括(   )。
A.数量大        B.类型少        C.速度快        D.价值高
第二章 Hadoop简介
1.下列对云栈架构层数不正确的一项为________
A.三层云栈架构
B.四层云栈架构
C.五层云栈架构
D.六层云栈架构
2.下列______不是云计算三层架构的概括。
A.IaaS        B.PaaS        C.SaaP        D.SaaS
3.IaaS基础设施及服务可以称为______
A.弹性计算        B.效用计算        C.有效计算        D.随需应用
4.四层云栈模式,是将三层模式中的_________进行分解,分为两层,一层为硬件层,一层为虚拟资源层。
A.硬件部分        B.虚拟化部分        C.基础设施        D.平台
5.五层云栈模式,第五层为______
A.固件/硬件层        B.云基本资源层        C.云应用程序层        D.云软件环境层
6.大数据是_____的应用。
A.人工智能        B.云计算        C.物联网        D.互联网
7.hadoop______中第一阶段的输出可以作为下一阶段的输入。
A.应用场景        B.分布式计算        C.分阶段计算        D.高效处理
8. .hadoop______中将海量数据分割于多个节点,由每个节点并行计算,将得到的结果归并
到输出。
A.应用场景        B.分布式计算        C.分阶段计算        D.高效处理
9.下列选项中不是hadoop特点的是_____
A.可靠性        B.扩容能力        C.高效率        D.成本高
10.hadoop能可靠地存储和处理_____字节数据。
A.TB            B.PB            C.YB            D.ZB
11.hadoop集可以用___种模式进行。
A.            B.            C.            D.
12.hadoop集不可以在_____________进行。
A.联机模式        B.单机模式        C.虚拟分布模式        D.完全分布模式
13.________模式:hadoop安装时的默认模式,不对配置文件进行修改。
A.联机        B.单机        C.虚拟分布        D.完全分布
14.________模式:在一台机器上用软件模拟多节点集。
A.联机        B.单机        C.虚拟分布        D.完全分布
15.________模式:Hadoop安装运行在多台主机上,构成一个真实的hadoop集,在所有的节点上都安装JDK和hadoop,相互通过高速局域网连接。
A.联机        B.单机        C.虚拟分布        D.完全分布
16.完全分布式,各节点之间设置________,将各个从节点生成的公钥添加到主节点的信任列表。
A.SSH        B.JDK        C.hadoop        D.HDFS
17.完全分布式,不需要修改的配置文件为_______
A.l        l        C.hadoop-env.sh        l
18.HDFS架构中有两个_________
A.DataNodes        B. JobTracke        C.NameNode        D.SecondayNameNode
19.下列不是hadoop核心组件的是________
A.JobTracker        B.TaskTracker        C.HDFS        D.Hbase
20._______存储Hadoop集中所有存储节点上的文件,为海量提供存储。
A.JobTracker        B.TaskTracker        C.HDFS        D.HBase
第四章 HDFS文件系统
1.___________是指跨多台计算或服务器的文件或文件夹,数据存储在多台机器而不是单台机器上。
A.分布式存储            B.分页式存储            C.链式存储        D.顺序存储
2.下列关于hadoop系统架构叙述不正确的一项为________
A.由一台Intel x86处理器的服务器或PC机组成。
B.部署在低成本Intel/linux硬件平台上。
C.通过高速局域网构成一个计算集。
D.各个节点上运行Linux操作系统。
3.主节点程序__________
A.NameNode        B.DataNode        C.SecondaryNameNode        D.Jobtracker
4hbase属于什么数据库. 从节点程序__________
A.NameNode        B.DataNode        C.SecondaryNameNode        D.Jobtracker
5.HDFS结构不包括________
A.Master体系结构            B.主从服务器        C.元数据服务器        D.存储服务器
6.HDFS分布式文件系统的特点为____________
A.半透明性        B.低可用性        C.可扩展性        D.支持一个应用程序并发访问
7.HDFS中的block默认保存____份。
A.3        B.2        C.1        D.不确定
8.下列_______通常与NameNode在一个节点启动。
A.SecondaryNameNode
B.DataNode
C.TaskTracker
D.Jobtracker
9.HDFS每个文件被划分成______大小的多个block,属于同一个文件的blocks分散存储在不同DataNode上。
A.32MB
B.64MB
C.128MB
D.无法确定
10.下面哪个程序负责HDFS 数据存储?( 
A.NameNode
B.JobTracker
C.DataNode
D.SecondaryNameNode
E.tasktracker
11.NameNode是HDFS系统中的管理局节点,它管理文件系统的命名空间,记录每个文件数据块在DataNode上的位置和副本信息、协调客户端对文件的访问、记录命名空间内的改动
和空间本身属性的改动。
A.错误            B.正确
12.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠行、高扩展性、高吞吐率等特征,适合的读写任务是________
A.一次写入,少次读取
B.多次写入,少次读取
C.多次写入,多次读取
D.一次写入,多次读取
13.关于HDFS的文件写入,正确的是_________
A.支持多用户对同一文件的写操作
B.用户可以在文件任意位置进行修改
C.默认将文件复制成三份存放
D.复制的文件块默认存在同一机架上
14. Client在HDFS上进行文件写入时,namenode根据文件大小和配置情况,返回部分datanode信息,谁负责将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块
A.Client
B.Namenode
C.Datanode
D.Secondary namenode
15. HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括
A.利用SequenceFile、MapFile、Har等方式归档小文件
B. 多Master设计
C. Block大小适当调小
D.调大namenode内存或将文件系统元数据存到硬盘里
16. 在HDFS的数据读取过程中,客服端首先调用________的实例的open()方法打开一个文件。
A.DistributedFileSystem        B.FileSystem      C.FSDataOutputSystem        D.OutputSystem
17.在HDFS的数据读取过程中,DistributedFileSystem获取这些信息后,生成一个__________对象实例返回给客户端。
A.DistributedFileSystem                B.FSDataInputSystem     
C.FSDataOutputSystem                D.InputSystem
18.在HDFS的数据读取过程中,客户端读取完所有数据块后,调用___________的close()接口关闭这个文件。
A.DistributedFileSystem                B.FSDataInputSystem     
C.FSDataOutputSystem                D.InputSystem
19.在HDFS的数据写入过程中,客服端首先调用________的实例的create()方法打开一个文件。
A.DistributedFileSystem        B.FileSystem      C.FSDataOutputSystem        D.OutputSystem
20. 在HDFS的数据写入过程中,客户端写完所有数据块后,调用___________的close()方法结束这次文件写入操作。
A.DistributedFileSystem                B.FSDataInputSystem     
C.FSDataOutputSystem                D.InputSystem
21.HDFS的错误检测不包括_________
A.NameNode检测        B.DataNode检测        C.数据错误检测        D.冗余检测
第五章 MapReduce原理与编程
1.MapReduce应用于__________的数据处理。
A.小规模        B.中小规模        C.大规模        D.超大规模
2.MapReduce能处理的海量数据大于______
A.1TB        B.10GB        C.10TB        D.1PB

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。