第一章 大数据概述
1.互联网的发展分为______个阶段。
A.一 B.三 C.二 D.四
2.下列不属于大数据特点的是( )。
A.种类和来源多样化 B.数据量巨大 C.分析处理速度快 D.价值密度高
3.互联网发展的第_____个时代为智能互联网。
A.3.0 B.4.0 C.1.0 D.2.0
4.关于大数据叙述不正确的一项是( )。
A.大数据=“海量数据”+“复杂类型的数据”
B.大数据是指在一定时间对内容抓取、管理和处理的数据集合
C.大数据可以及时有效的分析海量的数据
D.数据包括结构化数据、半结构化数据、结构化数据。
5.下列数据换算正确的一项为( )。
A.1YB=1024EB
B.1TB=1024MB
C.1PB==1024EB
D.1024ZB=1EB
6.结构化数据的表现形式为______。
A.文本 B.视图 C.二维表 D.查询
7.结构化的数据,先有________,再有_________.
A.数据 结构
B.结构 数据
C.内容 结构
D.结构 内容
8.结构化的数据,先有________,再有_________.
A.数据 结构
B.结构 数据
C.内容 结构
D.结构 内容
9.软件是大数据的_________。
A.核心 B.部件 C.引擎 D.集合
10.大数据技术不包括( )。
A.数据计算 B.数据存储 C.数据冗余 D.数据采集
11.大数据的特点不包括( )。
A.数量大 B.类型少 C.速度快 D.价值高
第二章 Hadoop简介
1.下列对云栈架构层数不正确的一项为________。
A.三层云栈架构
B.四层云栈架构
C.五层云栈架构
D.六层云栈架构
2.下列______不是云计算三层架构的概括。
A.IaaS B.PaaS C.SaaP D.SaaS
3.IaaS基础设施及服务可以称为______。
A.弹性计算 B.效用计算 C.有效计算 D.随需应用
4.四层云栈模式,是将三层模式中的_________进行分解,分为两层,一层为硬件层,一层为虚拟资源层。
A.硬件部分 B.虚拟化部分 C.基础设施 D.平台
5.五层云栈模式,第五层为______。
A.固件/硬件层 B.云基本资源层 C.云应用程序层 D.云软件环境层
6.大数据是_____的应用。
A.人工智能 B.云计算 C.物联网 D.互联网
7.hadoop______中第一阶段的输出可以作为下一阶段的输入。
A.应用场景 B.分布式计算 C.分阶段计算 D.高效处理
8. .hadoop______中将海量数据分割于多个节点,由每个节点并行计算,将得到的结果归并
到输出。
A.应用场景 B.分布式计算 C.分阶段计算 D.高效处理
9.下列选项中不是hadoop特点的是_____。
A.可靠性 B.扩容能力 C.高效率 D.成本高
10.hadoop能可靠地存储和处理_____字节数据。
A.TB B.PB C.YB D.ZB
11.hadoop集可以用___种模式进行。
A.四 B.三 C.五 D.二
12.hadoop集不可以在_____________进行。
A.联机模式 B.单机模式 C.虚拟分布模式 D.完全分布模式
13.________模式:hadoop安装时的默认模式,不对配置文件进行修改。
A.联机 B.单机 C.虚拟分布 D.完全分布
14.________模式:在一台机器上用软件模拟多节点集。
A.联机 B.单机 C.虚拟分布 D.完全分布
15.________模式:Hadoop安装运行在多台主机上,构成一个真实的hadoop集,在所有的节点上都安装JDK和hadoop,相互通过高速局域网连接。
A.联机 B.单机 C.虚拟分布 D.完全分布
16.完全分布式,各节点之间设置________,将各个从节点生成的公钥添加到主节点的信任列表。
A.SSH B.JDK C.hadoop D.HDFS
17.完全分布式,不需要修改的配置文件为_______。
A.l l C.hadoop-env.sh l
18.HDFS架构中有两个_________。
A.DataNodes B. JobTracke C.NameNode D.SecondayNameNode
19.下列不是hadoop核心组件的是________。
A.JobTracker B.TaskTracker C.HDFS D.Hbase
20._______存储Hadoop集中所有存储节点上的文件,为海量提供存储。
A.JobTracker B.TaskTracker C.HDFS D.HBase
第四章 HDFS文件系统
1.___________是指跨多台计算或服务器的文件或文件夹,数据存储在多台机器而不是单台机器上。
A.分布式存储 B.分页式存储 C.链式存储 D.顺序存储
2.下列关于hadoop系统架构叙述不正确的一项为________。
A.由一台Intel x86处理器的服务器或PC机组成。
B.部署在低成本Intel/linux硬件平台上。
C.通过高速局域网构成一个计算集。
D.各个节点上运行Linux操作系统。
3.主节点程序__________。
A.NameNode B.DataNode C.SecondaryNameNode D.Jobtracker
4hbase属于什么数据库. 从节点程序__________。
A.NameNode B.DataNode C.SecondaryNameNode D.Jobtracker
5.HDFS结构不包括________。
A.Master体系结构 B.主从服务器 C.元数据服务器 D.存储服务器
6.HDFS分布式文件系统的特点为____________。
A.半透明性 B.低可用性 C.可扩展性 D.支持一个应用程序并发访问
7.HDFS中的block默认保存____份。
A.3 B.2 C.1 D.不确定
8.下列_______通常与NameNode在一个节点启动。
A.SecondaryNameNode
B.DataNode
C.TaskTracker
D.Jobtracker
9.HDFS每个文件被划分成______大小的多个block,属于同一个文件的blocks分散存储在不同DataNode上。
A.32MB
B.64MB
C.128MB
D.无法确定
10.下面哪个程序负责HDFS 数据存储?( )
A.NameNode
B.JobTracker
C.DataNode
D.SecondaryNameNode
E.tasktracker
11.NameNode是HDFS系统中的管理局节点,它管理文件系统的命名空间,记录每个文件数据块在DataNode上的位置和副本信息、协调客户端对文件的访问、记录命名空间内的改动
和空间本身属性的改动。
A.错误 B.正确
12.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠行、高扩展性、高吞吐率等特征,适合的读写任务是________。
A.一次写入,少次读取
B.多次写入,少次读取
C.多次写入,多次读取
D.一次写入,多次读取
13.关于HDFS的文件写入,正确的是_________。
A.支持多用户对同一文件的写操作
B.用户可以在文件任意位置进行修改
C.默认将文件复制成三份存放
D.复制的文件块默认存在同一机架上
14. Client在HDFS上进行文件写入时,namenode根据文件大小和配置情况,返回部分datanode信息,谁负责将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块
A.Client
B.Namenode
C.Datanode
D.Secondary namenode
15. HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括
A.利用SequenceFile、MapFile、Har等方式归档小文件
B. 多Master设计
C. Block大小适当调小
D.调大namenode内存或将文件系统元数据存到硬盘里
16. 在HDFS的数据读取过程中,客服端首先调用________的实例的open()方法打开一个文件。
A.DistributedFileSystem B.FileSystem C.FSDataOutputSystem D.OutputSystem
17.在HDFS的数据读取过程中,DistributedFileSystem获取这些信息后,生成一个__________对象实例返回给客户端。
A.DistributedFileSystem B.FSDataInputSystem
C.FSDataOutputSystem D.InputSystem
18.在HDFS的数据读取过程中,客户端读取完所有数据块后,调用___________的close()接口关闭这个文件。
A.DistributedFileSystem B.FSDataInputSystem
C.FSDataOutputSystem D.InputSystem
19.在HDFS的数据写入过程中,客服端首先调用________的实例的create()方法打开一个文件。
A.DistributedFileSystem B.FileSystem C.FSDataOutputSystem D.OutputSystem
20. 在HDFS的数据写入过程中,客户端写完所有数据块后,调用___________的close()方法结束这次文件写入操作。
A.DistributedFileSystem B.FSDataInputSystem
C.FSDataOutputSystem D.InputSystem
21.HDFS的错误检测不包括_________。
A.NameNode检测 B.DataNode检测 C.数据错误检测 D.冗余检测
第五章 MapReduce原理与编程
1.MapReduce应用于__________的数据处理。
A.小规模 B.中小规模 C.大规模 D.超大规模
2.MapReduce能处理的海量数据大于______。
A.1TB B.10GB C.10TB D.1PB
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论