⼤数据技术原理与应⽤课后题(林⼦⾬)⼤数据技术原理与应⽤(林⼦⾬)
第1章⼤数据概述
1单选(2分)
第三次信息化浪潮的标志是:
A.个⼈电脑的普及
B.云计算、⼤数据、物联⽹技术的普及
C.虚拟现实技术的普及
D.互联⽹的普及
正确答案:B你选对了
2单选(2分)
就数据的量级⽽⾔,1PB数据是多少TB?
A.2048
B.1000
C.512
D.1024
正确答案:D你选对了
3单选(2分)
以下关于云计算、⼤数据和物联⽹之间的关系,论述错误的是:
A.云计算侧重于数据分析
B.物联⽹可以借助于云计算实现海量数据的存储
C.物联⽹可以借助于⼤数据实现海量数据的分析
D.云计算、⼤数据和物联⽹三者紧密相关,相辅相成
正确答案:A你选对了
4单选(2分)
以下哪个不是⼤数据时代新兴的技术:
A.Spark
B.Hadoop
C.HBase
D.MySQL
正确答案:D你选对了
5单选(2分)
每种⼤数据产品都有特定的应⽤场景,以下哪个产品是⽤于批处理的:
A.MapReduce
B.Dremel
C.Storm
D.Pregel
正确答案:A你选对了
6单选(2分)
每种⼤数据产品都有特定的应⽤场景,以下哪个产品是⽤于流计算的:
A.GraphX
B.S4
C.Impala
D.Hive
正确答案:B你选对了
每种⼤数据产品都有特定的应⽤场景,以下哪个产品是⽤于图计算的:
A.Pregel
B.Storm
C.Cassandra
D.Flume
正确答案:A你选对了
8单选(2分)
每种⼤数据产品都有特定的应⽤场景,以下哪个产品是⽤于查询分析计算的:
A.HDFS
B.S4
C.Dremel
D.MapReduce
正确答案:C你选对了
9多选(3分)
数据产⽣⽅式⼤致经历了三个阶段,包括:
A.运营式系统阶段
B.感知式系统阶段
C.移动互联⽹数据阶段
D.⽤户原创内容阶段
正确答案:ABD你选对了
10多选(3分)
⼤数据发展的三个阶段是:
A.低⾕期
B.成熟期
C.⼤规模应⽤期
D.萌芽期
正确答案:BCD你选对了
11多选(3分)
⼤数据的特性包括:
A.价值密度低
B.处理速度快
C.数据类型繁多
D.数据量⼤
正确答案:ABCD你选对了
12多选(3分)
图领奖获得者、著名数据库专家Jim Gray博⼠认为,⼈类⾃古以来在科学研究上先后经历了哪⼏种范式:
A.计算科学
B.数据密集型科学
C.实验科学
D.理论科学
正确答案:ABCD你选对了
13多选(3分)
⼤数据带来思维⽅式的三个转变是:
A.效率⽽⾮精确
B.相关⽽⾮因果
C.精确⽽⾮全⾯
D.全样⽽⾮抽样
正确答案:ABD你选对了
⼤数据主要有哪⼏种计算模式:
A.流计算
B.图计算
C.查询分析计算
D.批处理计算
正确答案:ABCD你选对了
15多选(3分)
云计算的典型服务模式包括三种:
A.SaaS
B.IaaS
C.MaaS
D.PaaS
正确答案:ABD你选对了
第2章⼤数据处理架构Hadoop
1单选(2分)
启动hadoop所有进程的命令是:
A.start-dfs.sh
B.start-all.sh
C.start-hadoop.sh
D.start-hdfs.sh
正确答案:B你选对了
2单选(2分)
以下对Hadoop的说法错误的是:
A.Hadoop是基于Java语⾔开发的,只⽀持Java语⾔编程
B.Hadoop2.0增加了NameNode HA和Wire-compatibility两个重⼤特性
C.Hadoop MapReduce是针对⾕歌MapReduce的开源实现,通常⽤于⼤规模数据集的并⾏计算
D.Hadoop的核⼼是HDFS和MapReduce
正确答案:A你选对了
3单选(2分)
以下哪个不是Hadoop的特性:
A.成本⾼
B.⽀持多种编程语⾔
云数据库服务C.⾼容错性
D.⾼可靠性
正确答案:A你选对了
4单选(2分)
以下名词解释不正确的是:
A.Zookeeper:针对⾕歌Chubby的⼀个开源实现,是⾼效可靠的协同⼯作系统
B.HBase:提供⾼可靠性、⾼性能、分布式的⾏式数据库,是⾕歌BigTable的开源实现
C.Hive:⼀个基于Hadoop的数据仓库⼯具,⽤于对Hadoop⽂件中的数据集进⾏数据整理、特殊查询和分析存储
D.HDFS:分布式⽂件系统,是Hadoop项⽬的两⼤核⼼之⼀,是⾕歌GFS的开源实现
正确答案:B你选对了
5多选(3分)
以下哪些组件是Hadoop的⽣态系统的组件:
A.HBase
B.Oracle
C.HDFS
D.MapReduce
正确答案:ACD你选对了
以下哪个命令可以⽤来操作HDFS⽂件:
A.hadoop fs
B.hadoop dfs
C.hdfs fs
D.hdfs dfs
正确答案:ABD你选对了
第3章分布式⽂件系统HDFS
1单选(2分)
HDFS的命名空间不包含:
A.字节
B.⽂件
C.块
D.⽬录
正确答案:A你选对了
2单选(2分)
对HDFS通信协议的理解错误的是:
A.客户端与数据节点的交互是通过RPC(Remote Procedure Call)来实现的
B.客户端通过⼀个可配置的端⼝向名称节点主动发起TCP连接,并使⽤客户端协议与名称节点进⾏交互
C.名称节点和数据节点之间则使⽤数据节点协议进⾏交互
D.HDFS通信协议都是构建在IoT协议基础之上的
正确答案:D你选对了
3单选(2分)
采⽤多副本冗余存储的优势不包含:
A.保证数据可靠性
B.容易检查数据错误
C.加快数据传输速度
D.节约存储空间
正确答案:D你选对了
4单选(2分)
假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是:
A.start-dfs.sh,stop-hdfs.sh
B.start-hdfs.sh,stop-hdfs.sh
C.start-dfs.sh,stop-dfs.sh
D.start-hdfs.sh,stop-dfs.sh
正确答案:C你选对了
5单选(2分)
分布式⽂件系统HDFS采⽤了主从结构模型,由计算机集中的多个节点构成的,这些节点分为两类,⼀类存储元数据叫 ,另⼀类存储具体数据叫 :
A.名称节点,主节点
B.从节点,主节点
C.名称节点,数据节点
D.数据节点,名称节点
正确答案:C你选对了
下⾯关于分布式⽂件系统HDFS的描述正确的是:
A.分布式⽂件系统HDFS是Google Bigtable的⼀种开源实现
B.分布式⽂件系统HDFS是⾕歌分布式⽂件系统GFS(Google File System)的⼀种开源实现
C.分布式⽂件系统HDFS⽐较适合存储⼤量零碎的⼩⽂件
D.分布式⽂件系统HDFS是⼀种关系型数据库
正确答案:B你选对了
7多选(3分)
以下对名称节点理解正确的是:
A.名称节点作为中⼼服务器,负责管理⽂件系统的命名空间及客户端对⽂件的访问
B.名称节点⽤来负责具体⽤户数据的存储
C.名称节点通常⽤来保存元数据
D.名称节点的数据保存在内存中
正确答案:ACD你选对了
8多选(3分)
以下对数据节点理解正确的是:
A.数据节点通常只有⼀个
B.数据节点⽤来存储具体的⽂件内容
C.数据节点的数据保存在磁盘中
D.数据节点在名称节点的统⼀调度下进⾏数据块的创建、删除和复制等操作
正确答案:BCD你选对了
9多选(3分)
HDFS只设置唯⼀⼀个名称节点带来的局限性包括:
A.集的可⽤性
B.性能的瓶颈
C.命名空间的限制
D.隔离问题
正确答案:ABCD你选对了
10多选(3分)
以下HDFS相关的shell命令不正确的是:
A.hadoop dfs mkdir :创建 指定的⽂件夹
B.hdfs dfs -rm :删除路径 指定的⽂件
C.hadoop fs -copyFromLocal :将路径指定的⽂件或⽂件夹复制到路径指定的⽂件夹中
D.hadoop fs -ls :显⽰ 指定的⽂件的详细信息
正确答案:AC你选对了
第4章分布式数据库HBase
1单选(2分)
HBase是⼀种 数据库
A.⾏式数据库
B.关系数据库
C.⽂档数据库
D.列式数据库
正确答案:D你选对了
2单选(2分)
下列对HBase数据模型的描述错误的是:
A.每个HBase表都由若⼲⾏组成,每个⾏由⾏键(row key)来标识
B.HBase是⼀个稀疏、多维度、排序的映射表,这张表的索引是⾏键、列族、列限定符和时间戳
C.HBase中执⾏更新操作时,会删除数据旧的版本,并⽣成⼀个新的版本
D.HBase列族⽀持动态扩展,可以很轻松地添加⼀个列族或列
正确答案:C你选对了
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论