大数据技术原理与应用
第1章 大数据概述
1单选(2分)
第三次信息化浪潮的标志是:
A.个人电脑的普及
B.云计算、大数据、物联网技术的普及
C.虚拟现实技术的普及
D.互联网的普及
正确答案:B你选对了
2单选(2分)
编程语言有哪几种类就数据的量级而言,1PB数据是多少TB?
A.2048
B.1000
C.512
D.1024
正确答案:D你选对了
3单选(2分)
以下关于云计算、大数据和物联网之间的关系,论述错误的是:
A.云计算侧重于数据分析
B.物联网可借助于云计算实现海量数据的存储
C.物联网可借助于大数据实现海量数据的分析
D.云计算、大数据和物联网三者紧密相关,相辅相成
正确答案:A你选对了
4单选(2分)
以下哪个不是大数据时代新兴的技术:
A.Spark
B.Hadoop
C.HBase
D.MySQL
正确答案:D你选对了
5单选(2分)
每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:
A.MapReduce
B.Dremel
C.Storm
D.Pregel
正确答案:A你选对了
6单选(2分)
每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:
A.GraphX
B.S4
C.Impala
D.Hive
正确答案:B你选对了
7单选(2分)
每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:
A.Pregel
B.Storm
C.Cassandra
D.Flume
正确答案:A你选对了
8单选(2分)
每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:
A.HDFS
B.S4
C.Dremel
D.MapReduce
正确答案:C你选对了
9多选(3分)
数据产生方式大致经历三个阶段,包括:
A.运营式系统阶段
B.感知式系统阶段
C.移动互联网数据阶段
D.用户原创内容阶段
正确答案:ABD你选对了
10多选(3分)
大数据发展三个阶段是:
A.低谷期
B.成熟期
C.大规模应用期
D.萌芽期
正确答案:BCD你选对了
11多选(3分)
大数据的特性包括:
A.价值密度低
B.处理速度快
C.数据类型繁多
D.数据量大
正确答案:ABCD你选对了
12多选(3分)
图领奖获得者、著名数据库专家Jim Gray博士认为,人类自古以来在科学研究上先后经历哪几种范式:
A.计算科学
B.数据密集型科学
C.实验科学
D.理论科学
正确答案:ABCD你选对了
13多选(3分)
大数据带来思维方式的三个转变是:
A.效率而非精确
B.相关而非因果
C.精确而非全面
D.全样而非抽样
正确答案:ABD你选对了
14多选(3分)
大数据主要有哪几种计算模式:
A.流计算
B.图计算
C.查询分析计算
D.批处理计算
正确答案:ABCD你选对了
15多选(3分)
云计算的典型服务模式包括三种:
A.SaaS
B.IaaS
C.MaaS
D.PaaS
正确答案:ABD你选对了
第2章 大数据处理架构Hadoop
1单选(2分)
启动hadoop所有进程的命令是:
A.start-dfs.sh
B.start-all.sh
C.start-hadoop.sh
D.start-hdfs.sh
正确答案:B你选对了
2单选(2分)
以下对Hadoop的说法错误的是:
A.Hadoop是基于Java语言开发的,只支持Java语言编程
B.Hadoop2.0增加了NameNode HA和Wire-compatibility两个重大特性
C.Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
D.Hadoop的核心是HDFS和MapReduce
正确答案:A你选对了
3单选(2分)
以下哪个不是Hadoop的特性:
A.成本高
B.支持多种编程语言
C.高容错性
D.高可靠性
正确答案:A你选对了
4单选(2分)
以下名词解释不正确的是:
A.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
B.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
C.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
D.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
正确答案:B你选对了
5多选(3分)
以下哪些组件是Hadoop的生态系统的组件:
A.HBase
B.Oracle
C.HDFS
D.MapReduce
正确答案:ACD你选对了
6多选(3分)
以下哪个命令可用来操作HDFS文件:
A.hadoop fs
B.hadoop dfs
C.hdfs fs
D.hdfs dfs
正确答案:ABD你选对了
第3章 分布式文件系统HDFS
1单选(2分)
HDFS的命名空间不包含:
A.字节
B.文件
C.块
D.目录
正确答案:A你选对了
2单选(2分)
对HDFS通信协议的理解错误的是:
A.客户端与数据节点的交互是通过RPC(Remote Procedure Call)来实现的
B.客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互
C.名称节点和数据节点之间则使用数据节点协议进行交互
D.HDFS通信协议都是构建在IoT协议基础之上的
正确答案:D你选对了
3单选(2分)
采用多副本冗余存储的优势不包含:
A.保证数据可靠性
B.容易检查数据错误
C.加快数据传输速度
D.节约存储空间
正确答案:D你选对了
4单选(2分)
假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是:
A.start-dfs.sh,stop-hdfs.sh
B.start-hdfs.sh,stop-hdfs.sh
C.start-dfs.sh,stop-dfs.sh
D.start-hdfs.sh,stop-dfs.sh
正确答案:C你选对了
5单选(2分)
分布式文件系统HDFS采用主从结构模型,由计算机集中的多个节点构成的,这些节点分为两类,一类存储元数据叫 ,另一类存储具体数据叫 :
A.名称节点,主节点
B.从节点,主节点
C.名称节点,数据节点
D.数据节点,名称节点
正确答案:C你选对了
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论