Spark基础(习题卷2)
第1部分:单项选择题,共72题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]Hive 适合()环境
A)Hive 适合用于联机(online)事务处理
B)提供实时查询功能
C)适合应用在大量不可变数据的批处理作业
D)Hive 适合关系型数据环境
答案:C
解析:
2.[单选题]在Spark中,collect方法的返回值类型是?
A)Array
B)Map
C)Set
D)List
答案:A
解析:
3.[单选题]以下选项哪个是 MapReduce 正确的运行模型()
A)Reduce-Map-Shuffle
B)Shuffle-Map-Reduce
C)Map-Shuffle-Reducescala不是内部或外部命令
D)Map-Reduce-Shuffle
答案:C
解析:
4.[单选题]下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()
A)一个Map函数就是对一部分原始数据进行指定的操作。
B)一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。
C)Map与Map之间不是相互独立的。
D)Reducee与Reduce之间不是相互独立的。
答案:A
解析:
5.[单选题]在Spark中,makeRDD的函数的作用是什么?
A)创建RDD
B)转换RDD
C)调用RDD
D)固定RDD
答案:A
解析:
6.[单选题]如果一个split文件中有3行内容,则MapReduce框架将为其分配一个任务进程MapTask,MapTask调用()次
D)4
答案:C
解析:
7.[单选题]在Spark中,flatMap函数与map函数的区别是?
A)前者参数较多
B)后者参数较少
C)前者可以将一个元素映射为多个
D)后者可以将一个元素映射为多个
答案:C
解析:
8.[单选题]当客户端需要读取HDFS中存储的文件时,首先向()发起读请求。
A)DataNode
B)NameNode
C)Yarn
D)Zookeeper
答案:B
解析:
9.[单选题]在读取文件过程变成RDD过程中,元素是指文件的什么?
A)整个文件内容
B)文件的一行
C)文件的一段
D)文件中特定符号
答案:B
解析:
10.[单选题]查看 HDFS 的报告命令是()
A)bin/hdfs dfsadmin -report
B)bin/hdfs -report
C)bin/hdfs deadmin -report
D)bin/hdfs dfs -report
答案:A
解析:
11.[单选题]MapReduce 中哪一种文件输入格式可以自动切割并合并小文件?()
A)NLinelmputFormat
B)TextInputFormat
C)CombineFileInputFormat
D)KeyValueTextInputFormat
答案:C
解析:
12.[单选题]在Spark中,Spark 项目采用什么语言编写?
A)Java
B)html
13.[单选题]Hive查询语言和SQL的一个不同之处在于()操作
A)Group by
B)Join
C)Partition
D)Union
答案:C
解析:
14.[单选题]下列选项描述错误的是?()
A)Hadoop HA即集中包含Secondary NameNode作为备份节点存在。
B)ResourceManager负责的是整个Yarn集资源的监控、分配和管理工作
C)NodeManager负责定时的向ResourceManager汇报所在节点的资源使用情况以及接收并处理来自ApplicationMaster的启动停止容器(Container)的各种请求。
D)初次启动Hadoop HA集时,需要将格式化文件系统后的目录拷贝至另外一台NameNode节点上。
答案:A
解析:
15.[单选题]关于Secondary NameNode哪项是正确?
A)它是 NameNode 的热
B)它对内存没有要求
C)它的目的是帮助 NameNode合并编辑日志,减少NameNode启动时间
D)SecondaryNameNode 应与NameNode部署到一个节点
答案:C
解析:
16.[单选题]在读取文件中,如果读取文件夹,被看成RDD的是什么?
A)每一个文件
B)子文件夹
C)整个文件夹
D)看情况而定
答案:C
解析:
17.[单选题]在Spark中,下面输出与其他不一致的是?
A)println("Hello World")
B)print("Hello World\n")
C)printf("Hello %s", "World\n")
D)val w = "World" ; println("Hello $w")
答案:D
解析:
18.[单选题]在 Scala 中,什么元组的最简单形式
A)对偶
B)集合
C)数组
D)枚举
19.[单选题]在Kafka中使用()命令来创建生产者。
A)kafka-console-producer.sh
B)kafka-console-consumer.sh
C)kafka-topics.sh
D)kafka- producer-console.sh
答案:A
解析:
20.[单选题]在Scala List 的常用方法中,哪个是在列表开头添加指定列表的元素
A)def +:(elem: A)
B)def ::(x: A)
C)def :::(prefix: List[A])
D)def :+(elem: A)
答案:C
解析:
21.[单选题]下列哪些不是 ZooKeeper 的特点()
A)顺序一致性
B)原子性
C)多样系统映像
D)可靠性
答案:C
解析:
22.[单选题]在Spark中,BigInt(2).pow(1024) 起什么作用?
A)计算2的1024次方
B)计算1024的2次方
C)计算1024*2
D)以上都不是
答案:A
解析:
23.[单选题]MapReduce自定义排序规则需要重写下列那项方法()
A)readFields()
B)compareTo()
C)map()
D)reduce()
答案:B
解析:
24.[单选题]在Spark中,列表的head操作起什么作用?
A)返回列表第一个元素
B)返回一个列表,包含除了第一元素之外的其他元素
C)在列表为空时返回true
D)以上都不是
答案:A
解析:
C)主构造器的会执行类定义中的所有语句
D)主构造器中可以使用默认参数
答案:A
解析:
26.[单选题]在Spark中,高阶函数是指?
A)在程序中应该首先被定义的函数
B)将函数作为参数,并返回结果为函数的函数
C)函数参数为函数或返回结果为函数的函数
D)执行时间长的函数
答案:C
解析:
27.[单选题]在Spark中,parallelize函数的作用是什么?
A)创建RDD
B)转换RDD
C)调用RDD
D)固定RDD
答案:A
解析:
28.[单选题]在 hadoop 配置中 l 作用是( )
A)用于定义系统级别的参数
B)用于名称节点和数据节点的存放位置
C)用于配置 JobHistory Server 和应用程序参数
D)配置 ResourceManager,NodeManager 的通信端口
答案:D
解析:
29.[单选题]在Spark中,定义类 Class Person(private val name: String){},以下说法正确是?
A)name是对象私有字段
B)name是类私有字段,有私有的getter方法
C)name是类公有字段,有公有的getter和setter方法
D)name是类私有字段,可以在类内部被改变
答案:B
解析:
30.[单选题]Sqoop 是 Hadoop 和关系数据库服务器之间传送数据的工具,下列哪种数据库是不支持使用 Sqoop 直接进行数据 传送()
A)Postgres
B)Oracle
C)MySQL
D)Redis
答案:D
解析:
31.[单选题]在Spark中,类定义如下abstract class Element{def contents: Array[String]},描述不正确的是?
A)Element是一个抽象类

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。