Spark基础(习题卷2)--688IT编程网

Spark基础(习题卷2)

第1部分：单项选择题，共72题，每题只有一个正确答案，多选或少选均不得分。

1.[单选题]Hive 适合（）环境

A)Hive 适合用于联机(online)事务处理

B)提供实时查询功能

C)适合应用在大量不可变数据的批处理作业

D)Hive 适合关系型数据环境

答案:C

解析:

2.[单选题]在Spark中，collect方法的返回值类型是？

A)Array

B)Map

C)Set

D)List

答案:A

解析:

3.[单选题]以下选项哪个是 MapReduce 正确的运行模型（）

A)Reduce-Map-Shuffle

B)Shuffle-Map-Reduce

C)Map-Shuffle-Reducescala不是内部或外部命令

D)Map-Reduce-Shuffle

答案:C

解析:

4.[单选题]下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是（）

A)一个Map函数就是对一部分原始数据进行指定的操作。

B)一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。

C)Map与Map之间不是相互独立的。

D)Reducee与Reduce之间不是相互独立的。

答案:A

解析:

5.[单选题]在Spark中，makeRDD的函数的作用是什么？

A)创建RDD

B)转换RDD

C)调用RDD

D)固定RDD

答案:A

解析:

6.[单选题]如果一个split文件中有3行内容，则MapReduce框架将为其分配一个任务进程MapTask，MapTask调用（）次

D)4

答案:C

解析:

7.[单选题]在Spark中，flatMap函数与map函数的区别是？

A)前者参数较多

B)后者参数较少

C)前者可以将一个元素映射为多个

D)后者可以将一个元素映射为多个

答案:C

解析:

8.[单选题]当客户端需要读取HDFS中存储的文件时，首先向（）发起读请求。

A)DataNode

B)NameNode

C)Yarn

D)Zookeeper

答案:B

解析:

9.[单选题]在读取文件过程变成RDD过程中，元素是指文件的什么？

A)整个文件内容

B)文件的一行

C)文件的一段

D)文件中特定符号

答案:B

解析:

10.[单选题]查看 HDFS 的报告命令是（）

A)bin/hdfs dfsadmin -report

B)bin/hdfs -report

C)bin/hdfs deadmin -report

D)bin/hdfs dfs -report

答案:A

解析:

11.[单选题]MapReduce 中哪一种文件输入格式可以自动切割并合并小文件?（）

A)NLinelmputFormat

B)TextInputFormat

C)CombineFileInputFormat

D)KeyValueTextInputFormat

答案:C

解析:

12.[单选题]在Spark中，Spark 项目采用什么语言编写？

A)Java

B)html

13.[单选题]Hive查询语言和SQL的一个不同之处在于（）操作

A)Group by

B)Join

C)Partition

D)Union

答案:C

解析:

14.[单选题]下列选项描述错误的是？（）

A)Hadoop HA即集中包含Secondary NameNode作为备份节点存在。

B)ResourceManager负责的是整个Yarn集资源的监控、分配和管理工作

C)NodeManager负责定时的向ResourceManager汇报所在节点的资源使用情况以及接收并处理来自ApplicationMaster的启动停止容器（Container）的各种请求。

D)初次启动Hadoop HA集时，需要将格式化文件系统后的目录拷贝至另外一台NameNode节点上。

答案:A

解析:

15.[单选题]关于Secondary NameNode哪项是正确？

A)它是 NameNode 的热

B)它对内存没有要求

C)它的目的是帮助 NameNode合并编辑日志，减少NameNode启动时间

D)SecondaryNameNode 应与NameNode部署到一个节点

答案:C

解析:

16.[单选题]在读取文件中，如果读取文件夹，被看成RDD的是什么？

A)每一个文件

B)子文件夹

C)整个文件夹

D)看情况而定

答案:C

解析:

17.[单选题]在Spark中，下面输出与其他不一致的是？

A)println("Hello World")

B)print("Hello World\n")

C)printf("Hello %s", "World\n")

D)val w = "World" ; println("Hello $w")

答案:D

解析:

18.[单选题]在 Scala 中，什么元组的最简单形式

A)对偶

B)集合

C)数组

D)枚举

19.[单选题]在Kafka中使用（）命令来创建生产者。

A)kafka-console-producer.sh

B)kafka-console-consumer.sh

C)kafka-topics.sh

D)kafka- producer-console.sh

答案:A

解析:

20.[单选题]在Scala List 的常用方法中，哪个是在列表开头添加指定列表的元素

A)def +:(elem: A)

B)def ::(x: A)

C)def :::(prefix: List[A])

D)def :+(elem: A)

答案:C

解析:

21.[单选题]下列哪些不是 ZooKeeper 的特点（）

A)顺序一致性

B)原子性

C)多样系统映像

D)可靠性

答案:C

解析:

22.[单选题]在Spark中，BigInt(2).pow(1024) 起什么作用？

A)计算2的1024次方

B)计算1024的2次方

C)计算1024＊2

D)以上都不是

答案:A

解析:

23.[单选题]MapReduce自定义排序规则需要重写下列那项方法（）

A)readFields()

B)compareTo()

C)map()

D)reduce()

答案:B

解析:

24.[单选题]在Spark中，列表的head操作起什么作用？

A)返回列表第一个元素

B)返回一个列表，包含除了第一元素之外的其他元素

C)在列表为空时返回true

D)以上都不是

答案:A

解析:

C)主构造器的会执行类定义中的所有语句

D)主构造器中可以使用默认参数

答案:A

解析:

26.[单选题]在Spark中，高阶函数是指？

A)在程序中应该首先被定义的函数

B)将函数作为参数，并返回结果为函数的函数

C)函数参数为函数或返回结果为函数的函数

D)执行时间长的函数

答案:C

解析:

27.[单选题]在Spark中，parallelize函数的作用是什么？

A)创建RDD

B)转换RDD

C)调用RDD

D)固定RDD

答案:A

解析:

28.[单选题]在 hadoop 配置中 l 作用是（）

A)用于定义系统级别的参数

B)用于名称节点和数据节点的存放位置

C)用于配置 JobHistory Server 和应用程序参数

D)配置 ResourceManager，NodeManager 的通信端口

答案:D

解析:

29.[单选题]在Spark中，定义类 Class Person（private val name: String）{}，以下说法正确是？

A)name是对象私有字段

B)name是类私有字段，有私有的getter方法

C)name是类公有字段，有公有的getter和setter方法

D)name是类私有字段，可以在类内部被改变

答案:B

解析:

30.[单选题]Sqoop 是 Hadoop 和关系数据库服务器之间传送数据的工具，下列哪种数据库是不支持使用 Sqoop 直接进行数据传送（）

A)Postgres

B)Oracle

C)MySQL

D)Redis

答案:D

解析:

31.[单选题]在Spark中，类定义如下abstract class Element{def contents: Array[String]}，描述不正确的是？

A)Element是一个抽象类

688IT编程网

Spark基础(习题卷2)

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

Spark基础(习题卷2)

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法