Spark基础(试卷编号111)--688IT编程网

Spark基础(试卷编号111)

1.[单选题]在Spark中，定义一个类，定义正确的是？

A)class House（name）{def getname = “beijing”}

B)class house {name = “nanjing”}

C)class House {public var counter:String = “shanghai”}

D)class house (var name:String){private def getName = name}

答案:D

解析:

2.[单选题]在Spark中，collect方法的返回值类型是？

A)Array

B)Map

C)Set

D)List

答案:A

解析:

3.[单选题]在Spark中，spark-submit 参数中，以下选项中哪一个是任意的 Spark 配置属性

A)=--class

B)=--deploy-mode

C)=--conf

D)application-jar

答案:C

解析:

4.[单选题]MySQL 数据库驱动文件放置于 hive 哪个目录下（）

A)jar

B)lib

C)bin

D)sbin

答案:B

解析:

5.[单选题]下列哪一种命令格式是不正确的（）

A)get 表行健列族

B)scan 表时间戳起始行健结束行健

C)alter 表列族

D)put 表行键列族：列值

答案:B

解析:

scala不是内部或外部命令6.[单选题]调用Zookeeper对象创建的节点，不包括（）。

A)持久节点

B)临时节点

C)持久顺序节点

D)DataNode节点

答案:D

解析:

7.[单选题]在Scala 中，定义 Set 的格式是什么

A)val set=( 元素 , 元素…)

B)val set=[元素 , 元素…]

C)val set={ 元素 , 元素…}

D)val set=Set( 元素 , 元素…)

答案:D

解析:

8.[单选题]下列哪些操作可以设置一个Watcher（）

A)getData

B)getChildren

C)exists

D)setData

答案:D

解析:

9.[单选题]Hive 适合（）环境

A)Hive 适合用于联机(online)事务处理

B)提供实时查询功能

C)适合应用在大量不可变数据的批处理作业

D)Hive 适合关系型数据环境

答案:C

解析:

10.[单选题]在 HBase 的组件中，哪一个负责日志记录（）

A)HRegion

B)HFile

C)MemStore

D)WAL

答案:D

解析:

11.[单选题]在Spark中，map（）函数的参数类型是什么？

D)对象

答案:B

解析:

12.[单选题]HBase 与下列哪个选项属于同一种类型的数据库（）

A)MongoDB

B)MariaDB

C)MySQL

D)Oracle

答案:A

解析:

13.[单选题]下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是（）

A)一个Map函数就是对一部分原始数据进行指定的操作。

B)一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。

C)Map与Map之间不是相互独立的。

D)Reducee与Reduce之间不是相互独立的。

答案:A

解析:

14.[单选题]在Spark中，Yarn模式是否由Spark客户端直接连接Yarn，是否需要额外构建Spark集。

A)是，是

B)是，否

C)否，是

D)否，否

答案:B

解析:

15.[单选题]在Spark中，flatMap函数与map函数的区别是？

A)前者参数较多

B)后者参数较少

C)前者可以将一个元素映射为多个

D)后者可以将一个元素映射为多个

答案:C

解析:

16.[单选题]Shufile 阶段中哪一步是可选的？（）

A)排序

答案:D

解析:

17.[单选题]在Spark中，下面输出与其他不一致的是？

A)println("Hello World")

B)print("Hello World\n")

C)printf("Hello %s", "World\n")

D)val w = "World" ; println("Hello $w")

答案:D

解析:

18.[单选题]在Scala中，以下选项中哪一个是制一个数组到另一个数组上

A)def apply(x:T,xs:T*)

B)def concat[T](xss:Array[T]*)

C)def copy(src:AnyRef,srcPos:Int,dest:AnyRef,destPos:Int,length:Int)

D)def empty[T]

答案:C

解析:

19.[单选题]客户端连接Zookeeper集的命令是（）。

A)get /zk

B)delete /zk

C)zkCli.sh

D)ls /

答案:C

解析:

20.[单选题]在Spark中，filter（）方法属于什么操作？

A)转换操作

B)行动操作

C)集合操作

D)以上都不是

答案:A

解析:

21.[单选题]在Spark中，BigInt(2).pow(1024) 起什么作用？

A)计算2的1024次方

B)计算1024的2次方

C)计算1024＊2

D)以上都不是

答案:A

解析:

22.[单选题]当客户端需要读取HDFS中存储的文件时，首先向（）发起读请求。

A)DataNode

B)NameNode

C)Yarn

D)Zookeeper

答案:B

解析:

23.[单选题]在Spark中，makeRDD的函数的作用是什么？

A)创建RDD

B)转换RDD

C)调用RDD

D)固定RDD

答案:A

解析:

24.[单选题]在Spark中，不属于Scala7种数值类型的是?

A)Char

B)Int

C)Float

D)LongLong

答案:D

解析:

25.[单选题]在Spark中，spark-submit 参数中，以下选项中哪一个是是否发布你的驱动到 Worker 节点或者作为一个本地客户端

A)=--class

B)=--deploy-mode

C)=--conf

D)application-jar

答案:B

解析:

26.[单选题]写入数据到HDFS的Sink组件是（）。

A)Hive Sink

B)HBase Sink

C)HDFS Sink

D)Hadoop Sink

688IT编程网

Spark基础(试卷编号111)

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

Spark基础(试卷编号111)

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法