奥鹏南开20春学期(1709、1803、1809、1903、1909、2003)《大数据开发...--688IT编程网

1.Spark中DataFrame的（）方法是进行条件查询

A.where

B.join

C.limit

D.apply

【参考答案】: A

2.Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。

A.第一个

B.所有

C.前10个

D.前100个

【参考答案】: C

3.Scala元组的值是通过将单个的值包含在（）中构成的

A.小括号

B.中括号

C.大括号

D.尖括号

【参考答案】: A

4.当需要将一个普通的RDD转化为一个PairRDD时可以使用（）函数来进行操作

B.change

C.map

D.build

【参考答案】: C

5.以下哪个函数可以求两个RDD交集（）

A.union

B.substract

C.intersection

D.cartesian

【参考答案】: C

6.以下哪个函数可以求两个RDD差集（）

A.union

B.substract

C.intersection

D.cartesian

【参考答案】: B

7.spark-submit配置项中（）表示executor使用的总核数

A.--num-executors NUM

B.--executor-memory

MEM C.--total-executor-cores NUM D.--executor-coures NUM 【参考答案】: C

8.GraphX中（）方法可以释放顶点缓存

A.cache

B.presist

C.unpersistVertices

D.edges.unpersist 【参考答案】: C

9.以下哪个方法可以从外部存储中创建RDD（）

A.parallelize

B.makeRDD

D.loadFile

【参考答案】: C

10.Scala可以使用（）关键字实现单例模式

A.object

B.static

C.private

D.public

【参考答案】: A

11.以下哪个不是Scala的数据类型（）

A.Int

B.Short Int

C.Long

D.Any

【参考答案】: B

12.Mllib中metrics.precisionByThreshold表示（）指标

A.准确度

B.召回率

C.F值

D.ROC曲线

【参考答案】: A

13.图的结构通常表示为：G(V,E)，其中，E是图G中()

A.顶点

B.顶点的集合

C.边

D.边的集合

【参考答案】: D

14.请问RDD的（）操作用于将相同键的数据聚合

A.join

B.zip

CbineByKey

【参考答案】: C

15.Mllib中allByThreshold 表示（）指标

A.准确度

B.召回率

C.F值

D.ROC曲线

【参考答案】: B

16.GraphX中EdgeRDD继承自（）

A.EdgeRDD

B.RDD[Edge]

C.VertexRDD[VD]

D.RDD[(VertexId，VD)]

【参考答案】: B

17.Dstream输出操作中（）方法将DStream中的内容以文本的形式保

存为文本文件

A.print

B.saveAsTextFiles

C.saveAsObjectFiles

D.saveAsHadoop Files

【参考答案】: B

18.GraphX中（）方法可以查询顶点信息

A.numVertices

B.numEdges

C.vertices

D.edges

【参考答案】: C

19.Scala通过（）来定义变量

A.val

B.val

C.define

D.def

【参考答案】: A

20.Mllib中线性会馆算法中的参数reParam表示（）

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso 和ridge 的正规化参数

【参考答案】: D

21.Scala中（）方法返回Map所有的value

A.key

B.keys

C.value

D.values

【参考答案】: D

22.Scala列表方法中返回所有元素，除了最后一个的方法是（）

A.drop

B.head

C.filter

D.init

【参考答案】: D

23.Spark Streming中（）函数可以使用func将源DStream中的每个

元素进行聚合操作，返回一个内部所包含的RDD只有一个元素的新

DStream

A.union

C.join

【参考答案】: B

24.PairRDD可以通过（）获得仅包含键的RDD

A.key

B.keys

C.value

D.values

【参考答案】: B

25.Scala中（）方法返回Map所有的key

A.key

B.keys

C.value

D.values

【参考答案】: B

26.以下哪个是Scala的数据类型（）

A.Any

B.NULL

C.Nothing

D.AnyRef

【参考答案】: ABCD

27.以下算法中属于分类算法的是（）

A.KNN算法

在常用的正则化计算方法中属于B.逻辑回归

C.随机森林

D.Kmeans 【参考答案】: ABC

28.Spark的RDD持久化操作有()方式

A.cache

B.presist

C.storage

D.long

【参考答案】: AB

29.Spark Streaming的特点有（）

A.单极性

B.可伸缩

C.高吞吐量

D.容错能力强【参考答案】: BCD

30.Spark Streaming能够和（）无缝集成

A.Hadoop

B.Spark SQL

C.Mllib

D.GraphX 【参考答案】: BCD

31.Scala系统支持（）作为对象成员

A.通用类

B.内部类

C.抽象类

D.复合类

【参考答案】: ABCD

688IT编程网

奥鹏南开20春学期(1709、1803、1809、1903、1909、2003)《大数据开发...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

奥鹏南开20春学期(1709、1803、1809、1903、1909、2003)《大数据开发...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式