南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版...--688IT编程网

南开大学22春“物联网工程”《大数据开发技术（二）》期末考试高频考点版（带答案）

一.综合考核(共50题)

Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存。

A.print

B.saveAsTextFiles

C.saveAsObjectFiles

D.saveAsHadoopFiles

参考答案：D

GraphX中Edge边对象存有()字段

A.srcId

B.dstId

C.attr

D.val

参考答案：ABC

如果numPartitions是分区个数，那么Spark每个RDD的分区ID范围是()。

A.[0，numPartitions]

B.[0，numPartitions-1]

C.[1，numPartitions-1]

D.[1，numPartitions]

参考答案：B

MLlib中进行数据标准化的方式有()

A.Normalizer

B.Standard

C.StandardScaleer

D.MinMaxScaler

参考答案：ACD

Spark GraphX中类Graph的joinVertices方法可以()

A.收集邻居顶点的顶点Id和顶点属性

B.收集邻居顶点的顶点Id

C.向指定顶点发送信息并聚合信息

D.将顶点信息更新到图中

参考答案：D

Scala列表方法中返回所有元素，除了最后一个的方法是()。

A.drop

B.head

C.filter

D.init

参考答案：D

Mllib中线性会馆算法中的参数reParam表示()

A.要运行的迭代次数

B.梯度下降的步长

C.是否给数据加干扰特征或者偏差特征

D.Lasso和ridge的正规化参数

参考答案：D

以下哪个方法可以创建RDD()

A.parallelize

B.makeRDD

C.textFile

D.loadFile

参考答案：ABC

PairRDD中groupBy(func)func返回key，传入的RDD的各个元素根据这个key进行分组。()

A.正确

B.错误

参考答案：A

10.

Spark Streaming支持实时流式数据，包括()。

A.Web服务器日志文件

B.社交网络数据

C.实时交易数据

D.类似Kafka的信息数据

参考答案：ABCD

11.

以下哪个函数可以对RDD进行去重()

A.sortBy

B.filter

C.distinct

D.intersection

参考答案：C

12.

Spark DataFrame中()方法可以返回一个List

A.collect

B.take

C.takeAsList

D.collectAsList

参考答案：CD

13.

Spark创建DataFrame对象方式有()

A.结构化数据文件

B.外部数据库

C.RDD

D.Hive中的表

参考答案：ABCD

14.

RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。()

A.正确

B.错误

参考答案：B

15.

Mllib中线性会馆算法中的参数reParam默认值是()

参考答案：1

16.

Spark SQL可以通过()方法加载json文件为DataFrame

A.format

B.json

C.get

D.read

参考答案：AB

17.

图的结构通常表示为：G(V，E)，其中，E是图G中()

A.顶点

B.顶点的集合

C.边

D.边的集合

参考答案：D正则化是为了防止

18.

图的结构通常表示为：G(V，E)，其中，G表示()

A.图

B.子图

C.顶点

D.边

参考答案：A

19.

Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是()

A.filter

B.flatten

C.grouby

D.flatmap

参考答案：A

20.

()是Spark的数据挖掘算法库

A.Spark Core

B.BlinkDB

C.GraphX

D.Mllib

参考答案：D

21.

Scala函数组合器可以通过一个函数重新计算列表中所有元素，没有返回值。()

A.正确

B.错误

参考答案：B

22.

GraphX中()方法可以查询顶点个数

688IT编程网

南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

南开大学22春“物联网工程”《大数据开发技术(二)》期末考试高频考点版...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式