1.Spark中DataFrame的()方法是进行条件查询
A.where
B.join
C.limit
D.apply
【参考答案】: A
2.Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
A.第一个
B.所有
C.前10个
D.前100个
【参考答案】: C
3.Scala元组的值是通过将单个的值包含在()中构成的
A.小括号
B.中括号
C.大括号
D.尖括号
【参考答案】: A
4.当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作
B.change
C.map
D.build
【参考答案】: C
5.以下哪个函数可以求两个RDD交集()
A.union
B.substract
C.intersection
D.cartesian
【参考答案】: C
6.以下哪个函数可以求两个RDD差集()
A.union
B.substract
C.intersection
D.cartesian
【参考答案】: B
7.spark-submit配置项中()表示executor使用的总核数
A.--num-executors NUM
B.--executor-memory
MEM    C.--total-executor-cores NUM    D.--executor-coures NUM 【参考答案】: C
8.GraphX中()方法可以释放顶点缓存
A.cache
B.presist
C.unpersistVertices
D.edges.unpersist 【参考答案】: C
9.以下哪个方法可以从外部存储中创建RDD()
A.parallelize
B.makeRDD
D.loadFile
【参考答案】: C
10.Scala可以使用()关键字实现单例模式
A.object
B.static
C.private
D.public
【参考答案】: A
11.以下哪个不是Scala的数据类型()
A.Int
B.Short Int
C.Long
D.Any
【参考答案】: B
12.Mllib中metrics.precisionByThreshold表示()指标
A.准确度
B.召回率
C.F值
D.ROC曲线
【参考答案】: A
13.图的结构通常表示为:G(V,E),其中,E是图G中()
A.顶点
B.顶点的集合
C.边
D.边的集合
【参考答案】: D
14.请问RDD的()操作用于将相同键的数据聚合
A.join
B.zip
CbineByKey
【参考答案】: C
15.Mllib中allByThreshold 表示()指标
A.准确度
B.召回率
C.F值
D.ROC曲线
【参考答案】: B
16.GraphX中EdgeRDD继承自()
A.EdgeRDD
B.RDD[Edge]
C.VertexRDD[VD]
D.RDD[(VertexId,VD)]
【参考答案】: B
17.Dstream输出操作中()方法将DStream中的内容以文本的形式保
存为文本文件
A.print
B.saveAsTextFiles
C.saveAsObjectFiles
D.saveAsHadoop Files
【参考答案】: B
18.GraphX中()方法可以查询顶点信息
A.numVertices
B.numEdges
C.vertices
D.edges
【参考答案】: C
19.Scala通过()来定义变量
A.val
B.val
C.define
D.def
【参考答案】: A
20.Mllib中线性会馆算法中的参数reParam表示()
A.要运行的迭代次数
B.梯度下降的步长
C.是否给数据加干扰特征或者偏差特征
D.Lasso 和ridge 的正规化参数
【参考答案】: D
21.Scala中()方法返回Map所有的value
A.key
B.keys
C.value
D.values
【参考答案】: D
22.Scala列表方法中返回所有元素,除了最后一个的方法是()
A.drop
B.head
C.filter
D.init
【参考答案】: D
23.Spark Streming中()函数可以使用func将源DStream中的每个
元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新
DStream
A.union
C.join
【参考答案】: B
24.PairRDD可以通过()获得仅包含键的RDD
A.key
B.keys
C.value
D.values
【参考答案】: B
25.Scala中()方法返回Map所有的key
A.key
B.keys
C.value
D.values
【参考答案】: B
26.以下哪个是Scala的数据类型()
A.Any
B.NULL
C.Nothing
D.AnyRef
【参考答案】: ABCD
27.以下算法中属于分类算法的是()
A.KNN算法
在常用的正则化计算方法中 属于B.逻辑回归
C.随机森林
D.Kmeans 【参考答案】: ABC
28.Spark的RDD持久化操作有()方式
A.cache
B.presist
C.storage
D.long
【参考答案】: AB
29.Spark Streaming的特点有()
A.单极性
B.可伸缩
C.高吞吐量
D.容错能力强【参考答案】: BCD
30.Spark Streaming能够和()无缝集成
A.Hadoop
B.Spark SQL
C.Mllib
D.GraphX 【参考答案】: BCD
31.Scala系统支持()作为对象成员
A.通用类
B.内部类
C.抽象类
D.复合类
【参考答案】: ABCD

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。