Spark基础(试卷编号111)
1.[单选题]在Spark中,定义一个类,定义正确的是?
A)class House(name){def getname = “beijing”}
B)class house {name = “nanjing”}
C)class House {public var counter:String = “shanghai”}
D)class house (var name:String){private def getName = name}
答案:D
解析:
2.[单选题]在Spark中,collect方法的返回值类型是?
A)Array
B)Map
C)Set
D)List
答案:A
解析:
3.[单选题]在Spark中,spark-submit 参数中,以下选项中哪一个是任意的 Spark 配置属性
A)=--class
B)=--deploy-mode
C)=--conf
D)application-jar
答案:C
解析:
4.[单选题]MySQL 数据库驱动文件放置于 hive 哪个目录下()
A)jar
B)lib
C)bin
D)sbin
答案:B
解析:
5.[单选题]下列哪一种命令格式是不正确的()
A)get 表 行健 列族
B)scan 表 时间戳 起始行健 结束行健
C)alter 表 列族
D)put 表 行键 列族:列 值
答案:B
解析:
scala不是内部或外部命令6.[单选题]调用Zookeeper对象创建的节点,不包括()。
A)持久节点
B)临时节点
C)持久顺序节点
D)DataNode节点
答案:D
解析:
7.[单选题]在Scala 中,定义 Set 的格式是什么
A)val set=( 元素 , 元素…)
B)val set=[元素 , 元素…]
C)val set={ 元素 , 元素…}
D)val set=Set( 元素 , 元素…)
答案:D
解析:
8.[单选题]下列哪些操作可以设置一个Watcher()
A)getData
B)getChildren
C)exists
D)setData
答案:D
解析:
9.[单选题]Hive 适合()环境
A)Hive 适合用于联机(online)事务处理
B)提供实时查询功能
C)适合应用在大量不可变数据的批处理作业
D)Hive 适合关系型数据环境
答案:C
解析:
10.[单选题]在 HBase 的组件中,哪一个负责日志记录()
A)HRegion
B)HFile
C)MemStore
D)WAL
答案:D
解析:
11.[单选题]在Spark中,map( )函数的参数类型是什么?
D)对象
答案:B
解析:
12.[单选题]HBase 与下列哪个选项属于同一种类型的数据库()
A)MongoDB
B)MariaDB
C)MySQL
D)Oracle
答案:A
解析:
13.[单选题]下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()
A)一个Map函数就是对一部分原始数据进行指定的操作。
B)一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。
C)Map与Map之间不是相互独立的。
D)Reducee与Reduce之间不是相互独立的。
答案:A
解析:
14.[单选题]在Spark中,Yarn模式是否由Spark客户端直接连接Yarn,是否需要额外构建Spark集。
A)是,是
B)是,否
C)否,是
D)否,否
答案:B
解析:
15.[单选题]在Spark中,flatMap函数与map函数的区别是?
A)前者参数较多
B)后者参数较少
C)前者可以将一个元素映射为多个
D)后者可以将一个元素映射为多个
答案:C
解析:
16.[单选题]Shufile 阶段中哪一步是可选的?()
A)排序
答案:D
解析:
17.[单选题]在Spark中,下面输出与其他不一致的是?
A)println("Hello World")
B)print("Hello World\n")
C)printf("Hello %s", "World\n")
D)val w = "World" ; println("Hello $w")
答案:D
解析:
18.[单选题]在Scala中,以下选项中哪一个是制一个数组到另一个数组上
A)def apply(x:T,xs:T*)
B)def concat[T](xss:Array[T]*)
C)def copy(src:AnyRef,srcPos:Int,dest:AnyRef,destPos:Int,length:Int)
D)def empty[T]
答案:C
解析:
19.[单选题]客户端连接Zookeeper集的命令是()。
A)get /zk
B)delete /zk
C)zkCli.sh
D)ls /
答案:C
解析:
20.[单选题]在Spark中,filter( )方法属于什么操作?
A)转换操作
B)行动操作
C)集合操作
D)以上都不是
答案:A
解析:
21.[单选题]在Spark中,BigInt(2).pow(1024) 起什么作用?
A)计算2的1024次方
B)计算1024的2次方
C)计算1024*2
D)以上都不是
答案:A
解析:
22.[单选题]当客户端需要读取HDFS中存储的文件时,首先向()发起读请求。
A)DataNode
B)NameNode
C)Yarn
D)Zookeeper
答案:B
解析:
23.[单选题]在Spark中,makeRDD的函数的作用是什么?
A)创建RDD
B)转换RDD
C)调用RDD
D)固定RDD
答案:A
解析:
24.[单选题]在Spark中,不属于Scala7种数值类型的是?
A)Char
B)Int
C)Float
D)LongLong
答案:D
解析:
25.[单选题]在Spark中,spark-submit 参数中,以下选项中哪一个是是否发布你的驱动到 Worker 节点或者作为一个本地客户端
A)=--class
B)=--deploy-mode
C)=--conf
D)application-jar
答案:B
解析:
26.[单选题]写入数据到HDFS的Sink组件是()。
A)Hive Sink
B)HBase Sink
C)HDFS Sink
D)Hadoop Sink

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。