大数据华为认证考试(习题卷3)
第1部分:单项选择题,共51题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]ElasticSearch 存放所有关键词的地方是()
A)字典
B)关键词
C)词典
D)索引
答案:C
解析:
2.[单选题]DWS DN的高可用架构是:( )。
A)主备从架构
B)一主多备架构
C)两者兼有
D)其他
答案:A
解析:
3.[单选题]关于Hive与传统数据仓库的对比,下列描述错误的是:( )。
A)Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低
B)Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限
C)由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠
D)由于Hive基于大数据平台,所以查询效率比传统数据仓库快
答案:D
解析:
4.[单选题]以下哪种机制使 Flink 能够实现窗口中无序数据的有序处理?()
A)检查点
B)窗口
C)事件时间
D)有状态处理
答案:C
解析:
5.[单选题]下面( )不是属性选择度量。
A)ID3 使用的信息增益
B)C4.5 使用的增益率
C)CART 使用的基尼指数
D)NNM 使用的梯度下降
答案:D
解析:
C)HDFS
D)DB
答案:C
解析:
7.[单选题]关于FusionInsight HD Streaming的Supervisor描述正确的是:( )。
A)Supervisor负责资源的分配和任务的调度
B)Supervisor负责接受Nimbus分配的任务,启动停止属于自己管理的Worker进程
C)Supervisor是运行具体处理逻辑的进程
D)Supervisor是在Topology中接收数据然后执行处理的组件
答案:B
解析:
8.[单选题]在有N个节点FusionInsight HD集中部署HBase时、推荐部署( )个H Master进程,( )个Region Server进程。
A)3、N
B)N、N
C)2、N
D)2、2
答案:C
解析:
9.[单选题]Hadoop系统中YARN资源的抽象是用:( )表示。
A)内存
B)CPU
C)Container
D)磁盘空间
答案:C
解析:
10.[单选题]创建存储过程, CREATE OR REPLACE PROCEDURE proc_whi1e_1oop(maxval in integer) AS DECLARE I int:=maxval/2; BEGIN WHILE i<maxval LOOP Raise info'%',i; I:=i+1; ENDLOOP: END: 下面循环语句在Messages 内的输出是()CALL proc_while_loop(9) ;
A)5 6 7 8
B)4 5 6 7 8 9
C)5 6 7 8 9
D)4 5 6 7 8
答案:D
解析:
11.[单选题]数据中台功能架构中数据资产管理包含:( )能力。
A)安全管理
B)数据开发
C)数据资产目录
D)计量管理
答案:C
解析:
C)Data Studio
D)DSC
答案:B
解析:
13.[单选题]以下扫描算子中用于对列存表进行扫描的算子是:( )。
A)SeqScan
B)CstoreScan
C)SubqueryScan
D)ValuesScan
答案:B
解析:
14.[单选题]以下哪个选项属于大数据消息系统?()
A)Spark
B)Kafka
C)HBase
D)Zookeeper
答案:B
解析:
15.[单选题]当一个MapReduce应用程序被执行时,如下( )动作是map阶段之前发生的。
A)split
B)combine
C)partition
D)sort
答案:A
解析:
16.[单选题]关于创建api,以下描述正确的是:( )。
A)创建api只能通过脚本模式创建
B)创建api只能通过向导模式创建
C)创建api可以通过脚本模式和向导模式两种方式创建
D)以上说法均不正确
答案:C
解析:
17.[单选题]DAYU数据开发中,以下不属于作业优先级是:( )。
A)高
B)中
C)极高
D)低
答案:C
解析:
18.[单选题]以下哪项属于 Flume 的基础数据单位?()
A)Object
B)Topic
解析:
19.[单选题]在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下( )操作。
A)执行HiveDDL操作
B)运行MapReduce任务
C)运行Hive SQL任务
D)以上全部正确
答案:D
解析:
20.[单选题]HDFS的副本放置策略中,同一机架不同的服务器之间的距离是:( )。
A)3
B)2
C)1
D)4
答案:B
解析:
21.[单选题]Elastic Search 的核心概念不包含哪个?()
A)Type
B)Index
C)Document
D)DataBase
答案:D
解析:
22.[单选题]下列哪个不是 Explain 的关键字() ?
A)Tablescan
B)HashJoin
C)Filter
D)Seqscan
答案:C
解析:
23.[单选题]下列选项中,关于Zookeeper可靠性含义说法正确的是:( )。
A)可靠性通过主备部署模式实现
B)可靠性是指更新只能成功或者失败,没有中间状态
C)可靠性是指无论哪一个server,对外展示的均是同一个视图
D)可靠性是指一个消息被一个server接受,它将被所有的server 接受
答案:D大数据etl工具有哪些
解析:
24.[单选题]ETL 工具工作过程不包含以下哪项?()
A)清洗
B)传递
C)心加载
D)转换
答案:B
A)需求分析
B)可行性分析
C)应用推广
D)技术选型
答案:C
解析:
26.[单选题]对于 Gauss DB 200 的数据存储流程, 下列说法正确的是() ?
A)通过 Gauss DB 200 的数据分布规则数据会自动分布, 那么对表的设计可以比较随意
B)导入的数据直接从客户端进入磁盘中
C)数据的分布一般默认按照分布键的 HASH 值分布
D)数据的分布一般默认按照数据大小均匀分布
答案:C
解析:
27.[单选题]下列选项不支持创建采集元数据任务时添加数据分类,实现自动识别的为:( )。
A)RDS(Mysql)
B)DWS
C)DLI
D)MRS Hive
答案:A
解析:
28.[单选题]以下对 GaussDB 200 双 AZ 集描述不正确是?()
A)灾备集不同步数据时,可以提供读写服务
B)主集不可用时,灾备集提供正常服务
C)主集提供正常服务,灾备集只同步数据
D)周期性数据同步
答案:A
解析:
29.[单选题]样例工程solr-example\conAsolr-example.properties中ZKJJRL和
ZOOKEEPER_DEFAULT_SERVER_PRINCIPAL的值可以从() 获得到。
A)Solr Admin Ul Dashboard JVM面板
B)该配置文件中自带
C)从FusionlnsightManager Solr服务配置页面获取
D)A、C选项均可获取
答案:A
解析:
30.[单选题]HDFS客户端所在节点的系统时间与Fusioninsight HD集的系统时间要保持一致,若有时间差, 那么时间差应小于( )分钟。
A)5
B)10
C)20
D)30
答案:A
解析:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。