华为HCIA-大数据认证练试题与答案
1.下列选项中无法通过大数据技术实现的是?(A)[单选题]
A.商业模式发现
B.信用评估
C.商品推荐
D.运营分析
2.FusionInsight Manager 的主要功能有以下哪些?(BCD)[多选题]
A.数据集成
B.系统管理
C.安全管理
D.服务治理
3.假设每个用户最低资源保障设置为yarn,scheduler,capacity,root, QueueA.minimum-user-limit-percent=24。则以下说法错误的是?(D)[单选题]
A.第 3 个用户提交任务时,每个用户最多获得 33.33%的资源
B.第 2 个用户提交任务时,每个用户最多获得 50%的资源
C.第 4 个用户提交任务时,每个用户最多获得 25%的资源
D.第 5 个用户提交任务时,每个用户最多获得 20%的资源
4.华为大数据解决方案中平台架构包括以下哪些组成部分?(ABD)[多选题]
A. Hadoop层
B. FusioInght Manager
C. GaussDB 200
D. DataFram
5.Spark 自带的资源管理框架是?(A)[单选题]
A.Standal one
B.Mesos
C.YARN
D.Docker
6.关于 RDD,下列说法错误的是?(B)[单选题]
A.RDD 具有血统机制(Lineage)
B.RDD 默认存储在磁盘
C.RDD 是一个只读的,可分区的分布式数据集
D.RDD 是 Spark 对基础数据的抽象
7.关于 Spark SQL&Hive 区别与联系,下列说法正确的是?(BCD)[多选题]
A.Spark SQL 依赖 Hive 的元数据
B.Spark SQL 的执行引擎为 Spark core,Hive 默认执行引擎为 MapReduce
C.Spark SQL 不可以使用 Hive 的自定义函数
D.Spark SQL 兼容绝大部分 Hive 的语法和函数
8.在 FusionInsight 集中,Spark 主要与以下哪些组件进行交互?(ABCD)[多选题]
A.HDFS
B.YARN
C.Hive
D.ZooKeeper
9.关于 Hive 在 FusionInsight HD 中的架构描述错误的是?(A)[单选题]
A.只要有一个 HiveServer 不可用,整个 Hive 集便不可用
B.MotaStore 用于提供元数据服务,依赖于 DBService
C.在同一时间点,HiveServer 只要一个处于 Active 状态,另一个则处于 Standby 状态
D.HiveServer 负责接收客户端请求.解析.执行 HQL 命令并返回查询结果
10.通常情况下,Hive 以文本文件存储的表会以回车作为其行分隔符,在华为 FusionInsight Hive 中,可以指定表数据的输入和输出格式处理。(A)[单选题]
A.TRUE
B.FALSE
11.以下关于 HBase 中 HMaster 的功能描述哪些是正确的?(ABCD)[多选题]
A.Region 负载均衡,Region 分裂以及分裂后的 Region 分配
B.负责建表/修改表/删除表
C.负责 RegionServer 的负载均衡
D.RegionServer 失效后的 Region 迁移
12.Nimbus 在 Streaming 架构中的功能包括?(ABD)[多选题]
A.监控任务执行状态
B.任务调度
C.启动/关闭工作进程
D.资源分配
13.Topology 在任务完成后会自动结束运行。(B)[单选题]
A.TRUE
B.FALSE
14.下面关于 flink 窗口的描述错误的是 (AC)[多选题]
A.滚动窗口在时间上是重叠的
B.滚动窗口在时间上是不重叠的
C.滑动动窗口之间时间点不存在重叠
D.滑动窗口之间时间点存在重叠
15.在 FusionInsightManager 界面中,对 Loader 的操作不包括下列哪个选项?(A)[单选题]
A.切换 Loader 主备节点
B.启动 Loader 实例
C.配置 Loader 参数
D.查看 Loader 服务状态
16.创建 Loader 作业中,可以在以下哪个步骤中设置过滤器类型?(B)[单选题]
A.输入设置
B.转换
C.基本信息
D.输出
17.以下哪些数据源可以通过 Loader 实现与 FusionInghtHD 的数据交换?(ABCD)[多选题]
A.NoSQL
B.FTP Server
C.SFTP Server
D.MySQL
18.Kafka 日志的清理方式有两种:delete 和 compact。默认值是 delete。(A)[单选题]
A.TRUE
B.FALSE
19.kafka-cluster mirroring 工具可以实现以下那些功能?(A)[单选题]
A.kafka 集数据同步方案
B.kafka 单集内数据备份
C.kafka 单集内数据恢复
D.以全部不对
20.fusioninsight HD 产品中,一个典型的 kafka 集包含若干个 producer 若干个 consummer 和一个 zookeeper 集? (B)[单选题]
A.true
B.false
21.ZKFC 进程部署在 hdfs 中的以下那个节点上?(AB)[多选题]
A.active namenode
B.standby namenode
C.datanode
D.以上全部不对
22.以下关于 Kafka Partition 偏移量的描述不正确的是?(D)[单选题]
A.每条消息在文件中的位置称为 offset(偏移量)
B.消费者通过(pic)跟踪记录
C.唯一标记一条消息
D.Offset 是一个 String 型字符串
23.Channel 的作用类似队列,用于临时缓存进来的数据,当 Sink 成功地将数据发送到下一 跳的 Channel 或最终目的,数据会从 Channel 移除(A)[单选题]
A.TRUE
B.FALSE
24.Zookeeper 中的数据节点 znode 分为哪几种类型?(BD)[多选题]
A.semi-persistent
B.ephemeral
C.temporary
D.persistent
25.HDFS 联邦环境下,NameSpace(命名空间)包含以下哪些内容?(ABC)[多选题]
A.目录
B.文件
C.块
D.以上全不正确
26.HDFS 存储数据时,关键数据根据实际业务需要保存在具有高度可靠性的节点中,通过修 改 DataNode 的存储策略,系统可以将数据强制保存在指定的节点组中。(A)[单选题]
A.TRUE
B.FALSE
27.RDD 有 Transformation 和 Action 算子,下列属于 Action 算子的是?(B)[单选题]
hbase属于什么数据库
A.map
B.saveAsTextFile
C.Filter
D.reduceByKey
28.Spark on Yarn-client 适合用于生产环境是因为可以更快的看到 APP 的输出。(B)[单选题]
A.TRUE
B.FALSE
29.以下关于 Hive SQL 基本操作描述正确的是?(D)[单选题]
A.创建外部表必须要指定 location 信息
B.创建外部表使用 external 关键字,创建普通表需要指定 internal 关键字
C.加载数据到 Hive 时源数据必须是 HDFS 的一个路径
D.创建表时可以指定列分割符
30.在 Streaming 中,消息可靠性级别中精确一次是通过 ACK 机制来实现的。(B)[单选题]
A.TRUE
B.FALSE
31.Flume 适用于以下哪些场景的数据收集?(ABC)[多选题]
A.Thrift,Avro,Syslog,Kafka 等数据源上收集数据
B.本地文件数据采集
C.应用系统产生的日志采集
D.大量数据的实时数据采集
32.在 Zookeeper 和 Yarn 的协同工作中,当 ActiveResourceManager 产生故障时,Standby ResourceManager 会从以下哪些目录中获取 Application 相关信息?(B)[单选题]

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。