1+X大数据平台运维(中级)模拟测试题
一、单选题
基本信息:[矩阵文本题] *
姓名:
________________________
单位:
________________________
电话:
________________________
身份证号:
________________________
1. 以下哪种情况容易引发 HDFS 负载不均问题? () [单选题] *
A、 HDFS 中存储的文件大小不一,小文件太多
B、 HDFS 中 Block 的大小设置不合理
C、 Data 各数据节点磁盘规格和空间大小有差异(正确答案)
D、 NameNode 与 DataNode 节点在同一物理服务器上
2. MapReduce 中可能引起负载问题的原因有哪些? () [单选题] *
A、 MapReduce 需要处理的数据量过大
B、 数据本身的格式问题, 例如:文档格式混乱
C、 DataNode 节点与 Map 节点不在一起
D、 Map 中 Key 值选取和设定问题, 导致 Key 值过于集中(正确答案)
3. 下面哪些不是引起 Spark 负载不均的原因?() [单选题] *
A、 Spark 读入的数据源是倾斜的
B、 Shuffle 阶段 Key 值过于集中
C、 在数据过滤阶段需要处理的数据量差异
D、 Spark 的运行方式差异(正确答案)
4. 哪些不是引起 Hive 数据倾斜的原因?() [单选题] *
A、 数据在节点存储上分布不均
B、 运算中 Key 值分布不均
C、 业务数据本身存在分布不均
D、 Hive 中表数量的多少(正确答案)
5. Hive 数据倾斜的表现? () [单选题] *
A、 Hive 建表后数据无法导入
B、 Hive 无法启动
C、 Hive sql 语句运行异常直接退出
D、 Hive 运算任务为报错单长期卡在 99%(正确答案)
6. 下列大数据特点中错误的是()。 [单选题] *
A、 数据体量大
B、 数据种类多
C、 处理速度快
D、 价值密度高(正确答案)
7. 下列不属于数据存储技术的是()。 [单选题] *
A、 MySQL
B、 Storm(正确答案)
C、 HDFS
D、 HBase
8. 企业使用大数据平台基于() 做分析报表。 [单选题] *
A、 MongoDB
B、 BI
C、 Hive(正确答案)
D、 SQL
9. 大数据存储是指用存储器,以()的形式,存储采集到数据的过程。 [单选题] *
A、 数据库/数据仓库(正确答案)
B、 集
C、 文件系统
D、 信息系统
10. 下列()不是非关系型数据库。 [单选题] *
A、 HBase
B、 Redis
C、 Hive(正确答案)
D、 MongoDB
11. 下列不属于大数据项目实施工作流程的是()。 [单选题] *
A、 项目规划阶段
B、 数据治理阶段
C、 项目设计阶段
D、 系统运维阶段(正确答案)
12. 在大数据项目规划阶段中,() 阶段确认大数据项目范围和建设目标。 [单选题] *
A、 需求调研(正确答案)
B、 业务调研
C、 数据需求
D、 项目规划
13. 数据来源评估一般在()阶段进行。 [单选题] *
A、 项目规划
B、 数据治理(正确答案)
C、 项目设计
D、 数据应用
14. 在数据仓库的数据架构中,() 具有按业务场景组织数据的能力。 [单选题] *
A、 结构化数据
B、 列式数据(正确答案)
C、 文档数据
D、 非结构化数据
15. ()是检查系统对非法侵入的防范能力。 [单选题] *
A、 功能测试
B、 性能测试
C、 安全测试
D、 验收测试(正确答案)
16. 下列哪项通常是集的最主要瓶颈(c)。 [单选题] *
A、 CPU(正确答案)
B、 网络
C、 磁盘 IO
D、 内存
17. 非关系型数据库不包括()。 [单选题] *
A、 HBase
数据可视化是什么B、 Mapreduce(正确答案)
C、 Neo4j
D、 MongoDB
18. 下列关于大数据中计算机存储容量单位的说法中, 错误的是()。 [单选题] *

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。