1+X大数据平台运维(中级)模拟测试题
一、单选题
基本信息:[矩阵文本题] *
姓名: | ________________________ |
单位: | ________________________ |
电话: | ________________________ |
身份证号: | ________________________ |
1. 以下哪种情况容易引发 HDFS 负载不均问题? () [单选题] *
A、 HDFS 中存储的文件大小不一,小文件太多 |
B、 HDFS 中 Block 的大小设置不合理 |
C、 Data 各数据节点磁盘规格和空间大小有差异(正确答案) |
D、 NameNode 与 DataNode 节点在同一物理服务器上 |
2. MapReduce 中可能引起负载问题的原因有哪些? () [单选题] *
A、 MapReduce 需要处理的数据量过大 |
B、 数据本身的格式问题, 例如:文档格式混乱 |
C、 DataNode 节点与 Map 节点不在一起 |
D、 Map 中 Key 值选取和设定问题, 导致 Key 值过于集中(正确答案) |
3. 下面哪些不是引起 Spark 负载不均的原因?() [单选题] *
A、 Spark 读入的数据源是倾斜的 |
B、 Shuffle 阶段 Key 值过于集中 |
C、 在数据过滤阶段需要处理的数据量差异 |
D、 Spark 的运行方式差异(正确答案) |
4. 哪些不是引起 Hive 数据倾斜的原因?() [单选题] *
A、 数据在节点存储上分布不均 |
B、 运算中 Key 值分布不均 |
C、 业务数据本身存在分布不均 |
D、 Hive 中表数量的多少(正确答案) |
5. Hive 数据倾斜的表现? () [单选题] *
A、 Hive 建表后数据无法导入 |
B、 Hive 无法启动 |
C、 Hive sql 语句运行异常直接退出 |
D、 Hive 运算任务为报错单长期卡在 99%(正确答案) |
6. 下列大数据特点中错误的是()。 [单选题] *
A、 数据体量大 |
B、 数据种类多 |
C、 处理速度快 |
D、 价值密度高(正确答案) |
7. 下列不属于数据存储技术的是()。 [单选题] *
A、 MySQL |
B、 Storm(正确答案) |
C、 HDFS |
D、 HBase |
8. 企业使用大数据平台基于() 做分析报表。 [单选题] *
A、 MongoDB |
B、 BI |
C、 Hive(正确答案) |
D、 SQL |
9. 大数据存储是指用存储器,以()的形式,存储采集到数据的过程。 [单选题] *
A、 数据库/数据仓库(正确答案) |
B、 集 |
C、 文件系统 |
D、 信息系统 |
10. 下列()不是非关系型数据库。 [单选题] *
A、 HBase |
B、 Redis |
C、 Hive(正确答案) |
D、 MongoDB |
11. 下列不属于大数据项目实施工作流程的是()。 [单选题] *
A、 项目规划阶段 |
B、 数据治理阶段 |
C、 项目设计阶段 |
D、 系统运维阶段(正确答案) |
12. 在大数据项目规划阶段中,() 阶段确认大数据项目范围和建设目标。 [单选题] *
A、 需求调研(正确答案) |
B、 业务调研 |
C、 数据需求 |
D、 项目规划 |
13. 数据来源评估一般在()阶段进行。 [单选题] *
A、 项目规划 |
B、 数据治理(正确答案) |
C、 项目设计 |
D、 数据应用 |
14. 在数据仓库的数据架构中,() 具有按业务场景组织数据的能力。 [单选题] *
A、 结构化数据 |
B、 列式数据(正确答案) |
C、 文档数据 |
D、 非结构化数据 |
15. ()是检查系统对非法侵入的防范能力。 [单选题] *
A、 功能测试 |
B、 性能测试 |
C、 安全测试 |
D、 验收测试(正确答案) |
16. 下列哪项通常是集的最主要瓶颈(c)。 [单选题] *
A、 CPU(正确答案) |
B、 网络 |
C、 磁盘 IO |
D、 内存 |
17. 非关系型数据库不包括()。 [单选题] *
A、 HBase |
数据可视化是什么B、 Mapreduce(正确答案) |
C、 Neo4j |
D、 MongoDB |
18. 下列关于大数据中计算机存储容量单位的说法中, 错误的是()。 [单选题] *
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论