计算机相关多选题-企事业内部考试电力试卷与试题
1. 在数据科学中,计算模式发生了根本性的变化——从集中式计算、分布式计算、网格计算等传统计算过渡至云计算,有一定的代表性的是Google云计算三大技术,这三大技术包括()。
A. HadoopYARN资源管理器
B. GFS分布式存储系统
C. MapReduce分布式处理技术
D. BigTable分布式数据库
E. 
答案:B、C、D
2. MapReduce对map()函数的返回值处理后才传给reduce()函数,其中涉及的操作有()。
A. 合并
B. 排序
C. 分区
D. 抽样
E. 
答案:A、B、C
3. 下列中属于MapReduce特征的有()。
A. 以主从结构的形式运行
B. 容错机制的复杂性
C. 任务备份机制的必要性
D. 数据存储位置固定
E. 
答案:A、B、C
4. MapReduce中运行程序副本程序的机器有()。
A. Map服务器
B. Master服务器
C. Worker服务器
D. Reduce服务器
E. 
答案:B、C
5. 在MapReduce1.0版本中,JobTracker功能有()。
A. 资源管理
B. 作业控制
C. 作业存储
D. 作业审核
E. 
答案:A、B
6. 下列关于MapReduce1.0版本的说法正确的有()。
A. 扩展性差
B. 可靠性差
C. 资源利用率低
D. 无法支持多种计算框架
E. 
答案:A、B、C、D
7. 下列服务中可以用于存储数据的有()。
A. MapReduce
B. YARN
C. HBase
D. HDFS
E. 
答案:C、D
8. 下列有关MapReduce计算框架的描述正确的有()。
A. MapReduce可以计算任务的划分和调度
B. MapReduce可完成数据的分布存储和划分
C. MapReduce可以实现处理系统节点出错检测和失效恢复
D. MapReduce可实现处理数据与计算任务的同步
E. 
答案:A、B、C、D
9. Hadoop MapReduce是MapReduce的具体实现之一。Hadoop MapReduce数据处理过程涉及四个独立的实体,包括()。
A. Client
B. JobTracker
C. TaskTracker
D. HDFS
E. 
答案:A、B、C、D
10. 下列关于MapReduce与HBase关系的描述正确的有()。
A. 两者不可或缺,MapReduce是HBase可以正常运行的保证
B. 两者不是强关联关系,没有MapReduce,HBase可以正常运行
C. MapReduce可以直接访问HBase
D. 它们之间没有任何关系
E. 
答案:B、C
11. 下列关于Hadoop MapReduce的描述正确的有()。
A. reduce()函数的输入是value集
B. reduce()函数将最终结果写到HDFS系统中
C. 用户可以自己定义reduce()函数
D. reduce()函数的输入数据是经过map()函数处理之后的数据
E. 
答案:B、C、D
12. 从Hadoop实现角度看,Hadoop MapReduce1.0主要由()组成。
A. 编程模型
B. 数据处理引擎
C. 运行时环境
D. 算法库
正则化描述正确的是
E. 
答案:A、B、C
13. 下列关于Hadoop中map输出结果的说法正确的有()。
A. <key,value>键值对
B. 输出中间临时结果
C. 输出最终计算结果
D. 输出结果永久保留
E. 
答案:A、B
14. 下列关于HBase的说法正确的有()。
A. 面向列的数据库
B. 非结构化的数据库
C. 支持大规模的随机、实时读写
D. 采用松散数据模型
E. 
答案:A、B、C、D
15. 下列属于HBase性能优化的有()。
A. 读优化
B. 写优化
C. 配置优化
D. JVM优化
E. 
答案:A、B、C、D
16. HBase中KeyValue数据的存储格式是()。
A. HFile
B. HLogFile
C. SequenceFile
D. TXT
E. 
答案:A
17. Hadoop的HDFS是一种分布式文件系统,其适合()的数据存储和管理。
A. 大量小文件存储
B. 高容错、高吞吐量
C. 低延迟读取
D. 流式数据访问
E. 
答案:B、D
18. 基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有()。
A. MapReduce
B. Spark
C. HDFS
D. HBase
E. 
答案:C、D
19. 下列关于HDFS文件写入的描述正确的有()。
A. 不支持多用户对同一文件的写操作
B. 用户不可以在文件任意位置进行修改
C. 默认将文件复制成三份存放
D. 复制的文件块默认不存在同一机架上
E. 
答案:A、B、C、D
20. 下列关于Hive的说法正确的有()。
A. Hive是基于Hadoop的数据仓库工具
B. Hive可以将结构化的数据文件映射为一张数据库表
C. 最初,Hive由Google开源,用于解决海量结构化日志数据统计问题
D. Hive的主要应用场景是离线分析
E. 
答案:A、B、D
21. 在Hive架构中,支持的数据操作有()。
A. 插入
B. 查询
C. 删除
D. 分析
E. 
答案:B、D
22. Spark2.0提供的应用库包括()。
A. SparkSQL
B. SparkStreaming
C. MLib
D. GraphX
E. 
答案:A、B、C、D
23. Spark的组件包括()。
A. SparkStreaming
B. MLib
C. GraphX
D. SparkR
E. 
答案:A、B、C
24. 在Spark中,弹性分布式数据集的特点包括()。
A. 可分区
B. 可序列化
C. 可直接修改
D. 可持久化
E. 
答案:A、B、D
25. Spark RDD的依赖机制包括()。
A. 宽依赖
B. 深度依赖

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。