Hadoop基础(习题卷3)
第1部分:单项选择题,共54题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]大数据的简单算法与小数据的复杂算法相比()
A)更有效
B)相当
C)不具备可比性
D)无效
答案:A
解析:
2.[单选题]下列选项中,不是CouchDB的复制中的特点是:
A)使用优先列表
B)复制过程是逐步进行
C)允许分区复制
D)支持智能文档模式
答案:A
解析:
3.[单选题]从HDFS下载文件,正确的shell命令是()。
A)-get
B)-appendToFilevim命令模式下可以进行哪些操作
C)-put
D)-copyFromLocal
答案:A
解析:
4.[单选题]关于HDFS集中的DataNode的描述不正确的是?
A)存储客户端上传的数据的数据块
B)一个DataNode上存储的所有数据块可以有相同的
C)DataNode之间可以互相通信
D)响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑
答案:B
解析:
5.[单选题]在Java中,一个线程如果调用了sleep()方法,能唤醒它的方法是
A)notify()
B)resume()
C)run()
D)以上都不是,时间到了会自动继续执行
答案:D
解析:
6.[单选题]软件是大数据的_________。
A)核心
解析:
7.[单选题]_______模式,只适合于Hive简单试用及单元测试。
A)单用户模式
B)多用户模式
C)多用户远程模式
D)单用户远程模式
答案:A
解析:
8.[单选题]下列关于Hive描述错误的是()。
A)hive学习成本低,支持标准的SQL语法
B)hive运行效率低,延迟高
C)HQL的表达能力有限
D)Hive支持迭代计算
答案:D
解析:
9.[单选题]下面哪个选项不是我们需要Hadoop的主要原因()
A)我们需要处理PB级别的数据
B)为每个应用建立一个可靠的系统是很昂贵的
C)几乎每天都有结点坏掉
D)把一个任务分割成多个子任务的方式是不好的
答案:D
解析:
10.[单选题]为了让集中的机器能够正常通信,所有集的IP必须设置成静态IP,防止机器重启之后而不到机器的情况,那么IP地址配置需要修改那个文件()
A)ifcfg-lo
B)network-functions
C)ifcfg-ens33
D)network-functions-ipv6
答案:C
解析:
11.[单选题]Spark生态系统组件Spark Streaming的应用场景是?
A)基于历史数据的数据挖掘
B)图结构数据的处理
C)基于历史数据的交互式查询
D)基于实时数据流的数据处理
答案:D
解析:
12.[单选题]关于HDFS集中的DataNode的描述不正确的是?
A)DataNode之间都是独立的,相互之间不会有通信
B)存储客户端上传的数据的数据块
C)响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑
13.[单选题]Hadoop2.x版本中的数据块大小默认是多少? ()
A)64M
B)128M
C)256M
D)512M
答案:B
解析:
14.[单选题]HDFS分布式文件系统的特点为____________。
A)半透明性
B)低可用性
C)可扩展性
D)支持一个应用程序并发访问
答案:C
解析:
15.[单选题]HBase数据库的BlockCache缓存的数据块中,哪一项不一定能提高效率。
A)普通的数据块
B)HFile index
C)META.表
D)-ROOT-表
答案:A
解析:
16.[单选题]在驱动类中,()设置输入数据的格式。
A)使用方法setOutputFormat
B)使用方法setOutputKeyValue
C)使用方法setInputFormat
D)使用方法setJarByClass
答案:C
解析:
17.[单选题]大数据的起源是
A)金融
B)电信
C)互联网
D)管理
答案:C
解析:
18.[单选题]大数据分析平台的实施流程顺序是( )。
A.与甲方确定总体计划
B. 组建项目团队
C.部署环境准备
D. 应用集成及数据集成
E. 系统安装和调试
A)BACED
解析:
19.[单选题]执行数据块复制的任务时,是什么和什么在进行通信()
A)client and namenode
B)client and datanode
C)namenode and datanode
D)datanode and datanode
答案:D
解析:
20.[单选题]Hadoop的配置目录在哪里?
A)/etc/hosts
B)/etc/hadoop
C)$HADOOP_ HOME/conf
D)$HADOOP_HOME/etc/hadoop
答案:C
解析:
21.[单选题]下列关于HDFS的说法中,描述错误的是()。
A)HDFS是Hadoop的基石
B)HDFS是高容错的文件系统
C)不适合部署在廉价的机器上
D)能够提供高吞吐量的数据访问
答案:C
解析:
22.[单选题]关于Python中的继承,以下说法最正确的是:
A)实现继承的类被称为子类。
B)如果一个类继承另外一个类,则需要在类定义的第一行中类名的后面加小括号,小括号中传入父类的类名。
C)被继承的类被称为父类,也被称为基类或超类
D)以上都正确
答案:D
解析:
23.[单选题]互联网的发展分为______个阶段。
A)一
B)三
C)二
D)四
答案:B
解析:
24.[单选题]以下哪种情况容易引发 HDFS 负载不均问题? ( )
A)HDFS 中存储的文件大小不一,小文件太多
B)HDFS 中 Block 的大小设置不合理
C)Data 各数据节点磁盘规格和空间大小有差异
D)NameNode 与 DataNode 节点在同一物理服务器上
25.[单选题]5、大数据一词是在哪一年由美国著名未来学家阿尔文·托夫勒在《第三次浪潮》中将大数 据称为“第三次浪潮的华彩篇章”()
A)1978
B)1980
C)1983
D)1990
答案:B
解析:
26.[单选题]下列关于使用MapReduce编程模型实现SQL中的join操作错误的是?
A)ReduceJoin可以实现内链接,也能实现各种外连接
B)ReduceJoin的join操作是在MapReduce程序中的reducer阶段完成的
C)MapJoin不会产生数据倾斜
D)MapJoin也适合各种join场景,也能实现内连接和各种外链接
答案:D
解析:
27.[单选题]下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()
A)一个Map函数就是对一部分原始数据进行指定的操作。
B)一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。
C)Map与Map之间不是相互独立的。
D)Reducee与Reduce之间不是相互独立的。
答案:A
解析:
28.[单选题]在Java中,下面哪个基于Unicode字符的输出流?
A)Reader
B)Writer
C)InputStream
D)OutputStream
答案:B
解析:
29.[单选题]以下关于MapReduce说话错误的是?
A)Map和reduce是他们的主要思想
B)用于大规模数据集的串行运算
C)极大的方便了编程人员不会分布式编程
D)都是从函数式和矢量编程语言借来的特性
答案:B
解析:
30.[单选题]大数据的价值是通过数据共享、( )后获取最大的数据价值
A)算法共享
B)共享应用
C)数据交换
D)交叉复用
答案:C
解析:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论