大数据基础-题库带答案
1、通过互联网,查和了解大数据的产生过程。
答案:
2、通过互联网,查和了解大数据的应用场景(领域)。
答案:
3、通过互联网,查和了解大数据研究的意义。
答案:
4、通过互联网查hadoop集的组成,根据上课的讲解绘制Hadoop 生态系统的思维导图或者关系图,并简要说明Hadoop生态系统中每一部分的功能。
答案:
5、什么是虚拟机,它的作用是什么?
答案:
6、简述启动和关闭Hadoop集的方法。
答案:
7、简述HDFS中NameNode和DataNode的作用。
答案:
8、下面哪个命令可以用于创建HDFS目录/hdfstest/test
A、 hdfs dfs -mkdir /hdfstest/test
B、 hdfs dfs -get /hdfstest/test
C、 hdfs dfs -cat /hdfstest/test
D、 hdfs dfs -rmdir /hdfstest/test
答案: A
9、下列哪个命令可以下载HDFS文件 /
A、 hdfs dfs -put /
B、 hdfs dfs -get /
C、 hdfs dfs -download /
D、 hdfs dfs -move /
答案: B
10、删除HDFS上的文件使用的命令是hadoop fs -delete 文件名
答案:错误
11、复制HDFS上的文件可以使用命令hdfs dfs -cp
答案:正确
12、在HDFS上查看文件内容使用命令hdfs dfs -cat
答案:正确
13、简述配置windows下Hadoop环境的基本步骤。
答案:
14、MapReduce是Hadoop最核心的组件之一。
shell命令属于什么语言
答案:正确
15、MapReduce是一种分布式计算模型。
答案:正确
16、MapReduce应用程序一定要用Java来编写。
答案:错误
17、MapReduce是一种编程模型,用于处理大规模数据集的并行运算。
答案:正确
18、MapReduce执行计算任务的时候,没个任务的执行过程都被划分为()阶段
A、 Map
B、 Reduce
C、 Result
D、 KeyValue
答案: AB
19、MapReduce的工作过程包括()
A、分片、格式化数据源
B、执行Map Task
C、执行Shuffle过程
D、执行Reduce Task
E、写入文件
答案: ABCDE
20、查看当前节点的ZooKeeper角的命令是()
A、 zkServer.sh status
B、 zkServer.sh start
C、 zkServer.sh stop
D、 zkServer.sh format
答案: A
21、ZooKeeper默认的两种角是()
A、 Leader
B、 Follower
C、 Observer
D、 Master
答案: AB
22、无论客户端连接的是哪个Zookeeper服务器,其看到的服务端数据模型都是一致的。答案:正确
23、Znode有两种节点,分别是永久节点和临时节点。
答案:正确
24、Zookeeper引入Watch机制实现分布式的通知功能。
答案:正确
25、Zookeeper的Java API操作中,setData方法用于更新数据。
答案:正确
26、Zookeeper的JavaAPI操作中,getData方法可以查询数据。
答案:正确
27、Zookeeper的Shell操作中使用delete命令删除节点时,要删除的节点存在子节点的话也可以删除该节点。
答案:错误
28、Zookeeper的Shell操作中,删除节点的方法是用rm命令。
答案:错误
29、在Zookeeper的Shell操作中,查看节点可以用ls path [watch] 或 get path [watch] 或 ls2 path [watch]方法。
答案:正确
30、在Zookeeper的Shell操作中,rmr path命令可以递归删除节点。
答案:正确
31、Hive是建立在Hadoop文件系统上的一个数据仓库。
答案:正确
32、Hive系统架构的组成主要包括()
A、用户接口
B、跨语言服务
C、底层驱动引擎
D、元数据存储系统
答案: ABCD
33、Hive中所有的数据都存储在()中。
A、 HBase
B、 Mysql
C、 Yarn
D、 HDFS
答案: D
34、Hive的安装模式有()
A、内嵌模式
B、本地模式
C、远程模式
D、网格模式
答案: ABC
35、Hive是一个独立的数据仓库工具,因此在启动前无需启动任何服务。
答案:错误
36、Hive和Mysql都有String数据类型。
答案:错误
解析:Hive有String数据类型,Mysql没有。
37、Hive支持Map键值对的复杂数据类型。
答案:正确
38、Hive中显示数据库用的命令是show databases;
答案:正确
39、Hive中切换数据库用的命令是USE+数据库名。
答案:正确
40、Hive中的桶为表提供了额外的结构,Hive在处理某些查询时利用这个结构,能够有效地提高查询效率。
答案:正确
41、在Flume系统种,在一个Agent中,同一个source可以有多个channel。答案:正确
42、在Flume系统中,在一个Agent中,同一个sink可以有多个channel。
答案:错误
43、在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,它是Flume内部数据传输的基本单元。
答案:正确
44、Flume的核心是把数据从数据源通过Source收集过来,再将收集的数据通过Channel汇集到指定的Sink。
答案:正确
45、Flume的负载均衡接收器处理器支持使用轮询、随机机制进行流量分配。答案:正确

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。