【秋招必备】⼤数据⾯试题100道(2021最新版)
前⾔
随着 5G 时代的到来,⼤数据⼈⼯智能产业链⼜⼀次迎来了井喷式的爆发,随着岗位需求的不断增加,越来越多的⼈选择⼤数据课程,但是没有真正从事⼤数据⼯作的⼈⾯对企业⾯试有种⽆从下⼿的感觉,⾯对⾯试说不到技术的重点,每次⾯试只能靠队友,靠兄弟⽀援,尤其是⾯对架构,编程更是⽆从下⼿。于是我决定对市场上⼤多的有关⼤数据核⼼的⾯试题做⼀个详细的分析,也希望⼤家尽可能的做到举⼀反三,⽽不是局限于题⽬本⾝。
⼩编分享的这份Java后端开发⾯试总结包含了JavaOOP、Java集合容器、Java异常、并发编程、Java反射、Java序列化、JVM、Redis、Spring MVC、MyBatis、MySQL数据库、消息中间件MQ、Dubbo、Linux、ZooKeeper、分布式&数据结构与算法等26个专题技术点,都是⼩编在各个⼤⼚总结出来的⾯试真题,已经有很多粉丝靠这份PDF拿下众多⼤⼚的offer,今天在这⾥总结分享给到⼤家!【已完结】
完整版Java⾯试题地址:。
序号专题内容链接
1中间件【秋招必备】Java中间件⾯试题(2021最新版)
2微服务【秋招必备】Java微服务⾯试题(2021最新版)
3并发编程【秋招必备】Java并发编程⾯试题(2021最新版)
4Java基础【秋招必备】Java基础知识⾯试题(2021最新版)
5Spring Boot【秋招必备】Spring Boot⾯试题(2021最新版)
6Redis【秋招必备】Redis⾯试题(2021最新版)
7Spring MVC【秋招必备】Spring MVC⾯试题(2021最新版)
8Spring Cloud【秋招必备】Spring Cloud⾯试题(2021最新版)
9MySQL优化【秋招必备】MySQL优化⾯试题(2021最新版)
10JVM【秋招必备】JVM性能调优⾯试题(2021最新版)
11Linux【秋招必备】Linux⾯试题(2021最新版)
12Mybatis【秋招必备】Mybatis⾯试题(2021最新版)
13⽹络编程【秋招必备】TCP,UDP,Socket,Http⽹络编程⾯试题(2021最新版)
14设计模式【秋招必备】设计模式⾯试题(2021最新版)
15⼤数据【秋招必备】⼤数据⾯试题100道(2021最新版)
16Tomcat【秋招必备】Tomcat⾯试题(2021最新版)
17多线程【秋招必备】多线程⾯试题(2021最新版)
18Nginx【秋招必备】Nginx_BIO_NIO_AIO⾯试题(2021最新版)
19memcache【秋招必备】memcache⾯试题(2021最新版)
20java异常【秋招必备】java异常⾯试题(2021最新版)
易语言还有人用吗21Java虚拟机【秋招必备】Java虚拟机⾯试题(2021最新版)
22Java集合【秋招必备】Java集合⾯试题(2021最新版)
23Git常⽤命令【秋招必备】Git常⽤命令(2021最新版)
24Elasticsearch【秋招必备】Elasticsearch⾯试题(2021最新版)
25Dubbo【秋招必备】Dubbo⾯试题(2021最新版)
1、选择题
1.1.下⾯哪个程序负责 HDFS 数据存储。
a)NameNode
b)Jobtracker
c)Datanode
d)secondaryNameNode
e)tasktracker
答案 C datanode
1.2.HDfS 中的 block 默认保存⼏份?
a)3 份
b)2 份
c)1 份
d)不确定
答案 A 默认 3 份
keyword什么意思中文1.3.下列哪个程序通常与 NameNode 在⼀个节点启动?
a)SecondaryNameNode
b)DataNode
c)TaskTracker
d)Jobtracker
答案 D
1.4.HDFS 默认 Block Size
a)32MB
b)64MB
c)128MB
答案:B
1.5.下列哪项通常是集的最主要瓶颈
a)CPU
b)⽹络
c)磁盘 IO
mysql面试题大全d)内存
答案:C 磁盘
1.6.关于 SecondaryNameNode 哪项是正确的?
a)它是 NameNode 的热备
b)它对内存没有要求
c)它的⽬的是帮助 NameNode 合并编辑⽇志,减少 NameNode 启动时间
d)SecondaryNameNode 应与 NameNode 部署到⼀个节点
答案 C。
1.7.下列哪项可以作为集的管理?
a)Puppet
微服务架构的连接件b)Pdsh
c)Cloudera Manager
d)Zookeeper
答案 ABD
1.8.Client 端上传⽂件的时候下列哪项正确
a)数据经过 NameNode 传递给 DataNode
b)Client 端将⽂件切分为 Block,依次上传
c)Client 只上传数据到⼀台 DataNode,然后由 NameNode 负责 Block 复制⼯作send message翻译
答案 B
分析:Client 向 NameNode 发起⽂件写⼊的请求。NameNode 根据⽂件⼤⼩和⽂件块配置情况,返回给 Client 它所管理部分DataNode 的信息。Client 将⽂件划分为多个 Block,根据 DataNode 的地址信息,按顺序写⼊到每⼀个 DataNode 块中。具体查看 HDFS 体系结构简介及优缺点。
1.9.下列哪个是 Hadoop 运⾏的模式
a)单机版
b)伪分布式
c)分布式
答案 ABC 单机版,伪分布式只是学习⽤的。
2、⾯试题
2.1. Hadoop 的核⼼配置是什么?
Hadoop 的核⼼配置通过两个 xml ⽂件来完成:1,l;2,l。这些⽂件都使⽤ xml 格式,因此每个 xml 中都有⼀些属性,包括名称和值,但是当下这些⽂件都已不复存在。
2.2.那当下⼜该如何配置?
Hadoop 现在拥有 3 个配置⽂件:1,l;2,l;3,l。这些⽂件都保存在 conf/⼦⽬录下。
2.3.“jps”命令的⽤处?
这个命令可以检查 Namenode、Datanode、Task Tracker、 Job Tracker 是否正常⼯作。
2.4.mapreduce 的原理?
2.5. HDFS 存储的机制?
流程:
1、 client 链接 namenode 存数据
2、 namenode 记录⼀条数据位置信息(元数据),告诉 client 存哪。
3、 client ⽤ hdfs 的 api 将数据块(默认是 64M)存储到 datanode 上。
4、 datanode 将数据⽔平备份。并且备份完将反馈 client。
5、 client 通知 namenode 存储块完毕。
6、 namenode 将元数据同步到内存中。
7、另⼀块循环上⾯的过程。
流程:
1、 client 链接 namenode,查看元数据,到数据的存储位置。
2、 client 通过 hdfs 的 api 并发读取数据。
3、关闭连接。
周期信号的傅里叶变换公式
2.6.举⼀个简单的例⼦说明 mapreduce 是怎么来运⾏的 ? wordcount 的例⼦
2.7.⽤ mapreduce 来实现下⾯需求?
现在有 10 个⽂件夹,每个⽂件夹都有 1000000 个 url.现在让你出 top1000000url。解答:topk
(还可以⽤ treeMap, 到 1000000 了每来⼀个都加进去, 删掉最⼩的)
2.8.hadoop 中 Combiner 的作⽤?
combiner 是 reduce 的实现,在 map 端运⾏计算任务,减少 map 端的输出数据。作⽤就是优化。
但是 combiner 的使⽤场景是 mapreduce 的 map 和 reduce 输⼊输出⼀样。
2.9.简述 hadoop 安装
2.10. 请列出 hadoop 进程名
2.11. 解决下⾯的错误

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。