bi⼯程师⾯试题_【BI⼤数据分析】职业规划之横纵拓展这章有以下内容展⽰:技术需求与更新⽅⾯?
挖深后需要了解的⽅⾯有那些?
关于Linux系统
- 它在BI⼤数据分析框架是⽤来⼲什么?扮演什么⾓⾊?
关于SQL编写
Q1:它在BI⼤数据分析框架是⽤来⼲什么?扮演什么⾓⾊?
Q2:什么时候要⽤到SQL?
Q3:PL/SQL结构化语句(存储过程/循环体/函数/⽇志)等它们可以怎样结合⼀起?
Q4:执⾏顺序,执⾏查询语句的基本逻辑?-> 优化查询速度!
Q5*:简历索引的好处和潜在危险,索引的种类以及索引失效的情况如何处理?
Q6*:如何处理多表复杂查询?
针对不同的表,选⽤不同的主键类型? (BOSS 直聘)
Q5:去细分⼀下对应要做什么优化操作?
Q6:它和读写速度间有什么关系?
简单可以分为三个维度(另外两个⾓度:软硬件)
Q6:如何确保数据量⼤情况下的数据质量,稳定性和⼝径度量值?
⼤数据之数据质量_HW_870754395的博客-CSDN博客
【DTalk实践】⽹易猛犸⼤数据如何提升数据质量?
Q7:数据量过百万千万条,多个字段并且多个字段。
它们之间在不同数据库⾥的存储占⽤空间的关系?
Q8:不同数据库,可以在哪⾥查看占据的空间⼤⼩?接着如何优化?
Q9*:时间戳等数据增量收取⽅式,和其它有什么区别,为什么要⽤它?(适⽤范围)
关于任务调度⼯具
Q1:它扮演什么⾓⾊?它的原理是什么?
Q2:为什么要⽤它⽽不是其它?什么时候要⽤到它?
大数据etl工具有哪些Q3:和其它软件有什么不同?各⾃调度引擎是什么?
Q4:Azakan 要如何从搭建配置到调⽤语句?
Q5:Azakan 可视化任务中⽌要怎么处理?常见的解决⽅法有那些?
关于报表软件⼯具
Q1:帆软Report能否实时收集与更新,能的话应该怎样执⾏?
Q2:可视化⼯具,类似帆软有什么与众不同地⽅
Q3:经常⽤的功能有那些模块?⼀共有那些报表和定义数据源的种类?
关于ETL采集清洗加载⼯具
Q1:它们之间的区别是什么,优势是什么?
Q2:在什么环节需⽤到这⼯具?
Q3:为什么要⽤这个,⽽不是数据库⾥的存储过程?
Q4:常见的功能模块有那些?输⼊到输出,要经过那些步骤?
Q5:出现错误后,我们可以在哪⾥发现纠正和调试?
数据仓库系列之ETL过程和ETL⼯具 - 黄昏前黎明后 - 博客园
关于BI理论知识
Q1:数据仓库和数据库的区别? OLTP和OLAP的不同?
Q2:数据仓库为什么要分层?分层的好处有哪些?
Q3:三范式的定义,在哪⾥⽤到它较为合适,有什么优点?
Q4:维度表的定义,在哪⾥⽤到它较为合适,三种模型之间的区别?
Q5:为什么要⽤代理主键和业务主键?什么场景使⽤最多?
Q6:有那些数据历史保存⽅法?各⾃优缺点?
Q7:有那些关联机制? 在哪⾥可以查看?他们的执⾏逻辑顺序?
Q8*:主表和从表,数据量⼤与⼩,和关联机制的关系,那种更适合?
Q9*:Hints 是什么意思?为什么要有它的出现,它能解决什么问题?
Q10:项⽬的流程和规模时长?如何评估,经过谁检测和调试再上⽣产?
Q11:增量抽取,全量抽取,分区抽取等区别?
Q12*:拉链表是⽤来⼲什么?
关于Hadoop架构认知
Q1:Hadoop⽤什么框架,本质是⽤来解决什么问题?
Q2*:与同样可以解决这类问题的⼯具或者框架,Hadoop具备那些优劣?
Q3:框架下的主件有那些,它们分别负责什么内容?各⾃的关系如何?
Q4:从底层到数据展⽰框架的流程图是?
⼀篇了解⼤数据架构及Hadoop⽣态圈 - 懵懂的菜鸟 - 博客园
⼤数据Hadoop⽣态圈介绍_葱葱那年-CSDN博客
关于软技能:
Q1: ⽂档资料编写能⼒(规范性,复现性,便捷寻回性) 要如何体现?
Q2: 业务分析(5W2H)是怎么来⼜是怎么去?最后是要针对落实到⼈的执⾏⽅案上
Q3: 归纳(易错踩过坑,项⽬步骤过程还原(减少),成项⽬体系(增加)?

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。