bi数据分析师面试题
关于Linux系统
它在BI大数据分析框架是用来干什么?扮演什么角?
关于SQL编写
Q1:它在BI大数据分析框架是用来干什么?扮演什么角?
Q2:什么时候要用到SQL?
Q3:PL/SQL结构化语句(存储过程/循环体/函数/日志)等它们可以怎样结合一起?
Q4:执行顺序,执行查询语句的基本逻辑?-> 优化查询速度!
Q5:简历索引的好处和潜在危险,索引的种类以及索引失效的情况如何处理?
Q6:如何处理多表复杂查询?
  针对不同的表,选用不同的主键类型? (BOSS 直聘)
Q5:去细分一下对应要做什么优化操作?
Q6:它和读写速度间有什么关系?数据可视化什么意思
  简单可以分为三个维度(另外两个角度:软硬件)
Q6:如何确保数据量大情况下的数据质量,稳定性和口径度量值?
大数据之数据质量_HW_870754395的博客-CSDN博客
【DTalk实践】网易猛犸大数据如何提升数据质量?
Q7:数据量过百万千万条,多个字段并且多个字段。
它们之间在不同数据库里的存储占用空间的关系?
Q8:不同数据库,可以在哪里查看占据的空间大小?接着如何优化?
Q9:时间戳等数据增量收取方式,和其它有什么区别,为什么要用它?(适用范围)
关于任务调度工具
Q1:它扮演什么角?它的原理是什么?
Q2:为什么要用它而不是其它?什么时候要用到它?
Q3:和其它软件有什么不同?各自调度引擎是什么?
Q4:Azakan 要如何从搭建配置到调用语句?
Q5:Azakan 可视化任务中止要怎么处理?常见的解决方法有那些?
关于报表软件工具
Q1:帆软Report能否实时收集与更新,能的话应该怎样执行?
Q2:可视化工具,类似帆软有什么与众不同地方
  Q3:经常用的功能有那些模块?一共有那些报表和定义数据源的种类?
关于ETL采集清洗加载工具
Q1:它们之间的区别是什么,优势是什么?
Q2:在什么环节需用到这工具?
Q3:为什么要用这个,而不是数据库里的存储过程?
Q4:常见的功能模块有那些?输入到输出,要经过那些步骤?
Q5:出现错误后,我们可以在哪里发现纠正和调试?
  数据仓库系列之ETL过程和ETL工具 - 黄昏前黎明后 - 博客园
关于BI理论知识
Q1:数据仓库和数据库的区别? OLTP和OLAP的不同?
Q2:数据仓库为什么要分层?分层的好处有哪些?
Q3:三范式的定义,在哪里用到它较为合适,有什么优点?
Q4:维度表的定义,在哪里用到它较为合适,三种模型之间的区别?
Q5:为什么要用代理主键和业务主键?什么场景使用最多?
Q6:有那些数据历史保存方法?各自优缺点?
Q7:有那些关联机制? 在哪里可以查看?他们的执行逻辑顺序?
Q8:主表和从表,数据量大与小,和关联机制的关系,那种更适合?
Q9:Hints 是什么意思?为什么要有它的出现,它能解决什么问题?
Q10:项目的流程和规模时长?如何评估,经过谁检测和调试再上生产?
Q11:增量抽取,全量抽取,分区抽取等区别?
  Q12:拉链表是用来干什么?
关于Hadoop架构认知
Q1:Hadoop用什么框架,本质是用来解决什么问题?
Q2:与同样可以解决这类问题的工具或者框架,Hadoop具备那些优劣?
Q3:框架下的主件有那些,它们分别负责什么内容?各自的关系如何?
Q4:从底层到数据展示框架的流程图是?
一篇了解大数据架构及Hadoop生态圈 - 懵懂的菜鸟 - 博客园
  大数据Hadoop生态圈介绍_葱葱那年-CSDN博客
关于软技能:
Q1: 文档资料编写能力(规范性,复现性,便捷寻回性) 要如何体现?
Q2: 业务分析(5W2H)是怎么来又是怎么去?最后是要针对落实到人的执行方案上
Q3: 归纳(易错踩过坑,项目步骤过程还原(减少),成项目体系(增加)?

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。