第1章 大数据分析师考试大纲
大数据分析师是一个随着大数据兴起而崛起的新兴的工作岗位,是专门从事行业数据搜集、整理、分析,并依据数据能制作业务报告、提供决策、管理数据资产、评估和预测的专业人员。
一、考试目标
随着大数据时代的到来,企业管理者对数据价值的重视度越来越高,他们渴望从企业内部数据、外部数据中获得更多的信息财富,并以此为依据,帮助自己做出正确的战略决策。如今在数据分析师的岗位上,大多数员工都是非统计出身,远远达不到专业数据分析水平,如何能够最快到突破口,帮助对数据分析有兴趣的人员全面掌握数据分析技巧,是本考试的目标。
本大数据分析师考试旨在测查应试者在职业情景下是否具备大数据分析基础知识,是否了解数据分析工作流程及数据分析技术,是否具备利用数据分析知识解决实际业务问题的能力。
二、考试对象
专科学历以上(含大专毕业)文化程度的即将就业和已就业人。
sql查询语句的形式三、考试基本要求
本考试侧重考查考生对大数据分析知识的掌握和应用情况,考察考生使用分析工具(R、Python、Excel、SPSS等)解决企业实际数据分析任务的能力。具体要求如下:
❑ 了解大数据的产生背景。
❑ 理解大数据的定义、特点、原理、作用,了解大数据相关技术、应用和发展趋势,掌握“大数据”和“小数据”的内涵。
❑ 掌握大数据分析基本过程:采集、预处理、分析和可视化、建模与挖掘。
❑ 理解大数据分析师的基本技能要求和素养要求,理解懂业务、懂管理、懂分析、懂工具、懂设计。
❑ 理解数据及数据分类,能够熟练正确运用数学思维、统计思维、逻辑思维和数据思维方法分析问题。
❑ 了解或掌握R语言基本语法。
❑ 了解或理解R语言生态:工作空间、脚本、R包。
❑ 了解或掌握帮助信息获取方法。
❑ 了解或熟练掌握R语言数据结构:向量、矩阵、数据框,数组、因子、列表。
❑ 掌握R语言控制结构:选择结构、循环结构和自定义函数。
❑ 了解或掌握Python基本语法和数据分析包的使用。
❑ 了解或掌握利用Excel进行数据分析的过程。
❑ 了解或掌握使用SPSS进行数据分析的原理。
三大认证体系认证证书❑ 能用一种工具导入文本、Excel、数据库数据
❑ 能用一种工具导出数据
❑ 能用R或Python实现网页爬虫编程。
❑ 掌握数据缺失值、异常值、重复值的处理方法,并能用一种工具实现之。
❑ 能用一种工具对数据标准化、类型转换等数据变换操作。
❑ 能用一种工具实现重构数据、添加新变量、分组汇总等数据整合操作
❑ 了解数据可视化概念和作用
❑ 理解可视化建议
❑ 了解图表的作用:成分关系图表(柱图、饼图)、对比关系图表(时序图、折线图、面积图)、相关关系图表(散点图、气泡图)、多维比较图表(雷达图、圆环图)
❑ 熟练掌握“散点点图”“折线线图”“直方图”“柱状图”“饼图”“箱线图”“密度图”“直线图”的绘制方法
❑ 了解“地图”“交互图”等绘制方法
❑ 理解数据认知及其作用。
❑ 掌握概率分析方法:概率分布、常用统计量、假设检验等。
❑ 理解集中趋势及分布形态的统计含义。
❑ 理解离散趋势及分布形态的统计含义。
❑ 掌握横向比较、纵向比较方法。python基础知识单选题
❑ 掌握相关分析原理和方法。
❑ 掌握交叉分析原理和方法。
❑ 了解层次分析原理和步骤
❑ 理解特征工程的作用。
❑ 理解特征选择和特征提取原理及分类。
❑ 掌握PCA方法。
❑ 掌握因子分析过程。
❑ 理解数据建模概念和作用。
❑ 理解神经网络构成、作用、工作原理。
❑ 理解决策树概念和原理。
❑ 理解关联分析原理及Apriori算法。
❑ 掌握回归分析基本思想。
❑ 理解时间序列特点。
❑ 计划裁员10000人理解模型评估的意义。
❑ 理解训练集、测试集和验证集。
❑ 理解混淆矩阵;能熟练根据混淆矩阵计算准确率、召回率、敏感度等指标。
❑ 理解效用、效用曲线、风险图。
❑ 理解ROC曲线、ROC曲线作用,能够熟练绘制ROC曲线。
❑ 理解数据的价值。
❑ 了解数据分析报告概念、分类。
❑ 掌握数据分析报告写作原则、写作要点、写作目的。
❑ 掌握数据分析报告结构
❑ 了解撰写数据分析报告注意事项
❑ 能根据具体应用场景给出数据分析基本思路
四、考试题型和试卷结构
考试题型包括:单项选择、多项选择、判断题、填空题、简答题、实操题。试卷题型和试卷结构如表1所示。
表1 试卷题型和试卷结构
题型 struts2使用ajax | 试题数量 | 小题分值 | 大题分值 | 备注 |
单选题 | 20 | 1 | 20 | 侧重面上知识与能力考查 |
多选题 | 5 | 2 | 10 | 侧重难点知识考查 |
填空题 | 10 | 3 | 30 | 侧重基础知识考查 |
判断题 | 10 | 2 | 20 | 侧重核心知识考查 |
简答题 | 2 | 5 | 10 | 侧重问题分析能力考查 |
实操题 | 1 | 10 | 10 | 侧重知识应用、综合能力考查 |
关于知识点分布和试卷样例在考虑中。
五、组织机构与成绩认证
JYPC全国职业资格考试认证中心负责组织考试培训、命题、考试、阅卷和认证工作,并有来自相关行业及高校的专家组成专家委员会,知道考试和认证工作。通过考试中心认证资质认证的各地高等学校和教育培训机构可以申请设立考点,考试中心对各地考点实行年审和动态管理。
考试为闭卷考试,考试时间为120分钟,分值为100分,成绩60以上(含60分)为通过。笔试考试通过可获得JYPC全国职业资格考试认证中心颁发的大数据分析师从业资格证书。
六、考试内容
考点涉及正确的数据思维观、统计基础、编程基础、数据导入/导出、数据预处理、数据认知、数据可视化、数据建模、模型优化、分析报告撰写等技术及熟悉典型的业务场景认知。
1、大数据基础
(1)大数据的产生背景
(2)大数据的定义、特点、原理、作用
(3)大数据相关技术、应用和发展趋势
(4)大数据分析基本过程
(5)大数据分析师的基本技能要求和素养要求
(6)正确的数据思维观
2、数据分析工具
(1)R语言基本语法
(2)R语言环境:工作空间、脚本、R包
(3)获取帮助信息
(4)R语言数据结构:向量、数组、矩阵、数据框、因子、列表
(5)R语言控制结构:选择结构、循环结构和自定义函数
(6)其它数据分析工具简介
3、数据准备
(1)文本、Excel、数据库数据导入
(2)数据导出
(3)网页爬虫
(4)数据清洗:缺失值处理、异常值处理、重复值处理
(5)数据变换:中心化、标准化、类型转换、数据过滤、函数变换
(6)数据整合:重构数据、添加新变量、分组汇总
4、数据可视化
(1)数据可视化概念及作用
(2)可视化建议
(3)绘制“点图”:散点图、气泡图、茎叶图、词云图
(4)绘制“线图”:直线图、曲线图、折线图、雷达图、密度图、等高线图
(5)绘制“面图”:直方图、柱状图、饼图、面积图、箱线图、脸谱图
(6)绘制“地图”
(7)绘制“交互图”
(8)绘制其它图形:误差线图等
5、数据认知
(1)数据认知及其作用
(2)概率分析:概率分布、常用统计量、假设检验、概率分析方法和步骤
(3)趋势分析:纵向分析、横向分析、预测分析
(4)对比分析:对比分析原理、常用对比分析方法
(5)细分分析原理和策略
(6)交叉分析:概念、作用、展现形式和基础
(7)相关分析:两个变量和多变量相关分析、线性和非线性相关分析
(8)层次分析原理和步骤
6、特征工程
silverlight错误2152(1)特征选择和特征提取
(2)主成分分析原理
(3)因子分析:因子分析特点、过程和作用
6、数据建模
(1)数据建模概念
(2)神经网络构成、作用和工作原理
(3)决策树概念、原理和常用算法
(4)关联分析原理和Apriori算法
(5)回归分析原理及分析过程
(6)聚类分析原理和Kmeans算法
(7)时间序列概念及分析过程
7、模型评估
(1)模型评估的意义
(2)数据集选择
(3)混淆矩阵、真阴、假阴、真阳、假阳、准确度、灵敏度、特异性、错误率、误判率、召回率
(4)效用、效用曲线、风险图
(5)ROC曲线及其作用
8、数据分析报告
(1)数据分析报告概念、分类、
(2)数据分析报告写作原则、写作要点、写作目的
(3)数据分析报告结构
(4)撰写数据分析报告注意事项
9、行业背景认知
(1)医疗大数据
①疾病传播预测;
②移动医疗;
③海量基因测序与疾病预防;
④精准医疗
⑤药物研发
(2)交通大数据
①拥堵模式分析;
②精确导航;
③合理配置公共交通资源;
④提高交通安全水平。
(3)环境大数据
①极端天气的早期预警
②更准确、更精密的天气预测
③空气污染物空间分布
(4)电商大数据
①长尾理论;
②个性化推荐;
③提高用户粘性;
④商品价格预测;
⑤购物篮分析。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论