cda-level-考试大纲 (1)--688IT编程网

cda level 考试大纲

一、知识要求

针对不同知识，掌握程度的要求分为【领会】、【熟知】、【应用】三个级别，考生应按照不同知识要求进行学习。

1、领会：考生能够领会了解规定的知识点，并能够了解规定知识点的内涵与外延，了解其内容要点和它们之间的区别与联系，并能做出正确的阐述、解释和说明。

2、熟知：考生须掌握知识的要点，并能够正确理解和记忆相关理论方法，能够根据不同要求，做出逻辑严密的解释、说明和阐述。此部分为考试的重点部分。

3、应用：考生须学会将知识点落地实践，并能够结合相关工具进行商业应用，能够根据具体要求，给出问题的具体实施流程和策略。

二、考试范围

1、大数据基础理论占比（8%）

a.大数据分析基础（1%）

b.Python 基础（5%）

c.Linux & Ubuntu 操作系统基础（2%）

2、Hadoop 理论占比（12%）

a.Hadoop 安装配置及运行机制解析（2%）

b.HDFS 分布式文件系统（2%）

c.MapReduce 理论及实战（2%）

d.Hadoop 生态其他常用组件（6%）

3、大数据分析之数据库理论及工具占比（16% ）

a.数据库导论（2%）

b.MySQL 理论及实战（3%）

c.HBase 安装及使用（3%）

d.Hive 安装及使用（5%）

e.Sqoop 安装及使用（3%）

4、大数据分析之数据挖掘理论基础占比（10%）

a.数据挖掘的基本思想（2%）

b.数据挖掘基本方法介绍（2%）

c.有监督学习算法（4%）

d.无监督学习算法（2%）

5、大数据分析之 Spark 工具及实战占比（35%）

a.Spark 基础理论（2%）

b.Spark RDD 基本概念及常用操作（3%）

c.Spark 流式计算框架 Spark Streaming 、Structured Streaming（5%）

d.Spark 交互式数据查询框架 Spark SQL（5%）

e.Spark 机器学习算法库 Spark MLlib 基本使用方法（15%）

f.Spark 图计算框架 GraphX（5%）

6、大数据分析之数据可视化方法占比（4%）

a.数据可视化入门基础（1%）

b.Python 数据可视化入门（2%）

c.Python 高级数据可视化方法（1%）

7、大数据分析实战占比（15%）

a.利用 HDFS Shell 操作 HDFS 文件系统（1%）

b.利用 Hive SQL 进行数据清洗（2%）

c.利用 Sqoop 进行数据传输（1%）

d.利用 Spark SQL 进行数据读取（2%）

e.利用 Spark MLlib 进行机器学习建模（8%）

f.利用 Python 进行建模结果数据可视化（1%）

二、考试内容

PART 1 大数据基础理论

1 、大数据分析基础

【领会】

大数据技术诞生技术背景

大数据技术实际应用

分布式处理技术概念

kafka常用命令

数据分析和数据挖掘的概念

【熟知】

明确数据分析的目标和意义

明确分布式技术在进行海量数据处理时起到的关键作用

数据分析方法与数据挖掘方法的区别和联系

明确数据分析流程中不同软件工具的作用

常用描述性统计方法

常用数据挖掘方法

2、Python 基础

【领会】

Python 语言的特点、语法、应用场景

【熟知】

Python 基础语法，包括基本数据类型、运算符、条件控制语句、循环语句等；

Python 函数式编程，常用高阶函数，包括 map 函数、reduce 函数、filter 函数及模块相关功能

Python 面向对象编程特性，包括类和实例、继承、多态利用 Python 链接数据库

Python 可视化常用包及其基本使用方法

3、Linux 与 Ubuntu 基础

【领会】

Linux 入门

Linux 与 Ubuntu 的关系

Ubuntu 的安装及配置

Ubuntu 文件组织形式

Ubuntu 操作系统的常用命令

SSH 理论基础

了解其他常用 Linux 系统，如 CentOS ，RedHat ，SUSE 等

【熟知】

Ubuntu 操作系统命令及使用命令编辑文件

688IT编程网

cda-level-考试大纲 (1)

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

cda-level-考试大纲 (1)

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式