Python 实现大数据挖掘技术培训
【课程目标】
Python 已经成为数据分析和数据挖掘的首选语言, 作为除了 Java、C/C++/C# 最受欢迎的语言。
本课基于 Python 工具来实现大数据的数据分析和数据挖掘项目。基于业 问题,在数据挖掘标准过程指导下,采用 Python 分析工具,实现数据挖掘项 的每一步操作, 从数据预处理、数据建模、数据可视化, 到最终数据挖掘结束, 匡助学员掌握 Python 用于数据挖掘, 提升学员的数据化运营及数据挖掘的能力。
通过课程的学习,达到如下目的:
1、全面掌握 Python 语言以及其编程思想。
2、掌握常用扩展库的使用,特殊是数据挖掘相关库的使用。
3、学会使用 Python 完成数据挖掘项目整个过程。
4掌握利用 Python 实现可视化呈现。
5、掌握数据挖掘常见算法在 Python 中的实现。
【授课时间】
5 天时间
(全部模块讲完需要 5 天时间,可以根据时间需求拆份内容模块)。
【授课对象】
业务支持部、 IT 系统部、大数据系统开辟部、大数据分析中心、网络运维 部等相关技术人员
【学员要求】
课程为实战课程,要求
1、每一个学员自备一台便携机(必须)。
2、便携机中事先安装好 Excel 2022 版本及以上。

3、便携机中事先安装好 Python 3.6 版本及以上。
:讲师现场提供开源的安装程序、扩展库,以及现场分析的数据源。
【授课方式】
语言基础 +挖掘模型 +案例演练+开辟实践+可视化呈现
采用互动式教学,环绕业务问题,展开数据分析过程,全过程演练操作,让 学员在分析、分享、讲授、总结、自我实践过程中获得能力提升。
【课程大纲】
一部份: Python 语言基础
的:掌握基本的 Python 编程思想与编程语句,熟悉常用数据结构的操作
1、Python 简介
2、开辟环境搭建  Python 的安装 扩展库的安装
3掌握 Python 的简单数据类型 字符串的使用及操作  整数、浮点数
4、掌握基本语句:
ifwhileforprint
基本运算
数定义、参数传递、返回值
5、掌握复杂的数据类型:列表/元组
列表操作:访问、添加、修改、删除、排序
列表切片、复制
列表相关的函数、方法
元组的应
6、复杂数据类型:字典

创建、访问、修改、删除、遍历
字典函数和方法
7复杂数据类型:集合
8、掌握面向对象编程思想 创建类、继承类 
9、函数定义、参数传递、返回
10、    标准库与扩展库的导
11、    异常处理:try-except 块
:基本的 Python 编程语句
二部份: Python 语言与数据挖掘库
目的:握数据集结构及基本处理方法,进一步巩固 Python 语言
1数据挖掘常用扩展库介绍 Numpy 数组处理支持
Scipy 矩阵计算模块
Matplotlib 数据可视化工具库
Pandas 数据分析和探索工具
StatsModels 统计建模
Scikit-Learn 机器学习库
Keras 深度学习(神经网络)
Gensim 文本挖掘库
2、数据集读取与操作:读取、写入 读写文本文件
写 CSV 文件
写 Excel 文件
从数据库获取数据集
3、数据集的核心数据结构(Pandas 数据结构) DataFrame 对象及处理方

Series 对象及处理方
演练用 Python 实现数据的基本统计分析功能
三部份:数据可视化处理
:掌握作图扩展库,实现数据可视化
1、常用的 Python 作图库 Matplotlib    Pygal
2、实现分类汇总
演练:按性别统计用户人数
演练:按产品+日期统计各产品销售金额
3、种图形的画法 直方图
折线图
散点图
4、绘图的美化技巧
演练: Python 库作图来实现产品销量分析,并可视化
第四部份:数据挖掘基础
目的:掌握数据挖掘标准流
1、数据挖掘概述
2、数据挖掘的标准流程(CRISP-DM)
商业理
数据准备
数据理解
模型建立
模型评估
模型应用

3、数挖掘常用任务与算法
案例:用大数据实现精准营销的项目过程
第五部份:数据理解和数据准备
:掌握数据预处理的基本环节,以及 Python 的实现
1、数据预处理
常值处理: 3σ准则, IQR 准则
失值插补:均值、拉格朗日插补
数据筛选/抽样
数据的离散化处
变量变换、变量派生
2数据的基本分析
相关分析:原理、公式、应用
方差分析:原理、公式、应用
卡方分析:原理、公式、应用
主成份分析:降
例:用 Python 实现数据预处理及数据准备
第四部份:分类预测模型实战
1、常分类预测的模型与算法python大数据就业前景
2、如何评估分类预测模型的质量
查准率
查全率
ROC线
3逻辑回归分析模型 逻辑回归的原理
逻辑回归建模的步骤
逻辑回归结果解读
例:用 sklearn 库实现银行贷款违约预测

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。