从零开始学python数据分析与挖掘
⽬ 录
第1章 数据分析与挖掘概述
1.1 什么是数据分析和挖掘
1.2 数据分析与挖掘的应⽤领域
1.2.1 电商领域——发现破坏规则的“害之马”
1.2.2 交通出⾏领域——为打车平台进⾏私⼈订制
1.2.3 医疗健康领域——到最佳医疗⽅案
1.3 数据分析与挖掘的区别
1.4 数据挖掘的流程
1.4.1 明确⽬标
1.4.2 数据搜集
1.4.3 数据清洗
1.4.4 构建模型
1.4.5 模型评估
1.4.6 应⽤部署
1.5 常⽤的数据分析与挖掘⼯具
1.6 本章⼩结
第2章 从收⼊的预测分析开始
2.1 下载与安装Anoconda
2.1.1 基于Windows系统安装
2.1.2 基于Mac系统安装
2.1.3 基于Linux系统安装
2.2 基于Python的案例实战
2.2.1 数据的预处理
2.2.2 数据的探索性分析
2.2.3 数据建模
2.3 本章⼩结
第3章 Python快速⼊门
3.1 数据结构及⽅法
3.1.1 列表
3.1.2 元组
3.1.3 字典
3.2 控制流
3.2.1 if分⽀
3.2.2 for循环
3.2.3 while循环
3.3 字符串处理⽅法
3.3.1 字符串的常⽤⽅法
3.3.2 正则表达式
3.4 ⾃定义函数
3.4.1 ⾃定义函数语法
3.4.2 ⾃定义函数的⼏种参数
3.5 ⼀个爬⾍案例
3.6 本章⼩结
第4章 Python数值计算⼯具——Numpy 4.1 数组的创建与操作
4.1.1 数组的创建
4.1.2 数组元素的获取
4.1.3 数组的常⽤属性
4.1.4 数组的形状处理
4.2 数组的基本运算符
4.2.1 四则运算
4.2.2 ⽐较运算
4.2.3 ⼴播运算
4.3 常⽤的数学和统计函数
4.4 线性代数的相关计算
4.4.1 矩阵乘法
4.4.2 diag函数的使⽤
4.4.3 特征根与特征向量
4.4.4 多元线性回归模型的解
4.4.5 多元⼀次⽅程组的求解
4.4.6 范数的计算
4.5 伪随机数的⽣成
4.6 本章⼩结
第5章 Python数据处理⼯具——Pandas 5.1 序列与数据框的构造
5.1.1 构造序列
5.1.2 构造数据框
5.2 外部数据的读取
5.2.1 ⽂本⽂件的读取
5.2.2 电⼦表格的读取
5.2.3 数据库数据的读取
5.3 数据类型转换及描述统计
5.4 字符与⽇期数据的处理
5.5 常⽤的数据清洗⽅法
5.5.1 重复观测处理
5.5.2 缺失值处理
5.5.3 异常值处理
5.6 数据⼦集的获取
5.7 透视表功能
5.8 表之间的合并与连接
5.9 分组聚合操作
5.10 本章⼩结
第6章 Python数据可视化
6.1 离散型变量的可视化
6.1.1 饼图
6.1.2 条形图
6.2 数值型变量的可视化
6.2.1 直⽅图与核密度曲线
6.2.2 箱线图
6.2.3 ⼩提琴图
6.2.4 折线图
6.3 关系型数据的可视化
6.3.1 散点图
6.3.2 ⽓泡图
6.3.3 热⼒图
6.4 多个图形的合并
6.5 本章⼩结
第7章 线性回归预测模型
7.1 ⼀元线性回归模型
7.2 多元线性回归模型
7.2.1 回归模型的参数求解
7.2.2 回归模型的预测
7.3 回归模型的假设检验
7.3.1 模型的显著性检验——F检验
7.3.2 回归系数的显著性检验——t检验7.4 回归模型的诊断
7.4.1 正态性检验
7.4.2 多重共线性检验
7.4.3 线性相关性检验
7.4.4 异常值检验
7.4.5 独⽴性检验
7.4.6 ⽅差齐性检验
7.5 本章⼩结
第8章 岭回归与LASSO回归模型
8.1 岭回归模型
8.1.1 参数求解
8.1.2 系数求解的⼏何意义
8.2 岭回归模型的应⽤
8.2.1 可视化⽅法确定?值
8.2.2 交叉验证法确定?值
8.2.3 模型的预测
8.3 LASSO回归模型
8.3.1 参数求解
8.3.2 系数求解的⼏何意义
关于python的书
8.4 LASSO回归模型的应⽤
8.4.1 可视化⽅法确定?值
8.4.2 交叉验证法确定?值
8.4.3 模型的预测
8.5 本章⼩结
第9章 Logistic回归分类模型
9.1 Logistic模型的构建
9.1.1 Logistic模型的参数求解
9.1.2 Logistic模型的参数解释 9.2 分类模型的评估⽅法
9.2.1 混淆矩阵
9.2.2 ROC曲线
9.2.3 K-S曲线
9.3 Logistic回归模型的应⽤
9.3.1 模型的构建
9.3.2 模型的预测
9.3.3 模型的评估
9.4 本章⼩结
第10章 决策树与随机森林
10.1 节点字段的选择
10.1.1 信息增益
10.1.2 信息增益率
10.1.3 基尼指数
10.2 决策树的剪枝
10.2.1 误差降低剪枝法
10.2.2 悲观剪枝法
10.2.3 代价复杂度剪枝法
10.3 随机森林
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论