从零开始学python第⼆版_从零开始学Python数据分析与挖掘-
从零开始学Python。。。
从零开始学Python数据分析与挖掘第⼆版以Python 3.7版本作为数据分析与挖掘实战的应⽤⼯具,从Python的基础语法开始,陆续介绍有关数值计算的numpy、数据处理的pandas、数据可视化的matplotlib和数据挖掘的sklearn等内容
编辑推荐
"为满⾜⽤⼈单位对数据分析和挖掘⼈员在编程⽅⾯的技能要求,本书遵循由浅⼊深的原则,详细地介绍了利⽤Python及其相关⼯具实现数据分析和挖掘的实⽤技能。 结合Python中成熟的Numpy、Pandas、MatPlotLib、Sklearn、Seaborn、Statsmodels和SciPy模块,实现数据分析与挖掘中关于数据的清洗、
整理、探索、可视化、建模和评估等流程的操作,让每⼀位对数据分析和挖掘的从业者或感兴趣的读者都能从中学到所需的内容。 详解⼗⼤常⽤数据挖掘算法及案例实战,如多元线性等
内容简介
全书共涵盖15种可视化图形以及10个常⽤的数据挖掘算法和实战项⽬,通过本书的学习,读者可以掌握数据分析与挖掘的理论知识和实战技能。本书适于统计学、数学、经济学、⾦融学、管理学以及相关理⼯科专业的本科⽣、研究⽣使⽤,也能够提⾼从事数据咨询、研究或分析等⼈⼠的专业⽔平和技能。
作者简介
刘顺祥,统计学硕⼠,“数据分析1480”运营者。曾就职于唯品会电商平台,担任不错数据分析师⼀职。⽬前就职于靠前某数据咨询公司,为联想、亨⽒、美丽⽥园、喜⼒、⽹鱼⽹咖等企业提供数据咨询服务。著有《从零开始学Python数据分析与挖掘》⼀书。
⽬录
第1章 数据分析与挖掘概述
1.1 什么是数据分析和挖掘
1.2 数据分析与挖掘的应⽤领域
1.2.1 电商领域——发现破坏规则的“害之马”
1.2.2 交通出⾏领域——为打车平台进⾏私⼈订制
1.2.3 医疗健康领域——到佳医疗⽅案
1.3 数据分析与挖掘的区别
1.4 数据挖掘的流程
1.4.1 明确⽬标
1.4.2 数据搜集
1.4.3 数据清洗
1.4.4 构建模型
1.4.5 模型评估
1.4.6 应⽤部署
1.5 常⽤的数据分析与挖掘⼯具
1.6 本章⼩结
1.7 课后练习
第2章 从收⼊的预测分析开始
2.1 下载与安装Anaconda
2.1.1 基于Windows系统安装
2.1.2 基于Mac系统安装
2.1.3 基于Linux系统安装
2.2 基于Python的案例实战
2.2.1 数据的预处理
2.2.2 数据的探索性分析
2.2.3 数据建模
2.3 本章⼩结
2.4 课后练习
intermediate和middle的区别第3章 Python基础与数据抓取
3.1 数据结构及⽅法
3.1.1 列表
3.1.2 元组
3.1.3 字典
3.2 控制流
3.2.1 if分⽀
3.2.2 for循环
3.2.3 while循环
3.3 字符串处理⽅法
3.3.1 字符串的常⽤⽅法
3.3.2 正则表达式
3.4 ⾃定义函数
3.4.1 ⾃定义函数语法
3.4.2 ⾃定义函数的⼏种参数
3.5 ⼀个爬⾍案例
3.6 本章⼩结
3.7 课后练习
第4章 Python数值计算——numpy的⾼效技能
4.1 数组的创建与操作
4.1.1 数组的创建
4.1.2 数组元素的获取
4.1.3 数组的常⽤属性
4.1.4 数组的形状处理
4.2 数组的基本运算符
4.2.1 四则运算
4.2.2 ⽐较运算
4.2.3 ⼴播运算
4.3 常⽤的数学和统计函数
4.4 线性代数的相关计算
做程序员需要什么基础4.4.1 矩阵乘法
4.4.2 diag函数的使⽤
4.4.3 特征根与特征向量
4.4.4 多元线性回归模型的解
4.4.5 多元⼀次⽅程组的求解
4.4.6 范数的计算
4.5 伪随机数的⽣成
4.6 本章⼩结
4.7 课后练习
第5章 Python数据处理——展现pandas的强r /> 5.1 序列与数据框的构造5.1.1 构造序列
5.1.2 构造数据框
5.2 外部数据的读取
5.2.1 ⽂本⽂件的读取
5.2.2 电⼦表格的读取
5.2.3 数据库数据的读取
5.3 数据类型转换及描述统计
5.4 字符与⽇期数据的处理
5.5 常⽤的数据清洗⽅法
5.5.1 重复观测处理
5.5.2 缺失值处理
5.5.3 异常值处理
5.6 数据⼦集的获取
5.7 透视表功能
5.8 表之间的合并与连接
5.9 分组聚合操作
5.10 本章⼩结
5.11 课后练习
第6章 Python数据可视化——分析报告必要元素6.1 离散型变量的可视化
6.1.1 饼图——“芝⿇信⽤”失信⽤户分布
6.1.2 条形图——胡润排⾏榜
6.2 数值型变量的可视化
边框简笔画手绘可爱素材6.2.1 直⽅图与核密度曲线——展现年龄分布特征6.2.2 箱线图——房单价分布形态
6.2.3 ⼩提琴图——客户消费数据的呈现
6.2.4 折线图——每⽇阅读趋势
6.3 关系型数据的可视化
6.3.1 散点图——探究鸢尾花花瓣长度与宽度的关系6.3.2 ⽓泡图——暴露商品的销售特征
6.3.3 热⼒图——⼀份简单的⽉度⽇历
6.4 多个图形的合并
6.5 本章⼩结nodejs代码
6.6 课后练习
第7章 线性回归预测模型
7.1 ⼀元线性回归模型——收⼊预测
7.2 多元线性回归模型——销售利润预测
7.2.1 回归模型的参数求解
7.2.2 回归模型的预测
7.3 回归模型的假设检验
7.3.1 模型的显著性检验——F检验
7.3.2 回归系数的显著性检验——t检验
7.4 回归模型的诊断
7.4.1 正态性检验
7.4.2 多重共线性检验
7.4.3 线性相关性检验
7.4.4 异常值检验python数据分析基础教程答案
7.4.5 独⽴性检验
7.4.6 ⽅差齐性检验
7.5 本章⼩结
7.6 课后练习
第8章 岭回归与LASSO回归模型
8.1 岭回归模型
8.1.1 参数求解
8.1.2 系数求解的⼏何意义
8.2 岭回归模型的应⽤——糖尿病病情预测(1)8.2.1 可视化⽅法确定λ值
8.2.2 交验证法确定λ值
8.2.3 模型的预测
8.3 LASSO回归模型——糖尿病病情预测(2)8.3.1 参数求解
8.3.2 系数求解的⼏何意义
8.4 LASSO回归模型的应⽤
8.4.1 可视化⽅法确定λ值
慕课网资源8.4.2 交验证法确定λ值
8.4.3 模型的预测
8.5 本章⼩结
8.6 课后练习
第9章 Logistic回归分类模型
9.1 Logistic模型的构建
9.1.1 Logistic模型的参数求解
9.1.2 Logistic模型的参数解释
9.2 分类模型的评估⽅法
9.2.1 混淆矩阵
9.2.2 ROC曲线
9.2.3 K-S曲线
9.3 Logistic回归模型的应⽤——运动状态的识别……
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论