python数据分析基础第⼆版pdf_Python数据分析基础PDF 内容简介:
想深⼊应⽤⼿中的数据?还是想在上千份⽂件上重复同样的分析过程?没有编程经验的⾮程序员们如何能在最短的时间内学会⽤当今炙⼿可热的Python语⾔进⾏数据分析?
来⾃Facebook的数据专家Clinton Brownley可以帮您解决上述问题。在他的这本书⾥,读者将能掌握基本Python编程⽅法,学会编写出处理电⼦表格和数据库中的数据的脚本,并了解使⽤Python模块来解析⽂件、分组数据和⽣成统计量的⽅法。
学习基础语法,创建并运⾏⾃⼰的Python脚本
读取和解析CSV⽂件
读取多个Excel⼯作表和⼯作簿
执⾏数据库操作
搜索特定记录、分组数据和解析⽂本⽂件
建⽴统计图并绘图
⽣成描述性统计量并估计回归模型和分类模型
在Windows和Mac环境下按计划⾃动运⾏脚本
作者简介:
Clinton W. Brownley
博⼠,Facebook数据科学家,负责⼤数据流⽔线、统计建模和数据可视化项⽬,并为⼤型基础设施建设提供数据驱动的决策建议。
资源⽬录:
前⾔ xi
第1章 Python 基础 1
1.1 创建 Python 脚本 1
1.2 运⾏ Python 脚本 3
1.3 与命令⾏进⾏交互的⼏项技巧 6
1.4 Python 语⾔基础要素 10
1.4.1 数值 10
1.4.2 字符串 12
1.4.3 正则表达式与模式匹配 16
1.4.4 ⽇期 19
1.4.5 列表 21
1.4.6 元组 26
1.4.7 字典 27
1.4.8 控制流 30
1.5 读取⽂本⽂件 35
1.5.1 创建⽂本⽂件 36
1.5.2 脚本和输⼊⽂件在同⼀位置 38
1.5.3 读取⽂件的新型语法 38
1.6 使⽤ glob 读取多个⽂本⽂件 39
1.7 写⼊⽂本⽂件 42
1.7.1 向 first_script.py 添加代码 42 1.7.2 写⼊ CSV ⽂件 45
1.8 print 语句 46
1.9 本章练习 47
第2章 CSV⽂件 48
2.1 基础 Python 与 pandas 50
2.1.1 读写 CSV ⽂件(第1 部分)50
nginx中文官方文档2.1.2 基本字符串分析是如何失败的 56
2.1.3 读写 CSV ⽂件(第2 部分)57
2.2 筛选特定的⾏ 58
2.2.1 ⾏中的值满⾜某个条件 59
2.2.2 ⾏中的值属于某个集合 60
2.2.3 ⾏中的值匹配于某个模式/ 正则表达式 62 2.3 选取特定的列 64
2.3.1 列索引值 64
2.3.2 列标题 65
2.4 选取连续的⾏ 67
2.5 添加标题⾏ 69
2.6 读取多个 CSV ⽂件 71
2.7 从多个⽂件中连接数据 75
2.8 计算每个⽂件中值的总和与均值 78
2.9 本章练习 81
第3章 Excel ⽂件 82
3.1 内省 Excel ⼯作簿 84
3.2 处理单个⼯作表 88
3.2.1 读写 Excel ⽂件 88
3.2.2 筛选特定⾏ 92
3.2.3 选取特定列 98
3.3 读取⼯作簿中的所有⼯作表 101
3.3.1 在所有⼯作表中筛选特定⾏ 102
3.3.2 在所有⼯作表中选取特定列 104
3.4 在 Excel ⼯作簿中读取⼀组⼯作表 106
3.5 处理多个⼯作簿 108
3.5.1 ⼯作表计数以及每个⼯作表中的⾏列计数 110
3.5.2 从多个⼯作簿中连接数据 111
3.5.3 为每个⼯作簿和⼯作表计算总数和均值 113
3.6 本章练习 117
第4章 数据库 118python入门教程2
4.1 Python 内置的 sqlite3 模块 119
4.1.1 向表中插⼊新记录 124
4.1.2 更新表中记录 128
4.2 MySQL 数据库 131
4.2.1 向表中插⼊新记录 135
4.2.2 查询⼀个表并将输出写⼊ CSV ⽂件 140
4.2.3 更新表中记录 142
4.3 本章练习 146
第5章 应⽤程序 147
5.1 在⼀个⼤⽂件集合中查⼀组项⽬ 147
5.2 为 CSV ⽂件中数据的任意数⽬分类计算统计量 158 5.3 为⽂本⽂件中数据的任意数⽬分类计算统计量 167 5.4 本章练习 174
第6章 图与图表 175
duration of6.1 matplotlib 175
6.1.1 条形图 175
6.1.2 直⽅图 177
6.1.3 折线图 178
6.1.4 散点图 180
6.1.5 箱线图 181
6.2 pandas 183
6.3 ggplot 184
6.4 seaborn 186
第7章 描述性统计与建模 192
7.1 数据集 192
7.1.1 葡萄酒质量 192
7.1.2 客户流失 193
7.2 葡萄酒质量 194
matlab手机版破解版
7.2.1 描述性统计 194
7.2.2 分组、直⽅图与 t 检验 195
7.2.3 成对变量之间的关系和相关性 196
7.2.4 使⽤最⼩⼆乘估计进⾏线性回归 198
7.2.5 系数解释 200
7.2.6 ⾃变量标准化 200
7.2.7 预测 202imgur app如何登录
7.3 客户流失 203
7.3.1 逻辑斯蒂回归 205
7.3.2 系数解释 207
7.3.3 预测 208
第8章 按计划⾃动运⾏脚本 209
8.1 任务计划程序(Windows 系统)209
8.2 cron ⼯具(macOS 系统和 Unix 系统)215
8.2.1 cron 表⽂件:⼀次性设置 216
8.2.2 向 cron 表⽂件中添加 cron 任务 216
第9章 从这⾥启航 220
9.1 更多的标准库模块和内置函数 221
9.1.1 Python 标准库(PSL):更多的标准模块 221 9.1.2 内置函数 222
9.2 Python 包索引(PyPI):更多的扩展模块 222 9.2.1 NumPy 223
9.2.2 SciPy 227
9.2.3 Scikit-Learn 230
9.2.4 更多的扩展包 232
9.3 更多的数据结构 232
9.3.1 栈 233
9.3.2 队列 233
9.3.3 图 233
9.3.4 树 234
9.4 从这⾥启航 234编程赚钱的方法
附录A 下载指南 236
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论