基于python的⼤数据分析基础及实战pdf-基于Python的⼤数据
分析基础及实战
第1部分 基 础 篇
第1章
Python语⾔基础 /2
1.0 引⼦ /2
1.1 ⼯欲善其事,必先利其器(安装Python) /3
1.2 学跑得先学⾛(语法基础) /9
1.3 程序结构 /11
1.3.1 Hello World ! /11
1.3.2 运算符介绍 /12
1.3.3 顺序结构 /14
1.3.4 判断结构 /17
1.3.5 循环结构 /18
1.3.6 异常 /20
1.4 函数 /24
1.4.1 基本函数结构 /24
1.4.2 参数结构 /25
1.4.3 回调函数 /28
1.4.4 函数的递归与嵌套 /28
1.4.5 闭包 /31
1.4.6 匿名函数lambda /32
1.4.7 关键字yield /32
1.5 数据结构 /35
1.5.1 列表(list) /35
1.5.2 元组(tuple) /38
1.5.3 集合(set) /39
1.5.4 字典(dict) /40
1.5.5 集合的操作 /41
1.5.6 学以致⽤ /45
1.6 3个函数(map、filter、reduce) /47
1.6.1 遍历函数(map) /47
1.6.2 筛选函数(filter) /48
1.6.3 累计函数(reduce) /48 1.7 ⾯向对象编程基础 /50
1.7.1 类 /50
1.7.2 类和实例 /51
1.7.3 数据封装 /52
1.7.4 私有变量与私有⽅法 /53本章⼩结 /54
第2章
数据处理 /60
2.1 Anaconda简介 /60
2.2 Numpy简介 /66
2.3 关于Pandas /68
2.3.1 什么是Pandas /68
2.3.2 Pandas中的数据结构 /68 2.4 数据准备 /68
2.4.1 数据类型 /68
2.4.2 数据结构 /69
2.4.3 数据导⼊ /79
2.4.4 数据导出 /86
2.5 数据处理 /88
2.5.1 数据清洗 /89
2.5.2 数据抽取 /97
2.5.3 插⼊记录 /114
2.5.4 修改记录 /117
2.5.5 交换⾏或列 /120
2.5.6 排名索引 /122
2.5.7 数据合并 /131
2.5.8 数据计算 /137
2.5.9 数据分组 /141
2.5.10 ⽇期处理 /143
带你飞(数据处理案例) /148
本章⼩结 /160
第3章
数据分析 /165
3.1 基本统计分析 /165
3.2 分组分析 /169
3.3 分布分析 /171
3.4 交叉分析 /173
3.5 结构分析 /174
3.6 相关分析 /176
⼩试⽜⼑(相关分析案例:电商数据分析) /178本章⼩结 /180
第4章
数据可视化 /181
4.1 使⽤Python对数据进⾏可视化处理 /181 4.1.1 准备⼯作 /181
python大数据就业前景4.1.2 Matplotlib绘图⽰例 /186
4.1.3 Seabon中的图例 /198
4.1.4 pandas的⼀些可视化功能 /212
4.1.5 ⽂本数据可视化 /217
4.1.6 networkx⽹络图 /218
4.1.7 folium绘制地图 /220
4.2 Python图像处理基础 /221
4.2.1 PIL图库 /221
4.2.2 OpenCV图库 /224
本章⼩结 /226
第5章
字符串处理与⽹络爬⾍ /228
5.1 字符串处理 /228
5.1.1 字符串处理函数 /228
5.1.2 正则表达式 /230
5.1.3 编码处理 /237
5.2 ⽹络爬⾍ /240
5.2.1 获取⽹页源码 /240
5.2.2 从源码中提取信息 /241
5.2.3 数据存储 /246
5.2.4 ⽹络爬⾍从这⾥开始 /248
本章⼩结 /260
第2部分 实战案例篇
第6章
词云 /262
6.1 安装⽂件包 /263
6.2 jieba功能⽤法 /264
6.2.1 cut⽤法 /264
6.2.2 词频与分词字典 /265
6.3 ⽂本词云图 /269
6.4 背景轮廓词云图的制作 /271
6.4.1 数据准备 /271
6.4.2 分词 /272
6.4.3 构建词云 /273
本章⼩结 /278
第7章
航空客户分类 /279
7.1 问题的提出 /279
7.2 聚类分析相关概念 /280
7.3 模型的建⽴ /281
7.4 Python实现代码 /281
7.5 分类结果展⽰与分析 /284
本章⼩结 /287
第8章
《红楼梦》⽂本分析 /288
8.1 准备⼯作 /289
8.2 分词 /291
8.2.1 读取数据 /291
8.2.2 数据预处理 /293
8.2.3 对红楼梦进⾏分词 /301
8.2.4 制作词云 /303
8.3 ⽂本聚类分析 /312
8.3.1 构建分词TF-IDF矩阵 /312
8.3.2 使⽤TF-IDF矩阵对章节进⾏聚类 /314 8.4 LDA主题模型 /322
8.5 ⼈物社交⽹络分析 /328
本章⼩结 /334
第3部分 拓展与延伸
第9章
Python字符串格式化 /336
9.1 使⽤%符号进⾏格式化 /336
9.2 使⽤format()⽅法进⾏格式化 /339
9.3 使⽤f⽅法进⾏格式化 /341
本章⼩结 /342
第10章
在Python中操作MySQL数据库 /343
10.1 对MySQL的连接与访问 /344
10.2 对MySQL的增、删、改、查操作 /345 10.2.1 查询操作 /345
10.2.2 插⼊操作 /346
10.2.3 更新操作 /347
10.2.4 删除操作 /347
10.3 创建数据库表 /348
本章⼩结 /349
第11章
fractal(分形)库的发布 /350
11.1 ⽤Python绘制分形 /351
11.1.1 分形简介 /351
11.1.2 先睹为快 /351
11.1.3 绘制⽅法简介 /352
11.2 第三⽅库发布到PyPi /364
本章⼩结 /369
参考⽂献 /370
^ 收 起
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论