基于python的⼤数据分析基础及实战pdf-基于Python的⼤数据
分析基础及实战
第1部分  基  础  篇
第1章
Python语⾔基础    /2
1.0  引⼦    /2
1.1  ⼯欲善其事,必先利其器(安装Python)    /3
1.2  学跑得先学⾛(语法基础)    /9
1.3  程序结构    /11
1.3.1  Hello World !    /11
1.3.2  运算符介绍    /12
1.3.3  顺序结构    /14
1.3.4  判断结构    /17
1.3.5  循环结构    /18
1.3.6  异常    /20
1.4  函数    /24
1.4.1  基本函数结构    /24
1.4.2  参数结构    /25
1.4.3  回调函数    /28
1.4.4  函数的递归与嵌套    /28
1.4.5  闭包    /31
1.4.6  匿名函数lambda    /32
1.4.7  关键字yield    /32
1.5  数据结构    /35
1.5.1  列表(list)    /35
1.5.2  元组(tuple)    /38
1.5.3  集合(set)    /39
1.5.4  字典(dict)    /40
1.5.5  集合的操作    /41
1.5.6  学以致⽤    /45
1.6  3个函数(map、filter、reduce)    /47
1.6.1  遍历函数(map)    /47
1.6.2  筛选函数(filter)    /48
1.6.3  累计函数(reduce)    /48 1.7  ⾯向对象编程基础    /50
1.7.1  类    /50
1.7.2  类和实例    /51
1.7.3  数据封装    /52
1.7.4  私有变量与私有⽅法    /53本章⼩结    /54
第2章
数据处理    /60
2.1  Anaconda简介    /60
2.2  Numpy简介    /66
2.3  关于Pandas    /68
2.3.1  什么是Pandas    /68
2.3.2  Pandas中的数据结构    /68 2.4  数据准备    /68
2.4.1  数据类型    /68
2.4.2  数据结构    /69
2.4.3  数据导⼊    /79
2.4.4  数据导出    /86
2.5  数据处理    /88
2.5.1  数据清洗    /89
2.5.2  数据抽取    /97
2.5.3  插⼊记录    /114
2.5.4  修改记录    /117
2.5.5  交换⾏或列    /120
2.5.6  排名索引    /122
2.5.7  数据合并    /131
2.5.8  数据计算    /137
2.5.9  数据分组    /141
2.5.10  ⽇期处理    /143
带你飞(数据处理案例)    /148
本章⼩结    /160
第3章
数据分析    /165
3.1  基本统计分析    /165
3.2  分组分析    /169
3.3  分布分析    /171
3.4  交叉分析    /173
3.5  结构分析    /174
3.6  相关分析    /176
⼩试⽜⼑(相关分析案例:电商数据分析)    /178本章⼩结    /180
第4章
数据可视化    /181
4.1  使⽤Python对数据进⾏可视化处理    /181 4.1.1  准备⼯作    /181
python大数据就业前景4.1.2  Matplotlib绘图⽰例    /186
4.1.3  Seabon中的图例    /198
4.1.4  pandas的⼀些可视化功能    /212
4.1.5  ⽂本数据可视化    /217
4.1.6  networkx⽹络图    /218
4.1.7  folium绘制地图    /220
4.2  Python图像处理基础    /221
4.2.1  PIL图库    /221
4.2.2  OpenCV图库    /224
本章⼩结    /226
第5章
字符串处理与⽹络爬⾍    /228
5.1  字符串处理    /228
5.1.1  字符串处理函数    /228
5.1.2  正则表达式    /230
5.1.3  编码处理    /237
5.2  ⽹络爬⾍    /240
5.2.1  获取⽹页源码    /240
5.2.2  从源码中提取信息    /241
5.2.3  数据存储    /246
5.2.4  ⽹络爬⾍从这⾥开始    /248
本章⼩结    /260
第2部分  实战案例篇
第6章
词云    /262
6.1  安装⽂件包    /263
6.2  jieba功能⽤法    /264
6.2.1  cut⽤法    /264
6.2.2  词频与分词字典    /265
6.3  ⽂本词云图    /269
6.4  背景轮廓词云图的制作    /271
6.4.1  数据准备    /271
6.4.2  分词    /272
6.4.3  构建词云    /273
本章⼩结    /278
第7章
航空客户分类    /279
7.1  问题的提出    /279
7.2  聚类分析相关概念    /280
7.3  模型的建⽴    /281
7.4  Python实现代码    /281
7.5  分类结果展⽰与分析    /284
本章⼩结    /287
第8章
《红楼梦》⽂本分析    /288
8.1  准备⼯作    /289
8.2  分词    /291
8.2.1  读取数据    /291
8.2.2  数据预处理    /293
8.2.3  对红楼梦进⾏分词    /301
8.2.4  制作词云    /303
8.3  ⽂本聚类分析    /312
8.3.1  构建分词TF-IDF矩阵    /312
8.3.2  使⽤TF-IDF矩阵对章节进⾏聚类    /314 8.4  LDA主题模型    /322
8.5  ⼈物社交⽹络分析    /328
本章⼩结    /334
第3部分  拓展与延伸
第9章
Python字符串格式化    /336
9.1  使⽤%符号进⾏格式化    /336
9.2  使⽤format()⽅法进⾏格式化    /339
9.3  使⽤f⽅法进⾏格式化    /341
本章⼩结    /342
第10章
在Python中操作MySQL数据库    /343
10.1  对MySQL的连接与访问    /344
10.2  对MySQL的增、删、改、查操作    /345 10.2.1  查询操作    /345
10.2.2  插⼊操作    /346
10.2.3  更新操作    /347
10.2.4  删除操作    /347
10.3  创建数据库表    /348
本章⼩结    /349
第11章
fractal(分形)库的发布    /350
11.1  ⽤Python绘制分形    /351
11.1.1  分形简介    /351
11.1.2  先睹为快    /351
11.1.3  绘制⽅法简介    /352
11.2  第三⽅库发布到PyPi    /364
本章⼩结    /369
参考⽂献    /370
^ 收 起

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。