数据分析python常⽤的类库
数据分析python常⽤的类库
1.IPython——科学计算标准⼯具集的组成部分
(1)是⼀个增强Python shell,⽬的是提⾼编写,测试,调试python的速度
(2)主要⽤于交互式数据并⾏处理,是分布式计算的基础架构
(3) 提供了⼀个类似于Mathematica的HTML笔记本,⼀个基于Qt框架的GUI控制台,具有绘图、多⾏编辑以及语法⾼亮。
2.Numpy数据分析——科学计算的基础包
(1)快速⾼效多维的数组对象ndarray
(2)对数组执⾏元素级的计算以及直接对数组执⾏数学运算的函数
(3)读写硬盘上基于数组的数据集的⼯具
(4)线性代数运算,傅⾥叶变换,以及随机数⽣成
(5)将C、C++、Fortran代码集成到python
3.scipy——专门解决科学计算中各种标准问题域的模块的集合
SciPy 主要包含了 8 个模块,不同的⼦模块有不同的应⽤,如插值、积分、优化、图像处理和特殊函数等。
scipy.integrate 数值积分例程和微分⽅程求解器
scipy.linalg 扩展了由 numpy.linalg 提供的线性代数例程和矩阵分解功能
scipy.optimize 函数优化器(最⼩化器)以及根查算法
scipy.signal 信号处理⼯具
scipy.sparse 稀疏矩阵和稀疏线性系统求解器
scipy.special SPECFUN(这是⼀个实现了许多常⽤数学函数的 Fortran 库)的包装器
scipy.stats 检验连续和离散概率分布、各种统计检验⽅法,以及更好的描述统计法
scipy.weave 利⽤内联 C++代码加速数组计算的⼯具
4. Pandas——数据分析核⼼库
提供了⼀系列能够快速、便捷地处理结构化数据的数据结构和函数。
⾼性能的数组计算功能以及电⼦表格和关系型数据库(如 SQL)灵活的数据处理功能。
复杂精细的索引功能,以便便捷地完成重塑、切⽚和切块、聚合及选取数据⼦集等操作。
5.Matplotlib——绘制数据图表的python库
Python的2D绘图库,⾮常适合创建出版物上⽤的图表。
操作⽐较容易,只需⼏⾏代码即可⽣成直⽅图、功率谱图、条形图、错误图和散点图等图形。
提供了pylab的模块,其中包括了NumPy和pyplot中许多常⽤的函数,⽅便⽤户快速进⾏计算和绘图。
交互式的数据绘图环境,绘制的图表也是交互式的
6.Scikit-learn ——数据挖掘和数据分析⼯具
简单有效,可以供⽤户在各种环境下重复使⽤。
封装了⼀些常⽤的算法⽅法。
基本模块主要有数据预处理、模型选择、分类、聚类、数据降维和回归 6 个,在数据量不⼤的情况下,scikit-learn可以解决⼤部分问题。
7.Spyder——交互式python语⾔开发环境
提供⾼级的代码编辑、交互测试和调试等特性。
包含数值计算环境。
可⽤于将调试控制台直接集成到图形⽤户界⾯的布局中。
模仿MATLAB的“⼯作空间”,可以很⽅便地观察和修改数组的值。spyder python下载

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。