pandas每一列画图_别了,这是Pandas最详细教程了~--688IT编程网

pandas每⼀列画图_别了，这是Pandas最详细教程了~来源：机器之⼼

Python 是开源的，它很棒，但是也⽆法避免开源的⼀些固有问题：很多包都在做(或者在尝试做)同样的事情。如果你是 Python 新⼿，那么你很难知道某个特定任务的最佳包是哪个，你需要有经验的⼈告诉你。有⼀个⽤于数据科学的包绝对是必需的，它就是 pandas。

pandas 最有趣的地⽅在于⾥⾯隐藏了很多包。它是⼀个核⼼包，⾥⾯有很多其他包的功能。这点很棒，因为你只需要使⽤ pandas 就可以完成⼯作。

pandas 相当于 python 中 excel：它使⽤表(也就是 dataframe)，能在数据上做各种变换，但还有其他很多功能。

如果你早已熟知 python 的使⽤，可以直接跳到第三段。

让我们开始吧!

pandas 最基本的功能

读取数据

data = pd.read_csv( my_file.csv )

data = pd.read_csv( my_file.csv , sep= ; , encoding= latin-1 , nrows=1000, skiprows=[2,5])

sep 代表的是分隔符。如果你在使⽤法语数据，excel 中 csv 分隔符是「;」，因此你需要显式地指定它。编码设置为 latin-1 来读取法语字符。nrows=1000 表⽰读取前 1000 ⾏数据。skiprows=[2,5] 表⽰你在读取⽂件的时候会移除第 2 ⾏和第 5 ⾏。

最常⽤的功能：read_csv, read_excel

其他⼀些很棒的功能：read_clipboard, read_sql

写数据

<_csv( my_new_file.csv , index=None)

index=None 表⽰将会以数据本来的样⼦写⼊。如果没有写 index=None，你会多出⼀个第⼀列，内容是 1，2，3，...，⼀直到最后⼀⾏。

我通常不会去使⽤其他的函数，像.to_excel, .to_json, .to_pickle 等等，因为.to_csv 就能很好地完成⼯作，并且 csv 是最常⽤的表格保存⽅式。

检查数据

image

Gives (#rows, #columns)

给出⾏数和列数

data.describe()

计算基本的统计数据

查看数据

data.head(3)

打印出数据的前 3 ⾏。与之类似，.tail() 对应的是数据的最后⼀⾏。

data.loc[8]

打印出第⼋⾏

data.loc[8, column_1 ]

打印第⼋⾏名为「column_1」的列

data.loc[range(4,6)]

第四到第六⾏(左闭右开)的数据⼦集

pandas 的基本函数

逻辑运算

data[data[ column_1 ]== french ]

data[(data[ column_1 ]== french ) & (data[ year_born ]==1990)]

data[(data[ column_1 ]== french ) & (data[ year_born ]==1990) & ~(data[ city ]== London )]

通过逻辑运算来取数据⼦集。要使⽤ & (AND)、 ~ (NOT) 和 | (OR)，必须在逻辑运算前后加上「and」。data[data[ column_1 ].isin([ french , english ])]

除了可以在同⼀列使⽤多个 OR，你还可以使⽤.isin() 函数。

基本绘图

matplotlib 包使得这项功能成为可能。正如我们在介绍中所说，它可以直接在 pandas 中使⽤。

data[ column_numerical ].plot()

image

().plot() 输出的⽰例

data[ column_numerical ].hist()

画出数据分布(直⽅图)

image

.hist() 输出的⽰例

%matplotlib inline

如果你在使⽤ Jupyter，不要忘记在画图之前加上以上代码。

更新数据

data.loc[8, column_1 ] = english

将第⼋⾏名为 column_1 的列替换为「english」

data.loc[data[ column_1 ]== french , column_1 ] = French

在⼀⾏代码中改变多列的值

好了，现在你可以做⼀些在 excel 中可以轻松访问的事情了。下⾯让我们深⼊研究 excel 中⽆法实现的⼀些令⼈惊奇的操作吧。中级函数python怎么读取excel某一列

统计出现的次数

data[ column_1 ].value_counts()

image

.value_counts() 函数输出⽰例

在所有的⾏、列或者全数据上进⾏操作

data[ column_1 ].map(len)

len() 函数被应⽤在了「column_1」列中的每⼀个元素上

.map() 运算给⼀列中的每⼀个元素应⽤⼀个函数

data[ column_1 ].map(len).map(lambda x: x/100).plot()

data.apply(sum)

.apply() 会给⼀个列应⽤⼀个函数。

.applymap() 会给表 (DataFrame) 中的所有单元应⽤⼀个函数。

tqdm, 唯⼀的

在处理⼤规模数据集时，pandas 会花费⼀些时间来进⾏.map()、.apply()、.applymap() 等操作。tqdm 是⼀个可以⽤来帮助预测这些操作的执⾏何时完成的包(是的，我说谎了，我之前说我们只会使⽤到 pandas)。

from tqdm import tqdm_notebook

tqdm_notebook().pandas()

⽤ pandas 设置 tqdm

data[ column_1 ].progress_map(lambda x: x.count( e ))

⽤ .progress_map() 代替.map()、.apply() 和.applymap() 也是类似的。

image

在 Jupyter 中使⽤ tqdm 和 pandas 得到的进度条

688IT编程网

pandas每一列画图_别了,这是Pandas最详细教程了~

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

pandas每一列画图_别了,这是Pandas最详细教程了~

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式