使⽤查询函数⾮常简单,只需要编写过滤条件。df.query('value_1 < value_2')
2.insert
3.Cumsum
groupby是什么函数数据帧包含3个不同组的年份值。我们可能只对某些情况下的累积值感兴趣。Pandas提供了⼀个易于使⽤的函数来计算累计和,即
4.Sample
Sample⽅法允许你从序列或数据帧中随机选择值。当我们想从⼀个分布中选择⼀个随机样本时,它很有⽤。
我们⽤n参数指定值的数⽬,但我们也可以将⽐率传递给frac参数。例如,0.5将返回⼀半的⾏。
为了获得可重复的样本,我们可以使⽤随机的状态参数。如果将整数值传递给random_state,则每次运⾏代码时都将⽣成相同的⽰例。“where”的⼯作⽅式是选择符合条件的值,其余值替换为指定值。
7.Loc and iloc
使⽤loc选择前3⾏和前2列:
注:当使⽤loc时,切⽚得到的结果包括索引的边界,⽽使⽤iloc则不包括这些边界。
8.Pct_change
9.Rank
10.Melt
Melt⽤于将宽数据帧转换为窄数据帧。我所说的wide是指具有⼤量列的数据帧。
我们有三个不同的城市,在不同的⽇⼦进⾏测量。我们决定将这些⽇⼦表⽰为列中的⾏。还将有⼀列显⽰测量值。我们可以通过使⽤Melt函数轻松实现:
默认情况下,会给出变量和值列名。我们可以使⽤melt函数的var_name和value_name参数来指定新的列名。
11.Explode
假设你的数据集在⼀个观测(⾏)中包含⼀个要素的多个条⽬,但你希望在单独的⾏中分析它们。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。