pandas常见聚合方法
Pandas 是一个强大的 Python 数据分析库,提供了许多用于数据聚合和分析的函数。以下是一些常见的 Pandas 聚合方法:
1. sum(): 计算一列或一组数值列的总和。
```python
df['column_name'].sum()
```
2. mean(): 计算一列或一组数值列的平均值。
```python
df['column_name'].mean()
```
3. min() 和 max(): 分别计算一列或一组数值列的最小值和最大值。
```python
df['column_name'].min()
df['column_name'].max()
```
4. std() 和 var(): 分别计算一列或一组数值列的标准差和方差。
```python
df['column_name'].std()
df['column_name'].var()
```
5. count(): 计算非空值的数量。对于数值列,这相当于求和;对于分类列,这计算每个唯一值的出现次数。
```python
df['column_name'].count()
```
6. first() 和 last(): 返回序列的第一个和最后一个元素。如果应用于 DataFrame,则返回每列的第一个和最后一个元素。
7. describe(): 计算数值列的描述性统计,包括计数、平均值、标准差、最小值、四分位数和最大值。对于分类变量,它计算每个唯一值的出现次数。
8. nunique(): 返回一列中唯一值的数量。对于 DataFrame,它返回每列中唯一值的数量。
9. merge(), join() 和 concat(): 这些方法用于根据一个或多个键将不同的 DataFrame 组合在一起。
10. groupby(): 根据一个或多个键对数据进行分组,然后对每个组应用一个聚合函数。这是数据聚合的核心方法。
11. pivot_table(): 根据一个或多个键创建透视表。与 groupby 结合使用,可以根据键对数据进行分组并应用聚合函数,然后使用 pivot_table 将结果转换回表格格式。
12. resample(): 对时间序列数据进行重采样,例如将日数据转换为月数据。可以应用聚合函数,如 sum、mean、max 等。merge函数
13. rolling(): 对数据应用窗口函数,例如移动平均、移动方差等。可以在固定窗口上应用函数,也可以在滚动窗口上应用函数。
14. apply(): 对 DataFrame 的行或列应用自定义函数。这是最灵活的聚合方法,可以用于应用几乎任何函数到 DataFrame 的行或列上。
这只是 Pandas 中可用的聚合方法的一小部分。Pandas 的功能非常强大,提供了许多其他方法和功能来处理和分析数据。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。