python dropna函数用法
Python中的dropna()函数是一种数据清洗的方法,用于删除数据集中包含缺失值的行或列。该函数可以应用于Pandas DataFrame和Series对象。
一、dropna()函数概述python index函数
1.1 函数语法
Pandas库中dropna()函数的语法如下:
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
其中:
- axis:指定要删除的轴。默认为0,表示删除行;如果为1,则表示删除列。
- how:指定删除缺失值所在行或列的条件。默认为'any',表示只要该行或列中有任意一个缺失值,就删除;如果设置为'all',则表示只有该行或列中所有值均为缺失值时才会被删除。
-
thresh:指定每行或每列至少需要有多少个非缺失值才不会被删除。默认为None,表示没有限制。
- subset:指定要检查缺失值的子集。可以是单个列名或多个列名组成的列表。
- inplace:指定是否在原始DataFrame上进行修改。默认为False,即生成一个新的DataFrame。
1.2 函数功能
dropna()函数主要用于处理数据集中存在缺失值(NaN)的情况。它可以根据用户需求来选择保留哪些数据以及如何保留数据。
二、使用示例
2.1 删除包含NaN值的行
下面是一个示例DataFrame:
```python
import pandas as pd
df = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, None, None, 8], 'C': [None, 10, 11, None]})
print(df)
```
输出结果为:
```
    A    B    C
0  1.0  5.0  NaN
1  2.0  NaN  10.0
2  NaN  NaN  11.0

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。