pandas isnull用法
阯das是Python中一个强大的数据分析库,其提供了许多方便易用的数据操作工具。其中,isnull是其中一个非常重要的函数,本文将详细介绍isnull函数的用法。
一、isnull函数的定义
isnull函数是Pandas中一个用于检查数据中缺失值的函数,其可以用于Series和DataFrame类型的数据。其返回的结果是一个布尔类型的Series或DataFrame,其中缺失值对应的位置为True,非缺失值对应的位置为False。
二、isnull函数的用法
1. Series类型数据的isnull函数
当我们需要检查一个Series类型数据中是否存在缺失值时,可以使用该Series的isnull函数。例如,我们有一个Series数据如下:
```
import pandas as pd
import numpy as np
s = pd.Series([1, 2, np.nan, 4, np.nan])
```
其中,np.nan表示缺失值。我们可以使用s.isnull()函数来检查s中是否存在缺失值:
```
s.isnull()
isnull的用法 ```
运行结果如下:
```
0 False
1 False
2 True
3 False
4 True
dtype: bool
```
可以看到,返回的结果是一个布尔类型的Series,其中第3个和第5个位置对应的值为True,表示s中存在缺失值。
2. DataFrame类型数据的isnull函数
对于DataFrame类型数据,我们同样可以使用isnull函数来检查其中是否存在缺失值。例如,我们有一个DataFrame数据如下:
```
df = pd.DataFrame({'A': [1, np.nan, 3], 'B': [4, 5, np.nan], 'C': [np.nan, 7, 8]})
```
其中,列A、B、C中分别存在缺失值。我们可以使用df.isnull()函数来检查df中是否存在缺失值:
```
df.isnull()
```
运行结果如下:
```
A B C
0 False False True
1 True False False
2 False True False
```
可以看到,返回的结果是一个布尔类型的DataFrame,其中每个位置对应的值表示该位置是否为缺失值。例如,第1行第3列对应的值为True,表示df中第1行第3列位置为缺失值。
三、isnull函数的应用
isnull函数在数据分析中应用广泛,下面介绍一些常用的应用场景。
1. 缺失值的统计
我们可以使用isnull函数来统计数据中缺失值的数量。例如,我们有一个DataFrame数据如下:
```
df = pd.DataFrame({'A': [1, np.nan, 3], 'B': [4, 5, np.nan], 'C': [np.nan, 7, 8]})
```
我们可以使用df.isnull().sum()函数来统计df中每列缺失值的数量:
```
df.isnull().sum()
```
运行结果如下:
```
A 1
B 1
C 1
dtype: int64
```
可以看到,返回的结果是一个Series,其中每个位置对应的值表示该列缺失值的数量。
2. 缺失值的填充
我们可以使用isnull函数来检查数据中的缺失值,并使用fillna函数来填充缺失值。例如,我们有一个DataFrame数据如下:
```
df = pd.DataFrame({'A': [1, np.nan, 3], 'B': [4, 5, np.nan], 'C': [np.nan, 7, 8]})
```
我们可以使用df.isnull()函数来检查df中的缺失值,并使用fillna函数来填充缺失值。例如,
我们将缺失值填充为0:
```
df.fillna(0)
```
运行结果如下:
```
A B C
0 1.0 4.0 0.0
1 0.0 5.0 7.0
2 3.0 0.0 8.0
```
可以看到,返回的结果是一个填充后的DataFrame,其中缺失值被填充为0。
3. 缺失值的删除
我们可以使用isnull函数来检查数据中的缺失值,并使用dropna函数来删除缺失值所在的行或列。例如,我们有一个DataFrame数据如下:
```
df = pd.DataFrame({'A': [1, np.nan, 3], 'B': [4, 5, np.nan], 'C': [np.nan, 7, 8]})
```
我们可以使用df.isnull()函数来检查df中的缺失值,并使用dropna函数来删除缺失值所在的行或列。例如,我们将删除所有包含缺失值的行:
```
df.dropna()
```
运行结果如下:
```
A B C
0 1.0 4.0 0.0
```
可以看到,返回的结果是一个删除缺失值后的DataFrame,其中只剩下了第1行。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论