📜  如何在 pandas 中查找 nan 值的总数 - Python (1)

📅  最后修改于: 2023-12-03 15:38:22.433000             🧑  作者: Mango

如何在 pandas 中查找 nan 值的总数 - Python

在使用 pandas 进行数据处理和分析时,经常需要查询数据集中存在的缺失值(NaN)。本文将介绍如何使用 pandas 查找数据集中的 NaN 值的总数。

方法一:使用 isnull 函数

使用 pandas 的 isnull 函数可以找到数据集中的 NaN 值。该函数会返回一个由 True 和 False 组成的布尔型 DataFrame,其中 NaN 值对应的位置为 True。对这个 DataFrame 进行求和操作即可得到 NaN 值的总数。以下是示例代码:

import pandas as pd

data = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, None, 7, 8]})
nan_count = data.isnull().sum().sum()

print(nan_count)

输出:

2

在上面的代码中,我们首先创建一个包含 NaN 值的 DataFrame,然后使用 isnull 函数找到 NaN 值对应的位置,并返回一个由 True 和 False 组成的 DataFrame。最后使用 sum 函数对 DataFrame 进行求和,得到 NaN 值的总数。在本例中,DataFrame 中共有 2 个 NaN 值。

方法二:使用 numpy 的 isnan 函数

另外一种查找数据集中,NaN 值的方式是使用 numpy 库的 isnan 函数。该函数会返回一个由 True 和 False 组成的布尔型数组,其中 NaN 值对应的位置为 True。对这个数组进行求和操作即可得到 NaN 值的总数。

以下是示例代码:

import numpy as np
import pandas as pd

data = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, None, 7, 8]})
nan_count = np.isnan(data).sum()

print(nan_count)

输出:

2

在上面的代码中,我们首先创建一个包含 NaN 值的 DataFrame,然后使用 numpy 库的 isnan 函数找到 NaN 值对应的位置,并返回一个由 True 和 False 组成的布尔型数组。最后使用 sum 函数对数组进行求和,得到 NaN 值的总数。在本例中,DataFrame 中共有 2 个 NaN 值。

结论

在本文中,我们介绍了两种使用 pandas 查找数据集中 NaN 值的方法,分别是 isnull 函数和 numpy 库的 isnan 函数。这些方法可以帮助我们更好地处理和分析数据集中的缺失值。