📜  pandas count number 缺失值 - Python (1)

📅  最后修改于: 2023-12-03 14:45:02.319000             🧑  作者: Mango

Python中使用Pandas计算缺失值的数量

在数据分析应用程序中,处理缺失值是一个常见的任务。 Pandas是一个流行的自由开源Python库,它提供了一系列的数据结构和数据分析工具,其中包括一些函数来计算数据框架中缺失值的数量,使得缺失值的处理变得更加容易和高效。

计算缺失值的数量

Pandas提供了三个函数来计算数据帧中缺失值的数量:

  • isnull(): 在DataFrame上返回布尔值,以指示哪些元素为缺失值。
  • isna(): 在DataFrame上返回布尔值,以指示哪些元素为缺失值。
  • sum(): 在DataFrame上的每列计算缺失值的总数。

以下是一个例子,说明如何使用这些函数来计算DataFrame中缺失值的数量:

import pandas as pd

# 创建一个包含缺失值的数据帧
df = pd.DataFrame({
    'A': [1, 2, None, 4],
    'B': [5, None, 7, 8],
    'C': [None, 10, 11, 12]
})

# 计算缺失值的数量
print('isnull():')
print(df.isnull().sum())

print('\nisna():')
print(df.isna().sum())

输出将会是:

isnull():
A    1
B    1
C    2
dtype: int64

isna():
A    1
B    1
C    2
dtype: int64

另外,你还可以使用 count() 函数计算每列中的非缺失值的数量,例如:

print('count():')
print(df.count())

输出:

count():
A    3
B    3
C    2
dtype: int64
总结

在Pandas中计算缺失值的数量是一项简单但经常使用的任务。可以使用 isnull()isna() 函数来测试DataFrame中的每个元素是否为缺失值,使用 sum() 函数来计算每列中缺失值的数量,使用 count() 函数来计算每列中的非缺失值的数量。这些函数可以极大地简化处理缺失值的Python代码的编写。