📜  特定列 pandas 的 dropna - Python (1)

📅  最后修改于: 2023-12-03 15:40:49.837000             🧑  作者: Mango

特定列 pandas 的 dropna - Python

在 pandas 中, dropna 函数可以删除含有缺失值的数据。

举个例子,假设我们有如下数据集:

import pandas as pd

data = pd.DataFrame({
    'a': [1, 2, None, 4],
    'b': [5, None, 7, 8],
    'c': [9, 10, 11, 12]
})

其中包含了一些缺失值。我们可以使用 dropna 函数删除这些缺失值所在的行:

data_no_missing = data.dropna()

然而,这将删除所有有缺失值的行。有时候,我们只想删除缺失值出现在特定列的行。这时候,我们可以使用传递一个参数,指定要删除缺失值的列:

data_no_missing_b = data.dropna(subset=['b'])

这将只删除在 b 列中出现的缺失值。

完整代码:

import pandas as pd

data = pd.DataFrame({
    'a': [1, 2, None, 4],
    'b': [5, None, 7, 8],
    'c': [9, 10, 11, 12]
})

# 删除所有有缺失值的行
data_no_missing = data.dropna()

# 只删除在 b 列中出现的缺失值
data_no_missing_b = data.dropna(subset=['b'])

以上就是如何使用 dropna 函数删除特定列中的缺失值的方法了。