📌  相关文章
📜  在 Pandas DataFrame 中用零替换 NaN 值(1)

📅  最后修改于: 2023-12-03 15:07:45.185000             🧑  作者: Mango

在 Pandas DataFrame 中用零替换 NaN 值

在 Pandas 中,有时候我们需要用一个标量(比如零)来替换 DataFrame 中的 NaN 值。这在数据清洗和数据预处理时很常见。

以下是一个示例 DataFrame:

| Name | Age | City | | ----------- | ----- | -------- | | Alice | 27 | NaN | | Bob | 42 | New York | | Charlie | NaN | Toronto | | Dave | 31 | NaN | | Eve | 25 | Paris |

我们想用零替换所有 NaN 值。下面是代码示例:

import pandas as pd

# 创建 DataFrame
df = pd.DataFrame({
    'Name': ['Alice', 'Bob', 'Charlie', 'Dave', 'Eve'],
    'Age': [27, 42, pd.np.nan, 31, 25],
    'City': [pd.np.nan, 'New York', 'Toronto', pd.np.nan, 'Paris']
})

# 用零替换所有 NaN 值
df = df.fillna(0)

# 输出 DataFrame
print(df)

代码输出:

       Name   Age      City
0     Alice  27.0         0
1       Bob  42.0  New York
2   Charlie   0.0   Toronto
3      Dave  31.0         0
4       Eve  25.0     Paris

在上述代码中,我们使用了 Pandas 的 fillna() 函数。该函数可以用指定的值(这里是零)替换 DataFrame 中的 NaN 值。

需要注意的是,在 DataFrame 中使用零替换 NaN 值可能导致数据不准确。因此,在具体情况下,我们应该根据实际需要进行决策。