📜  将“-”替换为数据框中的 nan - Python (1)

📅  最后修改于: 2023-12-03 15:25:15.778000             🧑  作者: Mango

将“-”替换为数据框中的 nan - Python

在 Python 中,经常会遇到数据框中包含“-”表示缺失值的情况,但是在进行数据处理和统计时,通常需要将其替换为 NaN(Not a Number)表示缺失值。下面介绍如何使用 pandas 库中的 DataFrame.replace() 方法实现将“-”替换为 NaN。

准备工作

首先需要导入 pandas 库和创建一个包含“-”的数据框。

import pandas as pd

# 创建示例数据框
df = pd.DataFrame({'A': [1, 2, '-', 4, 5], 
                   'B': [6, '-', 8, 9, 10], 
                   'C': ['-', '-', '-', '-', '-']})

输出的数据框如下:

   A   B  C
0  1   6  -
1  2   -  -
2  -   8  -
3  4   9  -
4  5  10  -
将“-”替换为 NaN

使用 DataFrame.replace() 方法将“-”替换为 NaN。

df.replace('-', pd.np.nan, inplace=True)

代码中,第一个参数为要替换的字符串(即“-”),第二个参数为替换后的值(即 NaN)。

由于要对原数据框进行替换,所以需要将 inplace 参数设为 True。

最终得到的数据框如下:

     A     B   C
0    1.0   6.0 NaN
1    2.0   NaN NaN
2    NaN   8.0 NaN
3    4.0   9.0 NaN
4    5.0  10.0 NaN
总结

使用 DataFrame.replace() 方法可以方便地将数据框中的“-”替换为 NaN,使得数据处理和统计更加方便和准确。