📅  最后修改于: 2023-12-03 15:33:24.377000             🧑  作者: Mango
如果您的数据集中有只包含空格的值,您可以使用 Pandas 将其替换为 null。以下是实现的步骤。
import pandas as pd
df = pd.read_csv('your_dataset.csv')
df.replace(' ', pd.np.nan, inplace=True)
df.to_csv('your_modified_dataset.csv', index=False)
以下是一个使用示例:
import pandas as pd
# 创建包含空格的数据集
data = {'name': ['John', 'Amy', ' ', 'Bob', ' '],
'age': [25, 27, 30, 22, 35]}
df = pd.DataFrame(data)
# 替换空格为 null
df.replace(' ', pd.np.nan, inplace=True)
# 显示更改后的数据集
print(df)
输出:
name age
0 John 25
1 Amy 27
2 NaN 30
3 Bob 22
4 NaN 35
通过使用 replace
函数和 pd.np.nan
,您可以将仅包含空格的值替换为 null。这可以帮助您更好地处理您的数据并避免出现错误。