📌  相关文章
📜  在 Pandas DataFrame 中将文本列拆分为两列(1)

📅  最后修改于: 2023-12-03 15:37:25.432000             🧑  作者: Mango

在 Pandas DataFrame 中将文本列拆分为两列

在进行数据清洗和处理时,我们经常需要将文本数据拆分为多个子字段进行处理。在 Pandas DataFrame 中,我们可以使用 str.split() 方法将文本列拆分为多个子列。

下面我们来演示如何在 Pandas DataFrame 中将文本列拆分为两列。

假设我们有以下一个包含姓名和姓氏的数据框:

import pandas as pd

data = {
    'Name': ['Alice Smith', 'Bob Johnson', 'Charlie Brown'],
    'Age': [25, 30, 35]
}

df = pd.DataFrame(data)

我们想要将 Name 列拆分成 First NameLast Name 两列,我们可以使用 str.split() 方法将其拆分:

df[['First Name', 'Last Name']] = df['Name'].str.split(' ', expand=True)

此处我们使用 expand=True 参数将拆分结果扩展为多列返回。

完整的代码如下:

import pandas as pd

data = {
    'Name': ['Alice Smith', 'Bob Johnson', 'Charlie Brown'],
    'Age': [25, 30, 35]
}

df = pd.DataFrame(data)
df[['First Name', 'Last Name']] = df['Name'].str.split(' ', expand=True)
print(df)

输出结果如下:

            Name  Age First Name Last Name
0    Alice Smith   25      Alice     Smith
1    Bob Johnson   30        Bob   Johnson
2  Charlie Brown   35    Charlie     Brown

以上就是在 Pandas DataFrame 中将文本列拆分为两列的方法介绍。