📜  如何在 Pandas 中操作字符串?(1)

📅  最后修改于: 2023-12-03 14:52:28.186000             🧑  作者: Mango

在 Pandas 中如何操作字符串?

Pandas 是一个非常流行的数据分析库,它包含了许多方便的字符串处理功能。在本文中,我们将介绍如何在 Pandas 中进行字符串操作。

导入 Pandas

在进行字符串操作之前,我们需要先导入 Pandas 库:

import pandas as pd
创建示例数据

为了演示字符串操作,我们首先需要创建一些示例数据。我们可以使用 Pandas 的 DataFrame 对象来创建数据。

data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
        'age': [25, 32, 18, 47, 22],
        'city': ['New York', 'Paris', 'London', 'Tokyo', 'Sydney']}
df = pd.DataFrame(data)

这将创建一个包含五个人的 DataFrame,每个人都有一个名字、一个年龄和所在的城市。

获取字符串长度

使用 Pandas,我们可以轻松地获取字符串的长度。例如,我们可以获取 DataFrame 中每个人名字的长度:

df['name_length'] = df['name'].str.len()

这将创建一个新的列(name_length),其中包含每个人名字的长度。

转换为大写或小写

我们可以使用 Pandas 将字符串转换为大写或小写。例如,我们可以将 DataFrame 中每个人所在城市的名称转换为大写:

df['upper_city'] = df['city'].str.upper()

这将创建一个新的列(upper_city),其中包含每个城市名称的大写形式。

使用正则表达式

使用 Pandas,我们可以使用正则表达式来匹配字符串。例如,我们可以使用正则表达式匹配所有以字母“A”开头的名字:

df[df['name'].str.match('^A')]

这将返回一个 DataFrame,其中所有名字以字母“A”开头。

连接字符串

使用 Pandas,我们可以轻松地连接字符串。例如,我们可以将每个人的名字和所在城市连接成一个字符串:

df['name_city'] = df['name'] + ', ' + df['city']

这将创建一个新的列(name_city),其中包含每个人的名字和所在城市。

分割字符串

我们可以使用 Pandas 分割字符串。例如,我们可以分割每个人的名字,然后将它们分成姓和名两个部分:

df[['first', 'last']] = df['name'].str.split(expand=True)

这将创建两个新的列(first 和 last),其中包含每个人名字的第一个和最后一个单词。

替换字符串

使用 Pandas,我们可以轻松地替换字符串。例如,我们可以将 DataFrame 中每个人所在城市中的“o”替换为“*”:

df['city_replace'] = df['city'].str.replace('o', '*')

这将创建一个新的列(city_replace),其中包含每个城市名称的替换形式。

Conclusion

在 Pandas 中进行字符串处理非常容易。我们可以轻松地获取字符串长度、转换大小写、使用正则表达式、连接字符串、分割字符串和替换字符串。这些功能可以帮助我们快速地对数据进行处理,让我们的工作变得更加轻松和有效。