📜  数据框列包含字符串 - Python (1)

📅  最后修改于: 2023-12-03 15:39:59.632000             🧑  作者: Mango

数据框列包含字符串 - Python

在进行数据分析时,我们常常需要对数据框中的字符串进行操作和处理。本文将介绍如何在 Python 中操作数据框列包含字符串的情况。

导入数据框

我们首先需要导入需要处理的数据框。以导入一个名为 df 的数据框为例:

import pandas as pd

df = pd.read_csv('data.csv')
查看列包含字符串

使用 dtypes 方法可以查看数据框中每列的数据类型,包括字符串类型。我们可以通过以下代码查看数据框中包含字符串类型的列:

str_columns = df.select_dtypes(include=['object']).columns
print(str_columns)

该代码将打印出所有包含字符串的列的列名。

字符串操作

对于包含字符串的列,我们通常会对其进行一些操作,比如字符串拼接、替换、截取等。

下面是几个常用的操作示例:

字符串拼接

使用 + 运算符将两个字符串拼接成一个字符串,以 df 数据框中的 nameage 列为例:

df['name_age'] = df['name'] + '_' + df['age'].astype(str)
字符串替换

使用 str.replace() 方法进行字符串替换,以 df 数据框中的 name 列为例,将 A 替换成 B

df['name'] = df['name'].str.replace('A', 'B')
字符串截取

使用 str.slice() 方法进行字符串截取,以 df 数据框中的 phone 列为例,截取前三位:

df['phone_prefix'] = df['phone'].str.slice(0, 3)

以上就是对于数据框列包含字符串在 Python 中的操作介绍。

参考资料