📌  相关文章
📜  pandas 列字符串前 n 个字符 - Python (1)

📅  最后修改于: 2023-12-03 15:18:14.538000             🧑  作者: Mango

pandas 列字符串前 n 个字符 - Python

在处理数据时,有时需要对字符串类型的列截取前面的几个字符。这时可以使用 pandas 中的 str 方法,对字符串列进行操作。下面介绍如何使用 pandas 截取列字符串的前 n 个字符。

首先,我们先使用 pandas 读取一个包含字符串名字的数据集:

import pandas as pd

data = {
    "name": ["Alice", "Bob", "Carol", "David", "Eric"],
    "age": [25, 32, 18, 47, 53],
    "score": [80, 92, 70, 88, 79]
}

df = pd.DataFrame(data)

现在,我们有一个包含名字、年龄和分数的 DataFrame,现在我们要截取名字列的前三个字符。

df['name'].str[:3]

上述代码中的 .str 方法将名字列转换为字符串类型,并使用字符串切片操作截取前三个字符。输出结果为:

0    Ali
1    Bob
2    Car
3    Dav
4    Eri
Name: name, dtype: object

可以看到,所有名字的前三个字符都被截取出来了。如果想截取更多的字符,只需要将切片操作中的数字改为对应的字符数即可。

此外,还可以在 .str 方法中使用 slice 函数来进行截取,例如截取名字列的前两个字符:

df['name'].str.slice(stop=2)

输出结果为:

0    Al
1    Bo
2    Ca
3    Da
4    Er
Name: name, dtype: object

以上就是使用 pandas 截取列字符串前 n 个字符的方法。