📜  在 pandas 中切片 - Python (1)

📅  最后修改于: 2023-12-03 14:51:03.635000             🧑  作者: Mango

在 pandas 中切片 - Python

Pandas是Python中一个强大的数据分析和数据处理工具。其中一个非常重要的功能就是数据的切片,这使得我们能够按需选取数据,进行进一步的处理和分析。

在 pandas 中使用 iloc() 进行切片

在 pandas 中使用 iloc() 进行切片是一种非常基本的方法。iloc() 可以通过行和列的索引(从0开始)来选取数据。例如,我们可以使用以下语法来选取第1到第3行和第2到第3列的数据:

import pandas as pd

df = pd.read_csv("data.csv")
sliced_data = df.iloc[1:4, 2:4]
print(sliced_data)

上面的代码选取了第1到第3行和第2到第3列的数据,然后将选取出来的数据存储到 sliced_data 中。

在 pandas 中使用 loc() 进行切片

loc() 与 iloc() 相似,但是使用标签(而不是行和列的索引)作为参数。例如,我们可以使用以下语法来选取名字为“Alice”和“Bob”的行和“Age”和“Height”的列:

import pandas as pd

df = pd.read_csv("data.csv", index_col="Name")
sliced_data = df.loc[["Alice", "Bob"], ["Age", "Height"]]
print(sliced_data)

上面的代码通过设置索引列为“Name”来使用标签作为参数,然后选取了名字为“Alice”和“Bob”的行和“Age”和“Height”的列,并将选取出来的数据存储到 sliced_data 中。

在 pandas 中进行布尔索引

在 pandas 中,我们可以使用布尔索引来选取满足特定条件的数据。例如,我们可以使用以下语法来选取年龄大于25岁的数据:

import pandas as pd

df = pd.read_csv("data.csv")
sliced_data = df[df["Age"] > 25]
print(sliced_data)

上面的代码使用布尔索引选取年龄大于25岁的数据,然后将选取出来的数据存储到 sliced_data 中。

总结

在 pandas 中切片是一种非常基本的技术,但是非常实用,让我们能够按需选取数据,进行进一步的处理和分析。我们可以使用 iloc() 和 loc() 进行基本的切片操作,也可以使用布尔索引进行更加灵活的选取。