在 pandas 中切片 - Python (1)

📌 相关文章

📜 在 pandas 中切片 - Python (1)

📅 最后修改于: 2023-12-03 14:51:03.635000 🧑 作者: Mango

Pandas是Python中一个强大的数据分析和数据处理工具。其中一个非常重要的功能就是数据的切片，这使得我们能够按需选取数据，进行进一步的处理和分析。

在 pandas 中使用 iloc() 进行切片是一种非常基本的方法。iloc() 可以通过行和列的索引（从0开始）来选取数据。例如，我们可以使用以下语法来选取第1到第3行和第2到第3列的数据：

import pandas as pd

df = pd.read_csv("data.csv")
sliced_data = df.iloc[1:4, 2:4]
print(sliced_data)

上面的代码选取了第1到第3行和第2到第3列的数据，然后将选取出来的数据存储到 sliced_data 中。

loc() 与 iloc() 相似，但是使用标签（而不是行和列的索引）作为参数。例如，我们可以使用以下语法来选取名字为“Alice”和“Bob”的行和“Age”和“Height”的列：

import pandas as pd

df = pd.read_csv("data.csv", index_col="Name")
sliced_data = df.loc[["Alice", "Bob"], ["Age", "Height"]]
print(sliced_data)

上面的代码通过设置索引列为“Name”来使用标签作为参数，然后选取了名字为“Alice”和“Bob”的行和“Age”和“Height”的列，并将选取出来的数据存储到 sliced_data 中。

在 pandas 中，我们可以使用布尔索引来选取满足特定条件的数据。例如，我们可以使用以下语法来选取年龄大于25岁的数据：

import pandas as pd

df = pd.read_csv("data.csv")
sliced_data = df[df["Age"] > 25]
print(sliced_data)

上面的代码使用布尔索引选取年龄大于25岁的数据，然后将选取出来的数据存储到 sliced_data 中。

在 pandas 中切片是一种非常基本的技术，但是非常实用，让我们能够按需选取数据，进行进一步的处理和分析。我们可以使用 iloc() 和 loc() 进行基本的切片操作，也可以使用布尔索引进行更加灵活的选取。