从 Pandas DataFrame 中的行创建列表 |设置 2(1) - 芒果文档

📌 相关文章

📜 从 Pandas DataFrame 中的行创建列表 |设置 2(1)

📅 最后修改于: 2023-12-03 15:36:14.609000 🧑 作者: Mango

从 Pandas DataFrame 中的行创建列表 |设置 2

在数据分析和处理过程中，我们通常需要从 Pandas 的 DataFrame 中获取特定的行数据，并将其转换为列表形式进行进一步的操作。在这篇文章中，我们将介绍如何从 Pandas DataFrame 中的行创建列表，并使用设置 2 提高性能。

从 Pandas DataFrame 中的行创建列表

首先，让我们来看一下如何从 Pandas DataFrame 中的行创建列表。假设我们有如下的 DataFrame：

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']})

这里我们使用字典的形式定义了一个 DataFrame，它包含两个列 A 和 B，每列有三个元素。

如果我们想从 DataFrame 中获取第一行数据，可以使用 iloc 方法，并将行索引设置为 0：

row = df.iloc[0]

现在我们得到了一个 Pandas Series 对象，它包含了第一行数据。我们可以将其转换为列表，方法如下：

row_list = row.tolist()

现在，我们得到了一个 Python 列表，其中包含的是第一行数据的元素。如果我们想获取所有行的数据，可以使用 for 循环遍历 DataFrame，并将每一行转换为列表：

row_list = []
for index, row in df.iterrows():
    row_list.append(row.tolist())

在这里，我们使用了 iterrows 方法来遍历 DataFrame，依次获取每一行的数据，并将其转换为列表，最终将所有列表拼接成一个大列表。

设置 2：使用 `apply` 提高性能

如果 DataFrame 的数据量非常大，使用 for 循环遍历 DataFrame 可能会非常慢。在这种情况下，可以使用 Pandas 的 apply 方法来提高性能。具体步骤如下：

首先，我们需要定义一个函数，用于将每行数据转换为列表：

def row_to_list(row):
    return row.tolist()

然后，我们可以使用 apply 方法来应用这个函数到每一行：

row_list = df.apply(row_to_list, axis=1).tolist()

在这里，我们将 apply 方法应用到 DataFrame 上，设置 axis=1，表示按行应用这个函数。然后，使用 tolist 方法将结果转换为 Python 列表。

使用设置 2 能够显著提高获取 DataFrame 行数据的速度，特别是在数据量较大的情况下。如果您需要获取 DataFrame 的列数据，同样也可以使用类似的方法来处理。