📜  从 Numpy 数组创建 DataFrame 并指定索引列和列标题(1)

📅  最后修改于: 2023-12-03 15:21:53.297000             🧑  作者: Mango

从 Numpy 数组创建 DataFrame 并指定索引列和列标题

在 Python 中,我们常常需要将数据从 Numpy 数组转换为 Pandas DataFrame。Numpy 数组是一种用于存储和处理大量数据的数据结构,而 Pandas DataFrame 是一个强大的数据组织和处理工具,可以方便地进行数据分析和操作。

以下是从 Numpy 数组创建 DataFrame 并指定索引列和列标题的方法:

import numpy as np
import pandas as pd

# 创建 4x3 的 Numpy 数组
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])

# 指定行和列索引
row_idx = ["row1", "row2", "row3", "row4"]
col_idx = ["col1", "col2", "col3"]

# 从 Numpy 数组创建 DataFrame 并指定行和列索引
df = pd.DataFrame(arr, index=row_idx, columns=col_idx)

print(df)

输出结果如下:

      col1  col2  col3
row1     1     2     3
row2     4     5     6
row3     7     8     9
row4    10    11    12

在上面的代码中,我们首先创建了一个 4x3 的 Numpy 数组 arr。然后,我们指定了行索引为 ["row1", "row2", "row3", "row4"],列索引为 ["col1", "col2", "col3"]。最后,我们调用 Pandas 的 pd.DataFrame() 函数,将 Numpy 数组转换为 DataFrame,并指定行和列索引。最后,我们打印出了 DataFrame 对象。

需要注意的是,从 Numpy 数组创建 DataFrame 并指定行和列索引的关键步骤是调用 Pandas 的 pd.DataFrame() 函数,并指定 indexcolumns 参数。如果不指定这两个参数,默认使用数字作为行和列索引。

以上就是从 Numpy 数组创建 DataFrame 并指定索引列和列标题的方法,希望对你有所帮助!