📌  相关文章
📜  数据框更改索引 - Python (1)

📅  最后修改于: 2023-12-03 14:54:55.553000             🧑  作者: Mango

数据框更改索引 - Python

数据框(DataFrame)是Python中pandas库中常用的数据结构,可以用于存储和操作二维表格数据。数据框的索引是用于标识和访问数据的关键元素之一。在某些情况下,我们可能需要更改数据框的索引,本文将介绍如何在Python中更改数据框的索引。

导入所需库

首先,我们需要导入pandas库以使用其中的数据框功能。可以使用以下代码来导入pandas库:

import pandas as pd
创建数据框

在介绍如何更改索引之前,我们需要先创建一个示例数据框。可以使用以下代码创建一个包含几列数据的数据框:

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
        'Age': [25, 32, 18, 47, 33],
        'City': ['New York', 'Paris', 'London', 'Tokyo', 'Sydney']}
df = pd.DataFrame(data)

运行上述代码后,我们得到了一个如下所示的数据框:

      Name  Age      City
0    Alice   25  New York
1      Bob   32     Paris
2  Charlie   18    London
3    David   47     Tokyo
4      Eve   33    Sydney
更改索引
使用现有列作为索引

我们可以使用现有的一列数据作为索引。要将某列设置为索引,可以使用set_index方法。以下代码将“Name”列设置为索引:

df = df.set_index('Name')

运行上述代码后,我们得到一个以下的数据框:

         Age      City
Name                  
Alice     25  New York
Bob       32     Paris
Charlie   18    London
David     47     Tokyo
Eve       33    Sydney

现在,“Name”列已经成为数据框的索引列。

创建新的自定义索引

除了使用现有列作为索引外,我们还可以创建新的自定义索引。可以使用以下代码将一个列表作为索引列:

index = ['a', 'b', 'c', 'd', 'e']
df.index = index

运行上述代码后,我们得到一个以下的数据框:

   Age      City
a   25  New York
b   32     Paris
c   18    London
d   47     Tokyo
e   33    Sydney

现在,数据框的索引已经改为了自定义的索引。

重置索引

有时,我们可能希望重置索引,将原索引重置为默认的整数索引。可以使用reset_index方法来完成此操作。以下代码将索引重置为默认的整数索引:

df = df.reset_index()

运行上述代码后,我们得到一个以下的数据框:

  index  Age      City
0     a   25  New York
1     b   32     Paris
2     c   18    London
3     d   47     Tokyo
4     e   33    Sydney

现在,数据框的索引已经被重置为默认的整数索引。

总结

在Python中,可以使用pandas库来更改数据框的索引。我们可以使用现有的列作为索引,创建新的自定义索引或重置索引。这在处理数据框时非常有用,可以根据具体需求灵活地更改和操作数据框的索引。


注意:上述代码示例中的代码片段标记为Markdown格式,因此应在返回结果中明确显示为Markdown格式。