📜  Pandas DataFrame.set_index(1)

📅  最后修改于: 2023-12-03 15:03:28.225000             🧑  作者: Mango

Pandas DataFrame.set_index介绍

DataFrame.set_index是Pandas库中的一个非常重要的函数,用于将DataFrame中的一列或多列设置为索引,这样可以方便地对数据进行筛选、切片、聚合等操作。

函数签名
DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)

参数说明:

  • keys:要设置为索引的列或列名的字符串或列表。
  • drop:布尔值,默认为True,表示是否将列从DataFrame中删除,如果设置为False,则会在DataFrame中保留这些列。
  • append:布尔值,默认为False,表示是否将索引添加到现有索引之后,如果设置为True,则会将索引添加到现有索引之后。
  • inplace:布尔值,默认为False,表示是否在原DataFrame上操作,如果设置为True,则会在原DataFrame上进行修改。
  • verify_integrity:布尔值,默认为False,表示是否检查索引是否唯一,如果设置为True,则会检查索引是否唯一,如果有重复的索引,则会抛出ValueError异常。
使用示例
import pandas as pd

# 创建DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8], 'C': [9, 10, 11, 12]})

# 打印DataFrame
print(df)

# 将A列作为索引
df.set_index('A', inplace=True)

# 打印新的DataFrame
print(df)

# 将B和C列作为索引(多重索引)
df.set_index(['B', 'C'], inplace=True)

# 打印新的DataFrame
print(df)

输出结果:

   A  B   C
0  1  5   9
1  2  6  10
2  3  7  11
3  4  8  12

   B   C
A       
1  5   9
2  6  10
3  7  11
4  8  12

      A
B C    
5 9   1
6 10  2
7 11  3
8 12  4

从上面的示例可以看出,set_index函数可以轻松地将DataFrame的列设置为索引,并可以根据需要添加多重索引。