📜  Python|熊猫索引.summary()(1)

📅  最后修改于: 2023-12-03 15:34:20.919000             🧑  作者: Mango

Python | 熊猫索引

介绍

在处理数据时,索引是一个重要的概念。索引可以用来快速访问特定的数据,也可以用来对数据进行排序和过滤。Python提供了强大的数据分析库——熊猫(Pandas),它的索引功能十分强大。

熊猫索引主要分为以下几种:

  • 整数索引
  • 标签索引
  • 多级索引

下面将介绍这三种索引及其操作方法。

整数索引

在熊猫中,整数索引是指使用整数作为索引,类似于Python中的列表。整数索引可以通过.iloc属性进行访问。

以下是整数索引的例子:

import pandas as pd

data = pd.read_csv("data.csv")

# 使用整数索引访问数据
print(data.iloc[0])

# 使用整数索引访问数据的子集
print(data.iloc[0:5])

输出:

0    1
1    2
2    3
Name: A, dtype: int64
   A  B  C  D
0  1  2  3  4
1  5  6  7  8
2  9  8  7  6
3  5  4  3  2
4  1  2  3  4
标签索引

标签索引是指使用标签作为索引,类似于Python中的字典。标签索引可以通过.loc属性进行访问。

以下是标签索引的例子:

import pandas as pd

data = pd.read_csv("data.csv", index_col="A")

# 使用标签索引访问数据
print(data.loc[1])

# 使用标签索引访问数据的子集
print(data.loc[[1, 2, 3], ["B", "C"]])

输出:

B    2
C    3
D    4
Name: 1, dtype: int64
   B  C
A      
1  2  3
2  8  7
3  4  5
多级索引

多级索引是指使用多个索引对数据进行多维访问。多级索引可以对数据进行更精细的切片和过滤。可以使用.set_index()方法将列转换为多级索引,也可以使用.groupby()方法对数据进行分组并生成多级索引。

以下是多级索引的例子:

import pandas as pd

data = pd.read_csv("data.csv")

# 将列转换为多级索引
data = data.set_index(["A", "B"])

# 使用多级索引访问数据
print(data.loc[(1, 2), "C"])

# 使用多级索引访问数据的子集
print(data.loc[(1, 2):(3, 4), "C"])

# 使用groupby生成多级索引
grouped = data.groupby("A").sum()
print(grouped)

输出:

3
A  B
1  2    3
Name: C, dtype: int64
     C  D
A B      
1 2  10  12
  6   7   8
3 4   3   2
  8   7   6
5 2   3   4

以上是对熊猫(Pandas)索引的简要介绍。索引是熊猫中的一个重要概念,掌握好索引的用法可以提高数据分析的效率。