📌  相关文章
📜  Pandas DataFrame 基于标签的索引(1)

📅  最后修改于: 2023-12-03 14:45:02.378000             🧑  作者: Mango

Pandas DataFrame 基于标签的索引

Pandas是Python数据分析中最热门的库之一,广泛应用于数据清洗、数据处理、数据分析等领域。其中,DataFrame是Pandas最常用的数据结构之一。Pandas DataFrame 基于标签的索引可以帮助我们方便地处理和分析数据。

建立 DataFrame

在介绍Pandas DataFrame 基于标签的索引之前,我们先来看一下如何建立DataFrame。DataFrame可以视为一个表格,它有行和列组成。创建DataFrame需要使用Pandas库中的DataFrame()函数。例如:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 
        'age': [25, 17, 32, 19], 
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)

输出结果如下:

      name  age gender
0    Alice   25      F
1      Bob   17      M
2  Charlie   32      M
3    David   19      M
基于标签的索引

在Pandas DataFrame中,我们可以使用基于标签的索引来选取相关数据。基于标签的索引分为两种:

  1. 使用loc[]函数: loc选取行数据和列数据,按标签/名称查询,其中行索引的查询方式还可以是切片。
  2. 使用iloc[]函数: iloc选取行数据和列数据,按整数位置查询,包括行索引和列索引的位置查询方式。

下面我们分别介绍两种索引方式。

使用loc[]函数

使用loc[]函数可以基于标签/名称轴索引数据。loc[]函数的常用格式如下:

df.loc[[行标签列表], [列标签列表]]

其中行标签列表是必须的,而如果不指定列标签列表,则默认选取所有的列。行标签可以使用标签名称或者切片方式进行查询。

例如,我们可以使用如下方式查询所有行数据和列数据:

print(df.loc[:, :])

输出结果如下:

      name  age gender
0    Alice   25      F
1      Bob   17      M
2  Charlie   32      M
3    David   19      M

我们还可以使用如下方式查询所有行数据和指定列数据:

print(df.loc[:, ['name', 'age']])

输出结果如下:

      name  age
0    Alice   25
1      Bob   17
2  Charlie   32
3    David   19

同时我们也可以使用行标签切片方式查询部分数据:

print(df.loc[1:3, :])

输出结果如下:

      name  age gender
1      Bob   17      M
2  Charlie   32      M
3    David   19      M
使用iloc[]函数

使用iloc[]函数可以基于整数位置轴索引数据。iloc[]函数的常用格式如下:

df.iloc[[行位置列表], [列位置列表]]

其中行位置列表是必须的,而如果不指定列位置列表,则默认选取所有的列。

例如,我们可以使用如下方式查询所有行数据和列数据:

print(df.iloc[:, :])

输出结果如下:

      name  age gender
0    Alice   25      F
1      Bob   17      M
2  Charlie   32      M
3    David   19      M

我们还可以使用如下方式查询所有行数据和指定列数据:

print(df.iloc[:, [0, 1]])

输出结果如下:

      name  age
0    Alice   25
1      Bob   17
2  Charlie   32
3    David   19

同时我们也可以使用行位置切片方式查询部分数据:

print(df.iloc[1:3, :])

输出结果如下:

      name  age gender
1      Bob   17      M
2  Charlie   32      M
总结

在本篇介绍中,我们学习了如何建立Pandas DataFrame,并通过loc[]和iloc[]函数介绍了如何基于标签的索引选取数据。了解了基于标签的索引,我们可以更加方便地对DataFrame中的数据进行处理、分析和可视化展示。