📜  访问 Pandas 系列的元素(1)

📅  最后修改于: 2023-12-03 15:41:45.325000             🧑  作者: Mango

访问 Pandas 系列的元素

Pandas 是 Python 中非常流行的数据分析库,它提供了 Series 和 DataFrame 两种数据结构来处理数据。在使用 Pandas 进行数据处理时,我们需要经常访问其中的元素,本文将介绍如何访问 Pandas 系列的元素。

Series

Series 是一种一维数组,它由一组数据和一组与之相关的标签组成,我们可以通过标签来访问其中的元素。

通过索引访问元素

Pandas 提供了 .loc.iloc 两种方法来通过索引访问元素。

  • .loc:通过标签索引访问元素。
import pandas as pd

s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])

print(s.loc['a'])  # 输出 1
print(s.loc[['a', 'c', 'e']])  # 输出包含三个元素的 Series 对象
  • .iloc:通过位置索引访问元素。
import pandas as pd

s = pd.Series([1, 2, 3, 4, 5])

print(s.iloc[0])  # 输出 1
print(s.iloc[[0, 2, 4]])  # 输出包含三个元素的 Series 对象
通过条件访问元素

Pandas 提供了类似于 NumPy 的布尔索引来实现通过条件访问元素的功能。

import pandas as pd

s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])

print(s[s > 3])  # 输出大于 3 的元素所组成的 Series 对象
DataFrame

DataFrame 是一种二维表格数据结构,它由若干个 Series 对象组成,每个 Series 对象代表一列数据,我们可以通过列名和行名来访问其中的元素。

通过索引访问元素

Pandas 提供了 .loc.iloc 两种方法来通过索引访问元素。

  • .loc:通过列名和行名访问元素。
import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [21, 22, 23]})

print(df.loc[0, 'name'])  # 输出 Alice
print(df.loc[[0, 2], 'age'])  # 输出包含两个元素的 Series 对象
print(df.loc[df.age > 21, ['name', 'age']])  # 输出所有年龄大于 21 的行组成的 DataFrame 对象
  • .iloc:通过位置索引访问元素。
import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [21, 22, 23]})

print(df.iloc[0, 0])  # 输出 Alice
print(df.iloc[[0, 2], 1])  # 输出包含两个元素的 Series 对象
print(df.iloc[df.age > 21, [0, 1]])  # 输出所有年龄大于 21 的行组成的 DataFrame 对象
通过条件访问元素

Pandas 提供了类似于 NumPy 的布尔索引来实现通过条件访问元素的功能。

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [21, 22, 23]})

print(df[df.age > 21])  # 输出所有年龄大于 21 的行组成的 DataFrame 对象

以上就是我们常用的访问 Pandas 系列的元素的方法,希望对你有帮助。