📜  访问列 pandas - Python (1)

📅  最后修改于: 2023-12-03 14:57:40.498000             🧑  作者: Mango

访问列 pandas - Python

在数据分析和数据处理过程中,pandas 是一个非常常用且强大的 Python 库。它提供了高性能、易于使用的数据结构和数据分析工具。本文将重点介绍如何使用 pandas 访问和操作数据框(DataFrame)中的列。

导入 pandas 库

首先,我们需要导入 pandas 库。可以使用以下代码行将其导入并指定别名为 pd

import pandas as pd
创建数据框

数据框是 pandas 中最常用的数据结构之一。我们可以从各种数据源(如 CSV 文件、数据库查询结果等)中创建数据框,或者可以手动创建一个数据框。

以下是一个创建数据框的示例,其中包含了两列数据:nameage

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
        'age': [25, 30, 35, 40, 45]}

df = pd.DataFrame(data)
访问列

一旦有了数据框,我们可以使用列名称访问其中的列。有几种常用的方法可以实现这一目的。

使用点操作符

使用点操作符可以通过列名直接访问列。以下是示例代码:

df.name
使用方括号操作符

另一种常用的方法是使用方括号操作符,并将列名作为字符串传递给它。以下是示例代码:

df['name']
使用 loc 属性

还可以使用 loc 属性,通过指定行和列的标签来访问列。在这种情况下,我们只需指定列名称。以下是示例代码:

df.loc[:, 'name']

其中 : 表示所有行。

使用 iloc 属性

在某些情况下,我们可能更希望通过列索引访问列,而不是使用列名称。此时,可以使用 iloc 属性,并传递列索引作为参数。以下是示例代码:

df.iloc[:, 0]

其中 0 表示第一列。

修改列数据

我们不仅可以访问列数据,还可以修改它们。下面是一些常用的方法:

直接赋值

可以直接通过列名将新值赋给列。以下是示例代码:

df.age = [30, 32, 37, 42, 47]
使用 loc 属性

与访问列一样,我们可以使用 loc 属性来修改特定列的数据。以下是示例代码:

df.loc[:, 'name'] = ['Amy', 'Ben', 'Catherine', 'Daniel', 'Emma']
添加新列

如果需要添加新列,可以通过为数据框分配一个新的 Series 对象来实现。以下是示例代码:

df['gender'] = ['Female', 'Male', 'Female', 'Male', 'Female']
结论

本文介绍了使用 pandas 访问列以及在数据框中修改列数据的不同方法。通过使用这些方法,程序员可以轻松地操作数据框的列,以进行数据分析和处理。

以上就是关于访问列 pandas - Python 的介绍。

注意:请将本文保存为 Markdown 文件以正确显示代码块的格式。