📜  选择列 pandas - Python (1)

📅  最后修改于: 2023-12-03 14:58:00.413000             🧑  作者: Mango

选择列 pandas - Python

在 Pandas 中,我们经常需要选择数据框的某些列来进行分析,对此,Pandas 提供了多种方法。

选择单个列

要选择单个列,可以使用中括号([])来选择列。

import pandas as pd

df = pd.read_csv('data.csv')

# 选择单个列
column1 = df['column1']
选择多个列

要选择多个列,可以在中括号中传入一个包含列名的列表。

# 选择多个列
columns = ['column1', 'column2', 'column3']
subset = df[columns]
使用 loc 和 iloc 选择列

Pandas 还提供了 loc 和 iloc 方法来选择列。loc 使用列名进行选择,iloc 使用列索引进行选择。

# 使用 loc 方法选择列
sub_df_1 = df.loc[:, 'column1':'column3'] # 选择从 column1 到 column3 的列

# 使用 iloc 方法选择列
sub_df_2 = df.iloc[:, [0, 2, 4]] # 选择索引位置为 0、2、4 的列
选择符合条件的列

有时我们需要根据条件选择数据框中的列,可使用 .loc[] 来实现。

# 选择包含 'column1' 的列
sub_df_3 = df.loc[:, df.columns.str.contains('column1')]

以上是 Pandas 中选择列的方法,根据具体需求选择适合自己的方法即可。