📜  在数据框的列中选择项目 - Python (1)

📅  最后修改于: 2023-12-03 15:08:02.695000             🧑  作者: Mango

在数据框的列中选择项目 - Python

数据框是Python中处理和分析数据的基本工具之一,而选择数据框中的特定列则是常见的操作之一,本文将介绍在Python中如何选择数据框的列。

方法1:使用方括号[]选择列

在Python中,使用方括号[]可以选择数据框的列。在方括号中输入列名,即可选择相应的列。示例代码如下:

import pandas as pd

# 创建数据框
data = {'name': ['Alice', 'Bob', 'Cathy', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'F', 'M'],
        'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)

# 选择单个列
name_col = df['name']
print(name_col)

# 选择多个列
name_and_age_cols = df[['name', 'age']]
print(name_and_age_cols)

此时输出结果为:

0    Alice
1      Bob
2    Cathy
3    David
Name: name, dtype: object
   
    name  age
0  Alice   25
1    Bob   32
2  Cathy   18
3  David   47

需要注意的是,如果选择多个列,则需要将列名放在一个列表中,如示例代码中的['name', 'age']

方法2:使用loc选择列

使用loc也可以选择数据框的列。需要用到的方法为.loc[:, [列名1, 列名2, ...]],其中前一个冒号表示选择所有的行,后面跟着的列表则为选择的列名。示例代码如下:

import pandas as pd

# 创建数据框
data = {'name': ['Alice', 'Bob', 'Cathy', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'F', 'M'],
        'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)

# 使用loc选择列
name_and_age_cols = df.loc[:, ['name', 'age']]
print(name_and_age_cols)

此时输出结果与方法1中的一致。

方法3:使用iloc选择列

使用iloc也可以选择数据框的列。需要用到的方法为.iloc[:, [列索引1, 列索引2, ...]],其中前一个冒号表示选择所有的行,后面跟着的列表则为选择的列的索引。示例代码如下:

import pandas as pd

# 创建数据框
data = {'name': ['Alice', 'Bob', 'Cathy', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'F', 'M'],
        'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)

# 使用iloc选择列
name_and_age_cols = df.iloc[:, [0, 1]]
print(name_and_age_cols)

此时输出结果与方法1中的一致。

总结

本文介绍了在Python中选择数据框的列的三种方法,分别是使用方括号、使用loc和使用iloc。需要注意的是,如果需要选择多个列,则应该将列名或列索引放在一个列表中。