📜  获取列索引 pandas - Python (1)

📅  最后修改于: 2023-12-03 14:57:13.855000             🧑  作者: Mango

获取列索引 - Pandas

在使用 Pandas 进行数据处理和分析时,经常需要获取数据框的列索引(也称为列名)。Pandas 提供了多种方法来获取列索引,本文将介绍其中的几种常用方法。

1. 使用 columns 属性

可以使用 DataFrame 的 columns 属性来获取数据框的列索引。columns 属性返回一个包含所有列索引的列表,其中每个元素表示一个列名。

import pandas as pd

# 创建示例数据框
data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35],
        'Gender': ['Female', 'Male', 'Male']}
df = pd.DataFrame(data)

# 获取列索引
column_names = df.columns
print(column_names)

输出结果为:

Index(['Name', 'Age', 'Gender'], dtype='object')
2. 使用 tolist() 方法

可以使用 tolist() 方法将列索引转换为一个普通的 Python 列表。

# 使用 tolist() 方法将列索引转换为列表
column_names_list = df.columns.tolist()
print(column_names_list)

输出结果为:

['Name', 'Age', 'Gender']
3. 使用 index 属性

除了 columns 属性,还可以使用 Series 对象的 index 属性来获取列索引。

# 获取列索引
column_names_series = pd.Series(df.columns)
print(column_names_series)

输出结果为:

0      Name
1       Age
2    Gender
dtype: object
4. 使用 get_level_values 方法(适用于多级列索引)

如果数据框具有多级列索引(即多个层级的列名),可以使用 get_level_values 方法获取指定层级的列索引。

# 创建含有多级列索引的示例数据框
data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35],
        'School': ['A', 'B', 'C']}
df_multiindex = pd.DataFrame(data)
df_multiindex.columns = pd.MultiIndex.from_tuples([('Information', 'Name'), ('Information', 'Age'), ('Location', 'School')])

# 获取第一层级的列索引
column_names_level1 = df_multiindex.columns.get_level_values(0)
print(column_names_level1)

输出结果为:

Index(['Information', 'Information', 'Location'], dtype='object')

以上就是几种常用的获取列索引的方法。

注意:本文示例中的代码假设你已经正确安装和导入了 Pandas 库。