📅  最后修改于: 2023-12-03 14:51:05.043000             🧑  作者: Mango
在处理和分析数据时,经常需要从 DataFrame 中提取特定列的值。在本文中,我们将介绍如何在 Python 中获取 DataFrame 中特定列的值。
首先,我们需要创建一个 DataFrame。我们可以使用 Pandas 库中的 pd.DataFrame()
函数来创建一个 DataFrame。
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
'age': [25, 30, 32, 19, 27],
'city': ['New York', 'Paris', 'Tokyo', 'Los Angeles', 'Sydney']}
df = pd.DataFrame(data)
print(df)
这将输出以下 DataFrame:
name age city
0 Alice 25 New York
1 Bob 30 Paris
2 Charlie 32 Tokyo
3 David 19 Los Angeles
4 Emma 27 Sydney
我们可以使用 DataFrame 的列名来获取列的值。以下是使用 df['column_name']
表达式获取 DataFrame 中特定列的值的示例代码。
# 获取“name”列的值
name_values = df['name']
print(name_values)
输出:
0 Alice
1 Bob
2 Charlie
3 David
4 Emma
Name: name, dtype: object
我们也可以使用 df.column_name
的格式来获取列的值。例如:
# 获取“age”列的值
age_values = df.age
print(age_values)
输出:
0 25
1 30
2 32
3 19
4 27
Name: age, dtype: int64
注意,如果列名中包含空格等特殊字符,则必须使用 df['column name']
的格式来获取列的值。
我们可以使用行索引来获取 DataFrame 中特定列的值。以下是使用 df.iloc[:, column_index]
表达式获取 DataFrame 中特定列的值的示例代码。
# 获取“city”列的值
city_values = df.iloc[:, 2]
print(city_values)
输出:
0 New York
1 Paris
2 Tokyo
3 Los Angeles
4 Sydney
Name: city, dtype: object
注意,df.iloc[:, column_index]
表达式中的 column_index
是从 0 开始的整数索引。
在本文中,我们介绍了如何在 Python 中获取 DataFrame 中特定列的值。我们可以通过列名或行索引来获取列的值。这是在 Pandas 中进行数据操作和分析的基础。