📜  pandas boolean array 根据另一个列过滤器计算列的平均值 - Python (1)

📅  最后修改于: 2023-12-03 14:45:02.245000             🧑  作者: Mango

Pandas boolean array 根据另一个列过滤器计算列的平均值 - Python

在 Pandas 中,我们可以使用 boolean array 根据另一个列过滤数据,并计算特定列的平均值。

具体来说,我们可以使用 Pandas 的 loc 方法选择符合条件的记录,然后使用 mean 方法计算特定列的平均值。

下面是一个示例程序,演示了如何使用 boolean array 根据 'gender' 列过滤数据,并计算 'score' 列的平均值:

import pandas as pd

# 读取数据
data = pd.read_csv('students.csv')

# 根据 gender 列过滤数据
male = data.loc[data['gender'] == 'M']
female = data.loc[data['gender'] == 'F']

# 计算 score 列的平均值
male_avg_score = male['score'].mean()
female_avg_score = female['score'].mean()

# 输出结果
print('Male average score:', male_avg_score)
print('Female average score:', female_avg_score)

这个程序会读取一个名为 'students.csv' 的 CSV 文件,该文件包含了学生的性别、成绩、年龄等信息。然后,程序会根据 'gender' 列过滤数据,并计算 'score' 列的平均值,并输出结果。

这个程序可以通过修改 'students.csv' 文件中的数据来适用于不同的数据集。同时,也可以根据不同的列来过滤数据,计算不同列的平均值,以满足不同的需求。

以上就是关于使用 Pandas boolean array 根据另一个列过滤器计算列的平均值的介绍,希望对大家有所帮助。