📜  pandas sum group by - Python (1)

📅  最后修改于: 2023-12-03 15:33:23.861000             🧑  作者: Mango

Pandas Sum Groupby

介绍

Pandas sum groupby是一个功能强大的方法,可以对一个数据集进行聚合分析。比较常见的应用场景是对数据集中的某一列进行分组(groupby),然后求出每个组内的另一列数据的和(sum)。

示例

接下来,我们将使用一个示例数据集,其中包含了一些销售数据,来说明如何使用pandas sum groupby进行聚合分析。

import pandas as pd

sales_data = {'year': [2010, 2010, 2011, 2011, 2012, 2012, 2013, 2013],
              'region': ['North', 'South', 'North', 'South', 'North', 'South', 'North', 'South'],
              'product': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
              'sales': [100, 200, 300, 400, 500, 600, 700, 800]}

df = pd.DataFrame(sales_data)

现在,我们有了一个名为df的DataFrame,我们可以使用pandas sum groupby方法对其进行分组聚合分析。

grouped = df.groupby('year')['sales'].sum()

print(grouped)

输出结果:

year
2010    300
2011    700
2012   1100
2013   1500
Name: sales, dtype: int64

通过上述代码,我们可以看到,我们首先使用了groupby方法按照'year'这一列进行了分组,然后对'sales'这一列进行了求和操作,并得到了每一年的销售总额。

总结

使用pandas sum groupby可以很方便地对数据集进行聚合分析,求出每一组(group)内某一列数据的和(sum)。通过这种方法,我们可以更好地了解数据集的特征和分布。