📜  pandas 跨多个时期的百分比变化 - Python (1)

📅  最后修改于: 2023-12-03 15:18:15.576000             🧑  作者: Mango

Pandas 跨多个时期的百分比变化 - Python

在数据分析和统计过程中,我们经常需要计算多个时间段之间的数据变化百分比。Pandas是一种流行的Python库,用于数据处理和分析。Pandas提供了一些方便的工具,用于计算跨多个时间段的百分比变化。

代码示例

我们将使用一个示例数据集,该数据集包含两列:年份和销售额。

import pandas as pd

# 创建示例数据集
data = {'Year': [2010, 2011, 2012, 2013, 2014],
        'Sales': [100, 120, 140, 160, 180]}
df = pd.DataFrame(data)
print(df)

这将输出以下数据集:

   Year  Sales
0  2010    100
1  2011    120
2  2012    140
3  2013    160
4  2014    180

现在,我们可以使用Pandas内置的shift函数,将上一年的销售额移动到当前行。然后,我们可以计算百分比变化并将其添加到数据集中。

# 计算百分比变化
df['Change'] = df['Sales'].pct_change().mul(100).round(2)

# 移动上一年的销售额到当前行
df['Prev Year Sales'] = df['Sales'].shift(1)

print(df)

这将输出以下数据集:

   Year  Sales  Change  Prev Year Sales
0  2010    100     NaN              NaN
1  2011    120    20.0            100.0
2  2012    140    16.67           120.0
3  2013    160    14.29           140.0
4  2014    180    12.5            160.0

现在,我们有了一个数据集,其中包含销售额、变化和上一年的销售额。我们可以使用这些数据来绘制一些有趣的图表和可视化。

结论

在本教程中,我们介绍了使用Pandas计算跨多个时间段的百分比变化的方法。我们展示了如何将百分比变化和前一年的数据添加到数据集中,并使用数据生成一些有趣的图表和可视化。