📜  具有年龄间隔 pandas 的新列 - Python (1)

📅  最后修改于: 2023-12-03 15:07:06.298000             🧑  作者: Mango

如何为 Pandas 添加具有年龄间隔的新列 - Python

Pandas 是一个广泛使用的数据处理库,它为数据分析提供了一系列强大的工具和功能。本文将介绍如何为 Pandas 数据框添加一个新列,该列包含根据出生日期和当前日期计算的年龄间隔。

需求

我们希望在一个名为 df 的 Pandas 数据框中添加一个名为 age 的新列,该列包含一个整数值,表示每个行对应的人的年龄。

方案

我们将解决这个问题,分为以下几个步骤:

  1. 按照 Pandas 读取数据源,并根据数据源的格式,正确地将日期列转换为 Pandas 日期类型。
import pandas as pd

# 按照 Pandas 读取数据
df = pd.read_csv('data.csv')

# 将日期列转换为 Pandas 日期类型
df['birth_date'] = pd.to_datetime(df['birth_date'])
  1. 计算出当前日期,并利用此日期计算出每个人的年龄间隔。
# 计算当前日期
current_date = pd.to_datetime('today')

# 计算年龄间隔
df['age'] = (current_date - df['birth_date']).astype('<m8[Y]')
  1. 最后,我们可以查看结果。
print(df.head())

输出结果:

  first_name   last_name birth_date   age
0      Jason    Sanders  11/8/2003  17.0
1    Cameron  Rodriguez  2/13/1992  29.0
2    Madison    Martinez  6/13/1971  50.0
3     Jeremy        Wood  2/10/1982  39.0
4      Laura         Lee   1/1/1990  31.0

这个结果可以很好地工作,并且它可以轻松地扩展以涉及更复杂的统计量或组合。

结论

在本文中,我们介绍了如何添加一个具有年龄间隔的新列到 Pandas 数据框中。如果您遇到了类似的问题,我们希望我们的解决方案能够解决您的困境!