📜  将格式应用于 pandas 日期时间列 - Python (1)

📅  最后修改于: 2023-12-03 15:25:20.693000             🧑  作者: Mango

将格式应用于 Pandas 日期时间列 - Python

在数据分析和处理中,我们经常需要处理日期时间数据。Pandas 提供了强大的日期时间功能,例如日期时间索引、时间序列分组、日期时间格式化等等。本文将介绍如何将格式应用于 Pandas 日期时间列。

1. 创建一个日期时间列

首先,我们需要创建一个日期时间列。可以使用 Pandas 的 date_range() 函数生成一个时间序列。

import pandas as pd

# 创建一个时间序列,范围为 2022-01-01 至 2022-02-01,间隔为 1 天
date_series = pd.date_range('2022-01-01', '2022-02-01', freq='D')

# 创建一个 DataFrame,将时间序列作为其中一列
df = pd.DataFrame({'date_column': date_series})

print(df.head())

输出:

  date_column
0  2022-01-01
1  2022-01-02
2  2022-01-03
3  2022-01-04
4  2022-01-05

现在,我们有了一个包含日期时间列的 DataFrame,接下来我们将看到如何将格式应用于该列。

2. 将格式应用于日期时间列

Pandas 使用 strftime 格式化字符串将日期时间数据格式化为所需的字符串格式。以下是一些常用的格式化字符串:

  • %Y:四位数的年份(例如:2022)
  • %m:两位数的月份(例如:01)
  • %d:两位数的日期(例如:01)
  • %H:24 小时制的小时数(例如:15)
  • %M:分钟数(例如:30)
  • %S:秒数(例如:00)
  • %A:全名的星期几(例如:Monday)
  • %a:缩写的星期几(例如:Mon)
  • %B:全名的月份(例如:January)
  • %b:缩写的月份(例如:Jan)

下面是如何将格式应用于日期时间列的示例:

# 将格式应用于日期时间列
df['formatted_date_column'] = df['date_column'].apply(lambda x: x.strftime('%Y-%m-%d %H:%M:%S'))

print(df.head())

输出:

  date_column formatted_date_column
0  2022-01-01   2022-01-01 00:00:00
1  2022-01-02   2022-01-02 00:00:00
2  2022-01-03   2022-01-03 00:00:00
3  2022-01-04   2022-01-04 00:00:00
4  2022-01-05   2022-01-05 00:00:00

在上面的示例中,我们使用 strftime() 方法将日期时间格式化为 %Y-%m-%d %H:%M:%S 的字符串格式,并将其应用于日期时间列。最终结果是将此格式应用于日期时间列的新 formatted_date_column 列。

3. 结论

在本文中,我们介绍了如何将格式应用于 Pandas 日期时间列。我们创建了一个包含日期时间列的 DataFrame,并使用 strftime 格式化字符串将日期时间数据格式化为所需的字符串格式。通过此操作,我们可以更适合数据分析和可视化的方式查看日期时间数据。