📌  相关文章
📜  在 Pandas Dataframe 中将一系列日期字符串转换为时间序列(1)

📅  最后修改于: 2023-12-03 15:23:14.626000             🧑  作者: Mango

在 Pandas Dataframe 中将一系列日期字符串转换为时间序列

在Pandas中,通常我们需要将一系列的字符串转换为时间序列进行处理和分析。下面介绍几种常用的方法。

1. 使用to_datetime函数将字符串转换为时间序列

Pandas提供了一个to_datetime函数,可以将字符串转换为时间序列。

import pandas as pd

# 创建一个包含日期字符串的DataFrame
df = pd.DataFrame({'date': ['2022-01-01', '2022-01-02', '2022-01-03']})

# 将日期字符串转换为时间序列
df['date'] = pd.to_datetime(df['date'])

print(df)

输出结果:

        date
0 2022-01-01
1 2022-01-02
2 2022-01-03
2. 指定日期格式

如果你的日期字符串的格式不是标准格式,可以使用format参数指定日期格式。

df = pd.DataFrame({'date': ['2022/01/01', '2022/01/02', '2022/01/03']})
df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')
print(df)

输出结果:

        date
0 2022-01-01
1 2022-01-02
2 2022-01-03
3. 处理时间戳

如果你的日期字符串包含时间戳,可以使用Unix时间戳(以秒为单位)将其转换为时间序列。可以使用unit参数指定时间戳的单位。

df = pd.DataFrame({'date': ['1641058431', '1641144831', '1641231231']})
df['date'] = pd.to_datetime(df['date'], unit='s')
print(df)

输出结果:

                 date
0 2022-01-01 11:20:31
1 2022-01-02 11:20:31
2 2022-01-03 11:20:31
4. 处理时区

如果你的日期字符串包含时区信息,可以使用tz参数处理时区。

df = pd.DataFrame({'date': ['2022-01-01 00:00:00+08:00', '2022-01-02 00:00:00+08:00', '2022-01-03 00:00:00+08:00']})
df['date'] = pd.to_datetime(df['date'], utc=True).dt.tz_convert('Asia/Shanghai')
print(df)

输出结果:

                       date
0 2022-01-01 00:00:00+08:00
1 2022-01-02 00:00:00+08:00
2 2022-01-03 00:00:00+08:00

以上就是如何在Pandas Dataframe中将一系列日期字符串转换为时间序列的方法。Simplify AI:做AI更简单!