📌  相关文章
📜  如何使用 Pandas 从 Excel 文件列中提取时间数据?(1)

📅  最后修改于: 2023-12-03 15:08:23.279000             🧑  作者: Mango

如何使用 Pandas 从 Excel 文件列中提取时间数据?

在数据分析和处理中,经常需要从 Excel 文件中提取时间数据。Pandas 是一个强大的 Python 数据分析库,可以很方便地从 Excel 文件中提取和处理时间数据。

步骤

假设我们有一个 Excel 文件,其中有一个名为 "date" 的列,里面存储了时间数据。我们可以采用以下步骤从中提取时间数据:

  1. 导入 Pandas 库
import pandas as pd
  1. 读取 Excel 文件
df = pd.read_excel('file.xlsx')
  1. 将 "date" 列转换为 Pandas 中的 datetime 类型
df['date'] = pd.to_datetime(df['date'])
  1. 提取时间数据
year = df['date'].dt.year
month = df['date'].dt.month
day = df['date'].dt.day
hour = df['date'].dt.hour
minute = df['date'].dt.minute
second = df['date'].dt.second
  1. 将提取出的时间数据添加到 DataFrame 中
df['year'] = year
df['month'] = month
df['day'] = day
df['hour'] = hour
df['minute'] = minute
df['second'] = second
示例

以下是一个完整的示例,展示了如何从 Excel 文件中提取时间数据并添加到 DataFrame 中:

import pandas as pd

# 读取 Excel 文件
df = pd.read_excel('file.xlsx')

# 将 "date" 列转换为 Pandas 中的 datetime 类型
df['date'] = pd.to_datetime(df['date'])

# 提取时间数据
year = df['date'].dt.year
month = df['date'].dt.month
day = df['date'].dt.day
hour = df['date'].dt.hour
minute = df['date'].dt.minute
second = df['date'].dt.second

# 将提取出的时间数据添加到 DataFrame 中
df['year'] = year
df['month'] = month
df['day'] = day
df['hour'] = hour
df['minute'] = minute
df['second'] = second

# 输出 DataFrame
print(df)

输出结果如下:

        date  year  month  day  hour  minute  second
0 2019-01-01  2019      1    1     0       0       0
1 2019-02-01  2019      2    1     0       0       0
2 2019-03-01  2019      3    1     0       0       0
3 2019-04-01  2019      4    1     0       0       0
4 2019-05-01  2019      5    1     0       0       0
5 2019-06-01  2019      6    1     0       0       0
6 2019-07-01  2019      7    1     0       0       0
7 2019-08-01  2019      8    1     0       0       0
8 2019-09-01  2019      9    1     0       0       0
9 2019-10-01  2019     10    1     0       0       0