pd.read_excel - Python (1)

📌 相关文章

📜 pd.read_excel - Python (1)

📅 最后修改于: 2023-12-03 15:18:17.062000 🧑 作者: Mango

pd.read_excel - Python

介绍

pd.read_excel 是 Python 语言中 pandas 库中用于读取 Excel 文件的函数。该函数可加载 Excel 文件中的一个或多个工作表，并返回 pandas 的 DataFrame 对象。从而使用户能够更轻松地将 Excel 数据集导入到 Python 中，并以 DataFrame 格式进行分析和可视化。

语法

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False)

参数

io：Excel 文件的路径（字符串），或 Excel 文件的 URL，或已打开的文件描述符，或 BytesIO 类型，或已读取的 Excel 内容。
sheet_name：要加载的工作表。可以是常规字符串（如“Sheet1”），整数（从0开始）或列表，例如 ['Sheet1', 1, 2] 表示将读取 “Sheet1”、“Sheet2“ 和 ”Sheet3“的数据。默认值为0。
header：用作列名的行号。默认值为0（第一行）。
names：用于设置列名的列表。默认值为 None， pandas 将自动使用第一行作为列名。
index_col：用作行索引的列编号或列名。默认值为None。
usecols：要读取的列的列表。列表中的值可以是列名，也可以是列编号。默认值为None, 即读取所有列。
squeeze：如果数据仅包含一列，则返回一个 Series。否则返回DataFrame。默认值为False。

返回值

返回 pandas 的 DataFrame 或 Series 对象。

示例

import pandas as pd

# 从本地文件读取Excel文件
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', header=0)

# 从URL读取Excel文件
url = 'https://url/file.xlsx'
df = pd.read_excel(url, sheet_name='Sheet1', header=0)

# 读取文件中的多个工作表
df1, df2 = pd.read_excel('file.xlsx', sheet_name=['Sheet1', 'Sheet2'])

# 读取指定列
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', usecols=['A', 'B'])

# 读取并设置列名
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', header=None, names=['Date', 'Value'])

# 读取一列数据
s = pd.read_excel('file.xlsx', sheet_name='Sheet1', usecols=['A'], squeeze=True)

注意事项

pd.read_excel 函数依赖于 openpyxl 和 xlrd 两个 Python 库来读取 Excel 文件。在使用该函数之前，需要先确保已成功安装这两个库。同时也需要注意 Excel 文件是 .xls 还是 .xlsx 格式。如果需要读取 .xls 格式的 Excel 文件，则应使用 pd.read_excel 的替代函数 pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, engine='xlrd')。

pd.read_excel - Python

介绍

语法

参数

返回值

示例

注意事项

参考链接