📜  pd.read_excel - Python (1)

📅  最后修改于: 2023-12-03 15:18:17.062000             🧑  作者: Mango

pd.read_excel - Python

介绍

pd.read_excel 是 Python 语言中 pandas 库中用于读取 Excel 文件的函数。该函数可加载 Excel 文件中的一个或多个工作表,并返回 pandas 的 DataFrame 对象。从而使用户能够更轻松地将 Excel 数据集导入到 Python 中,并以 DataFrame 格式进行分析和可视化。

语法

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False)

参数
  • io:Excel 文件的路径(字符串),或 Excel 文件的 URL,或已打开的文件描述符,或 BytesIO 类型,或已读取的 Excel 内容。
  • sheet_name:要加载的工作表。可以是常规字符串(如“Sheet1”),整数(从0开始)或列表,例如 ['Sheet1', 1, 2] 表示将读取 “Sheet1”、“Sheet2“ 和 ”Sheet3“的数据。默认值为0。
  • header:用作列名的行号。默认值为0(第一行)。
  • names:用于设置列名的列表。默认值为 None, pandas 将自动使用第一行作为列名。
  • index_col:用作行索引的列编号或列名。默认值为None。
  • usecols:要读取的列的列表。列表中的值可以是列名,也可以是列编号。默认值为None, 即读取所有列。
  • squeeze:如果数据仅包含一列,则返回一个 Series。否则返回DataFrame。默认值为False。
返回值

返回 pandas 的 DataFrame 或 Series 对象。

示例
import pandas as pd

# 从本地文件读取Excel文件
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', header=0)

# 从URL读取Excel文件
url = 'https://url/file.xlsx'
df = pd.read_excel(url, sheet_name='Sheet1', header=0)

# 读取文件中的多个工作表
df1, df2 = pd.read_excel('file.xlsx', sheet_name=['Sheet1', 'Sheet2'])

# 读取指定列
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', usecols=['A', 'B'])

# 读取并设置列名
df = pd.read_excel('file.xlsx', sheet_name='Sheet1', header=None, names=['Date', 'Value'])

# 读取一列数据
s = pd.read_excel('file.xlsx', sheet_name='Sheet1', usecols=['A'], squeeze=True)
注意事项

pd.read_excel 函数依赖于 openpyxlxlrd 两个 Python 库来读取 Excel 文件。在使用该函数之前,需要先确保已成功安装这两个库。同时也需要注意 Excel 文件是 .xls 还是 .xlsx 格式。如果需要读取 .xls 格式的 Excel 文件,则应使用 pd.read_excel 的替代函数 pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, engine='xlrd')

参考链接