📜  使用Python读取 excel 文件(1)

📅  最后修改于: 2023-12-03 15:36:37.095000             🧑  作者: Mango

使用Python读取Excel文件

在实际的工作中,我们经常需要读取Excel文件中的数据并对其进行处理。Python提供了多种库可以实现读取Excel文件的功能,本文将介绍其中的三种:xlrd、pandas、openpyxl。

xlrd

xlrd是Python中用于读取Excel文件的库,它能够读取.xlsx和.xls格式的Excel文件。

首先,我们需要安装xlrd库。

pip install xlrd

读取Excel文件的基本步骤:

  1. 打开Excel文件。
  2. 获取工作簿(Workbook)对象。
  3. 获取工作表(Worksheet)对象。
  4. 获取单元格(Cell)对象。
  5. 读取单元格的值。

下面是一个读取Excel文件的示例代码:

import xlrd

# 打开Excel文件
workbook = xlrd.open_workbook('example.xlsx')

# 获取所有工作表名字
sheet_names = workbook.sheet_names()
print(sheet_names)

# 获取第一个工作表
worksheet = workbook.sheet_by_index(0)

# 获取第二行第三列的单元格的值
cell_value = worksheet.cell_value(1, 2)
print(cell_value)
pandas

pandas是Python中用于数据处理的主要库之一,它也可以读取Excel文件,并将其转换为DataFrame格式。

首先,我们需要安装pandas库。

pip install pandas

读取Excel文件的基本步骤:

  1. 打开Excel文件。
  2. 获取工作表(Worksheet)对象。
  3. 将工作表转换为DataFrame格式。
  4. 处理数据。

下面是一个读取Excel文件的示例代码:

import pandas as pd

# 打开Excel文件并读取第一个工作表转换为DataFrame格式
df = pd.read_excel('example.xlsx', sheet_name=0)

# 输出DataFrame的前5行
print(df.head())

通过pandas库,我们可以非常方便地对Excel文件中的数据进行处理,例如对数据进行筛选、排序、统计等操作。

openpyxl

openpyxl是Python中用于读写Excel文件的库,它类似于xlrdxlwt库,但支持更多的Excel功能,例如合并单元格、添加图表等。

首先,我们需要安装openpyxl库。

pip install openpyxl

读取Excel文件的基本步骤:

  1. 打开Excel文件。
  2. 获取工作表(Worksheet)对象。
  3. 获取单元格(Cell)对象。
  4. 读取单元格的值。

下面是一个读取Excel文件的示例代码:

from openpyxl import load_workbook

# 打开Excel文件
workbook = load_workbook(filename='example.xlsx')

# 获取第一个工作表
worksheet = workbook['Sheet1']

# 获取第二行第三列的单元格的值
cell_value = worksheet.cell(row=2, column=3).value
print(cell_value)

与以上两种库不同,openpyxl库支持对Excel文件进行写入(如修改、添加数据等)的操作。

总结

以上就是Python中常见的读取Excel文件的三种方法,分别是xlrdpandasopenpyxl。不同的库适用于不同的场景,程序员可以根据具体需求选择使用。

参考文献:

  1. python操作Excel之pandas、xlrd、openpyxl
  2. Python操作Excel文件的详细攻略
  3. pandas.read_excel()
  4. openpyxl documentation