从入门到实战详解Python解析Excel的完整指南

时间：2026-04-27 19:15

引言说到处理数据，Excel绝对是大多数人的第一站。但手动整理海量表格，费时费力不说，还容易手滑出错。这时候，Python就该登场了。借助几个强大的库，比如 openpyxl、pandas、xlrd，我们可以轻松实现Excel文件的读取、修改甚至自动生成，把重复劳动彻底交给代码。接下来，就让我们一

引言

说到处理数据，Excel绝对是大多数人的第一站。但手动整理海量表格，费时费力不说，还容易手滑出错。这时候，Python就该登场了。借助几个强大的库，比如 openpyxl、pandas、xlrd，我们可以轻松实现Excel文件的读取、修改甚至自动生成，把重复劳动彻底交给代码。接下来，就让我们一起看看如何用Python玩转Excel，并通过几个实战案例快速上手。

从入门到实战详解Python解析Excel的完整指南

一、为什么选择Python解析Excel？

你可能想问，Excel本身功能已经很强大了，为什么还要用Python？答案很简单：为了更高效、更智能。具体来说，有以下几个无法拒绝的理由：

自动化处理：告别复制粘贴，批量操作数据，让重复性工作一键完成。
跨平台兼容：无论你用的是Windows、macOS还是Linux，Python脚本都能畅通无阻。
灵活性强：可以轻松结合pandas这类数据分析库，进行复杂的计算、筛选和转换。
开源免费：无需为Excel的高级功能或授权付费，丰富的开源库任你选用。

二、常用Python库对比

工欲善其事，必先利其器。Python生态里有好几个处理Excel的库，各有侧重。选对工具，事半功倍。下面这个表格帮你快速理清：

库名	适用场景	特点
`openpyxl`	读写 `.xlsx` 文件	功能全面，支持公式、图表、单元格样式修改
`pandas`	数据清洗、分析、可视化	接口简洁，处理表格数据效率极高
`xlrd`	读取旧版 `.xls` 文件	专为读取设计（不支持写入）
`xlwt`	写入旧版 `.xls` 文件	专为写入设计（不支持读取）
`xlsxwriter`	生成复杂的 `.xlsx` 文件	支持高级图表、条件格式，性能出色

如何选择？这里有个快速指南：

如果要读写常见的 .xlsx 文件，openpyxl 或 pandas 是首选。
如果不得不处理陈年的旧版 .xls 文件，那就用 xlrd 读，用 xlwt 写。
如果需要生成带有复杂图表和格式的报表，xlsxwriter 会更得心应手。

三、实战教程：用Python解析Excel

理论说再多，不如动手试一遍。下面我们通过几个典型场景，看看代码具体怎么写。

1. 使用openpyxl读写Excel

首先，安装它：

pip install openpyxl

然后，看看基础操作：

from openpyxl import load_workbook, Workbook

# 读取现有的Excel文件
wb = load_workbook("example.xlsx")
sheet = wb.active  # 获取当前活跃的工作表
print(sheet["A1"].value)  # 读取A1单元格的内容

# 修改文件内容
sheet["B1"] = "Python解析Excel"
wb.sa ve("modified_example.xlsx")  # 保存修改

# 从头创建一个新的Excel文件
new_wb = Workbook()
new_sheet = new_wb.active
new_sheet["A1"] = "Hello, Excel!"
new_wb.sa ve("new_file.xlsx")

什么时候该用它？

当你需要精细控制单元格的样式、公式或者插入图表时。
主要处理 .xlsx 格式的文件。

2. 使用pandas高效处理数据

pandas是数据分析的利器，安装时记得带上openpyxl引擎：

pip install pandas openpyxl

用它来处理表格数据，代码会非常简洁：

import pandas as pd

# 读取Excel文件，可以指定工作表
df = pd.read_excel("data.xlsx", sheet_name="Sheet1")
print(df.head())  # 快速预览前5行数据

# 进行数据清洗和计算
df["New_Column"] = df["Column1"] * 2  # 基于已有列创建新列
filtered_data = df[df["Column2"] > 100]  # 筛选出Column2大于100的数据

# 将处理结果保存到新的Excel文件
filtered_data.to_excel("filtered_data.xlsx", index=False)

它的优势场景很明显：

需要进行快速的数据清洗、统计分析或可视化。
处理的数据量较大时，pandas 的性能通常优于直接操作单元格的库。

3. 处理旧版.xls文件（xlrd+xlwt）

偶尔还会遇到老旧的 .xls 文件，这时候就需要这对“老搭档”了。

安装命令如下：

pip install xlrd xlwt

一个读写示例：

import xlrd
import xlwt

# 读取.xls文件
old_wb = xlrd.open_workbook("old_data.xls")
sheet = old_wb.sheet_by_index(0)  # 通过索引获取第一个工作表
print(sheet.cell_value(0, 0))  # 读取第1行第1列（即A1）的值

# 写入.xls文件
new_wb = xlwt.Workbook()
new_sheet = new_wb.add_sheet("Sheet1")
new_sheet.write(0, 0, "Python写入.xls")  # 在第1行第1列写入内容
new_wb.sa ve("new_old_file.xls")

需要特别注意：

xlrd 从 2.0.0 版本开始，为了安全考虑，移除了对 .xlsx 格式的支持，现在它只专攻 .xls。
所以，如果你要处理的是 .xlsx 文件，还是建议用回 openpyxl 或 pandas。

四、常见问题与解决方案

在实际操作中，你可能会碰到一些小麻烦。别担心，这里有几个典型问题的排查思路。

问题一： 用 pandas 读取Excel时，报错 XLRDError。

原因分析： 这很可能是因为你安装了新版的 xlrd (2.0+)，它已经不再支持 .xlsx 文件了。

解决方案：
方案A：将 xlrd 降级到 1.2.0 版本：pip install xlrd==1.2.0
方案B（更推荐）：在 pandas 读取时指定使用 openpyxl 引擎：pd.read_excel("file.xlsx", engine="openpyxl")

问题二： 需要处理的Excel文件特别大，内存吃不消怎么办？

实用建议：
可以尝试使用 pandas 的 chunksize 参数进行分块读取，像处理流数据一样。
或者，先将Excel文件转换为CSV格式进行处理，速度会快很多，内存压力也小。

问题三： 用Python操作后，如何保留原Excel文件里的公式和复杂的单元格格式？

解决之道： 如果你的操作涉及公式和样式，那么 openpyxl 或 xlsxwriter 是你的不二之选，它们对这两者的支持非常完善。

五、总结

走完这一趟，我们可以得出几条清晰的行动指南：

如果你只想简单地读写数据，进行常规分析，pandas 是最优雅高效的选择，openpyxl 作为备选。
如果你的任务涉及修改单元格样式、颜色、字体，或者需要处理公式，那么 openpyxl 或 xlsxwriter 更能满足需求。
如果不得不面对遗留的旧版 .xls 文件，那就请出 xlrd 和 xlwt 这对组合。

说到底，用Python解析Excel的核心价值在于自动化和灵活性。它将你从繁琐的手工操作中解放出来，无论是大规模的数据清洗、复杂分析还是定制化报表生成，效率都能得到质的提升。

如果你想继续深入：

可以尝试用 pandas 做数据分析，再搭配 matplotlib 或 seaborn 库将结果可视化，形成完整的数据分析闭环。
也可以深入研究 openpyxl 的高级功能，比如合并单元格、设置条件格式、创建图表等，制作出更专业的报表。

优化建议

为了让学习效果更直观，或者内容更贴近实际，你还可以考虑：

添加截图：在关键步骤前后，展示Excel文件的变化对比，一目了然。
视频教程：将操作过程录制成短视频，嵌入到教程中，适合视觉学习者。
案例扩展：结合具体的业务场景，比如销售数据的月度汇总分析、员工考勤表的自动化处理，让教程更有代入感。
性能对比：实际测试一下，用不同库处理十万、百万行数据时，速度和内存占用究竟有多少差异，数据会说话。

来源：https://www.jb51.net/python/362872nc1.htm

Python

上一篇一名编程小白的编程学习计划 下一篇Python字典的键值对结构与增删改查操作详解

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。