游乐游手机版
首页/编程语言/文章详情

Python如何覆盖与追加Excel文件数据

时间:2026-05-11 08:28
Python处理Excel文件时,覆盖写入和追加写入是常见需求。覆盖写入可使用pandas的to_excel方法或openpyxl创建新工作簿实现,直接替换原文件。追加写入分为在现有工作表末尾追加行和新增工作表两种情况。前者推荐使用openpyxl直接定位追加,高效且安全;后者可通过pandas的ExcelWriter在追加模式下完成,保留原有工作表。

在Python数据分析工作中,Excel文件的读写操作是基础且频繁的任务。其中,覆盖写入与追加写入是两种最常见的需求场景。本文将系统讲解如何使用Python高效实现这两种操作,并分享不同应用场景下的最佳实践方案。

python实现对excel的覆盖和追加操作

实现方式上,开发者主要可选择使用pandas库或openpyxl库。两者各有优势:pandas适合数据处理,openpyxl提供更精细的控制。下面通过具体代码示例详细说明。

一、覆盖写入(清空原文件内容,写入全新数据)

覆盖写入指每次执行代码时,目标文件中的原有数据会被完全替换为新内容。这种方法适用于生成全新报告或更新整个数据集的场景。

1.1 使用 pandas 实现覆盖写入

对于习惯使用pandas进行数据处理的开发者,这是最便捷的方法。DataFrameto_excel方法默认即为覆盖模式。

import pandas as pd
# 创建示例数据
data = {
    '姓名': ['张三', '李四', '王五'],
    '分数': [85, 92, 78]
}
df = pd.DataFrame(data)
# 覆盖写入(如果文件已存在会被覆盖)
df.to_excel('成绩表.xlsx', index=False, sheet_name='Sheet1')
print("覆盖写入完成")

代码简洁高效,一行to_excel即可完成。但需注意:如果原文件包含多个工作表,此方法会仅保留指定的Sheet1,其他所有工作表都将丢失

1.2 使用 openpyxl 实现覆盖写入

如需更精细控制或避免引入pandas,可直接使用openpyxl创建新工作簿并保存,同样实现覆盖效果。

from openpyxl import Workbook

# 创建新工作簿
wb = Workbook()
ws = wb.active
ws.title = "Sheet1"

# 写入表头和数据
ws.append(['姓名', '分数'])
ws.append(['张三', 85])
ws.append(['李四', 92])
ws.append(['王五', 78])

# 保存(覆盖)
wb.sa ve('成绩表.xlsx')
print("覆盖写入完成")

此方法同样创建全新文件。若成绩表.xlsx已存在,其所有内容(包括其他工作表)将被清空替换。

二、追加写入(保留原有数据,在末尾添加新行或新工作表)

追加写入需求更为复杂,主要分为两类:

  • 在现有工作表末尾追加新行:不破坏原有数据,仅续写内容。
  • 在同一文件中新增工作表:保留所有旧工作表,添加新Sheet。

2.1 使用 pandas + openpyxl 在现有工作表末尾追加行

pandasto_excel方法未提供直接的“追加行”参数,需通过其他方式实现。

方法一:先读取后合并再写入(适合数据量较小的情况)

核心思路:先读取旧数据,将其与新数据合并为新DataFrame,再一次性写回文件。这本质仍是覆盖写入,但覆盖内容为“旧数据+新数据”。

import pandas as pd
from openpyxl import load_workbook
# 原有文件路径
file_path = '成绩表.xlsx'
# 读取原有数据
try:
    df_old = pd.read_excel(file_path, sheet_name='Sheet1')
except FileNotFoundError:
    df_old = pd.DataFrame(columns=['姓名', '分数'])  # 如果文件不存在则创建空DataFrame
# 新数据
new_data = pd.DataFrame({'姓名': ['赵六', '小明'], '分数': [88, 95]})
# 合并
df_new = pd.concat([df_old, new_data], ignore_index=True)
# 写回文件(覆盖原文件,实际是替换整个内容)
df_new.to_excel(file_path, index=False, sheet_name='Sheet1')
print("追加写入完成")

此方法对小文件便捷,但若Excel文件较大或需频繁追加,反复读写整个文件将产生明显性能开销。

方法二:使用 openpyxl 直接追加(更高效,推荐)

openpyxl的优势在此凸显:可加载现有工作簿,直接定位到工作表末尾追加,完全不影响文件其他部分。

from openpyxl import load_workbook

file_path = '成绩表.xlsx'

# 加载工作簿
try:
    wb = load_workbook(file_path)
except FileNotFoundError:
    wb = Workbook()
ws = wb.active
if ws.title != 'Sheet1':
    ws.title = "Sheet1"

# 追加数据(假设已有表头,直接从下一行开始写)
new_rows = [
    ['赵六', 88],
    ['小明', 95]
]
for row in new_rows:
    ws.append(row)

wb.sa ve(file_path)
print("追加写入完成")

此方法高效安全,是追加行操作的首选方案。它不会影响其他工作表,性能远优于“先读后合再写”方式。

2.2 在现有 Excel 文件中新增工作表(不影响原有工作表)

如需添加全新工作表,可使用pandasExcelWriter在追加模式下优雅完成。

import pandas as pd
from openpyxl import load_workbook
file_path = '成绩表.xlsx'
# 新数据
df_new_sheet = pd.DataFrame({'科目': ['数学', '语文', '英语'], '成绩': [95, 88, 92]})
# 方法一:使用 pandas 的 ExcelWriter 添加新工作表
with pd.ExcelWriter(file_path, engine='openpyxl', mode='a', if_sheet_exists='replace') as writer:
    df_new_sheet.to_excel(writer, sheet_name='其他科目', index=False)
print("已新增工作表")

关键参数:mode='a'(追加模式)和engine='openpyxl'if_sheet_exists='replace'表示若存在同名工作表则替换;可设置为'new'避免覆盖。

三、核心操作总结与选择建议

为方便选择,将几种核心操作特点总结如下:

操作推荐方法特点
覆盖写入pd.DataFrame.to_excel()openpyxl.Workbook().sa ve()最简单,直接替换原文件
追加行openpyxlworksheet.append()不破坏原文件其他内容,性能较好
新增工作表pd.ExcelWriter(mode='a')保留原有工作表,添加新的 Sheet
完整追加(合并)pd.concat() + to_excel()适合少量数据,会重写整个文件

总体而言,若需频繁、大量执行追加行操作,直接使用openpyxl是性能最佳选择,可避免反复读写整个文件的开销。

四、综合应用示例

最后,通过一个综合示例演示如何结合覆盖与追加,灵活管理Excel文件中的多个工作表。

from openpyxl import Workbook, load_workbook

# 定义文件名和工作表名
filename = r"C:\Users\Administrator\Downloads\example.xlsx"

# 第一次写入(创建文件并写入两个sheet)
def first_write():
    # 加载或创建新工作簿
    try:
        wb = load_workbook(filename)
    except FileNotFoundError:
        wb = Workbook()
        wb.remove(wb.active)

    # 检查并删除已存在的 "作者" 工作表(如果存在)
    if "机构" in wb.sheetnames:
        del wb["机构"]
    sheet1 = wb.create_sheet("机构")
    for row in data1:
        sheet1.append(row)
    
    # 检查并删除已存在的 "作者" 工作表(覆盖/新建sheet)
    if "作者" in wb.sheetnames:
        del wb["作者"]
    sheet2 = wb.create_sheet("作者")
    for row in data2:
        sheet2.append(row)
    
    wb.sa ve(filename)

# 第二次写入(追加sheet)
def second_write():
    # 加载已存在的文件
    wb = load_workbook(filename)

    # 检查 "作者" 工作表是否存在,如果存在则获取它,否则创建一个新的
    if "作者" in wb.sheetnames:
        sheet2 = wb["作者"]
    else:
        sheet2 = wb.create_sheet("作者")
    for row in data3:
        sheet2.append(row)
    
    wb.sa ve(filename)

# 数据定义
data2 = [
    ['Header1', 'Header2', 'Header3'],
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

data1 = [
    ['Header11', 'Header12', 'Header13'],
    [11, 2, 3],
    [41, 5, 6],
    [71, 8, 9]
]

data3 = [
    [21, 2, 3],
    [42, 5, 6],
    [73, 8, 9]
]

# 执行写入操作
first_write()  # 首次写入
second_write() # 覆盖写入

此示例清晰展示了如何利用openpyxl检查、删除、创建和追加工作表,实现对Excel文件结构的复杂控制。掌握这些基本模式,即可应对绝大多数Python操作Excel的读写需求。

来源:https://www.jb51.net/python/363434zag.htm
上一篇IntelliJ IDEA Python代码提示优化方法与设置教程 下一篇Linux下Rust程序启动速度优化方法与技巧
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
如何在ThinkPHP中实现定时任务与命令行调度方法
编程语言 · 2026-07-04

如何在ThinkPHP中实现定时任务与命令行调度方法

用ThinkPHP实现定时任务时,很多开发者第一步就卡在命令行报错上,直接输入php think your:command却无法识别——这种情况绝大多数是因为命令类的注册方式存在问题。下面先梳理几个核心要点。 ThinkPHP 6 中 think 命令如何正确触发自定义指令 直接运行 php thi

ThinkPHP API接口防重放攻击实现方法
编程语言 · 2026-07-04

ThinkPHP API接口防重放攻击实现方法

先说几个核心判断:API防重放攻击这件事,做对了是道防火墙,做错了就是个心理安慰。很多开发者到踩坑了才明白——验签这东西,放错位置、漏掉字段、存错nonce,每一环都能让整个安全体系直接归零。 验签必须放在中间件里,不能在控制器里写 ThinkPHP 的请求生命周期中,中间件是唯一能在路由匹配、参数

ThinkPHP文件上传必须验证扩展名安全必要性分析
编程语言 · 2026-07-04

ThinkPHP文件上传必须验证扩展名安全必要性分析

在使用ThinkPHP进行文件上传时,ext扩展名验证通常是开发者首先接触的关键环节。但你真的了解它的实际工作原理吗?它仅比对文件名后缀,而不读取文件内容,甚至对空格和大小写都极其敏感。更为重要的是——它是TP文件上传验证五层防线中不可忽视的第一道关卡,一旦配置遗漏,整个validate验证链将直接

ThinkPHP关联模型自动写入与更新使用教程
编程语言 · 2026-07-04

ThinkPHP关联模型自动写入与更新使用教程

需要明确的是,ThinkPHP关联模型并没有提供所谓的“自动写入 更新”魔法开关。所谓的“自动”功能,实际上都需要开发者手动编写配置逻辑才能生效。核心原则在于:主模型和从模型必须分开独立处理,时间戳字段和业务字段需依靠修改器或钩子接管;批量操作则要规规矩矩地绕过模型逻辑来执行——只有理解透彻这些要点

BoxLayout中仅居中一个组件其他默认左对齐
编程语言 · 2026-07-04

BoxLayout中仅居中一个组件其他默认左对齐

在 Java Swing 中使用 BoxLayout 的 Y_AXIS 方向布局时,很多初学者容易掉进一个常见陷阱:希望将某个组件单独设置为中心对齐,但当调用 `setAlignmentX(CENTER_ALIGNMENT)` 后,却发现其他组件也跟着发生了偏移,完全达不到预期效果。实际上,关键之处