游乐游手机版
首页/编程语言/文章详情

Python如何覆盖与追加Excel文件数据

时间:2026-05-11 08:28
Python处理Excel文件时,覆盖写入和追加写入是常见需求。覆盖写入可使用pandas的to_excel方法或openpyxl创建新工作簿实现,直接替换原文件。追加写入分为在现有工作表末尾追加行和新增工作表两种情况。前者推荐使用openpyxl直接定位追加,高效且安全;后者可通过pandas的ExcelWriter在追加模式下完成,保留原有工作表。

在Python数据分析工作中,Excel文件的读写操作是基础且频繁的任务。其中,覆盖写入与追加写入是两种最常见的需求场景。本文将系统讲解如何使用Python高效实现这两种操作,并分享不同应用场景下的最佳实践方案。

python实现对excel的覆盖和追加操作

实现方式上,开发者主要可选择使用pandas库或openpyxl库。两者各有优势:pandas适合数据处理,openpyxl提供更精细的控制。下面通过具体代码示例详细说明。

一、覆盖写入(清空原文件内容,写入全新数据)

覆盖写入指每次执行代码时,目标文件中的原有数据会被完全替换为新内容。这种方法适用于生成全新报告或更新整个数据集的场景。

1.1 使用 pandas 实现覆盖写入

对于习惯使用pandas进行数据处理的开发者,这是最便捷的方法。DataFrameto_excel方法默认即为覆盖模式。

import pandas as pd
# 创建示例数据
data = {
    '姓名': ['张三', '李四', '王五'],
    '分数': [85, 92, 78]
}
df = pd.DataFrame(data)
# 覆盖写入(如果文件已存在会被覆盖)
df.to_excel('成绩表.xlsx', index=False, sheet_name='Sheet1')
print("覆盖写入完成")

代码简洁高效,一行to_excel即可完成。但需注意:如果原文件包含多个工作表,此方法会仅保留指定的Sheet1,其他所有工作表都将丢失

1.2 使用 openpyxl 实现覆盖写入

如需更精细控制或避免引入pandas,可直接使用openpyxl创建新工作簿并保存,同样实现覆盖效果。

from openpyxl import Workbook

# 创建新工作簿
wb = Workbook()
ws = wb.active
ws.title = "Sheet1"

# 写入表头和数据
ws.append(['姓名', '分数'])
ws.append(['张三', 85])
ws.append(['李四', 92])
ws.append(['王五', 78])

# 保存(覆盖)
wb.sa ve('成绩表.xlsx')
print("覆盖写入完成")

此方法同样创建全新文件。若成绩表.xlsx已存在,其所有内容(包括其他工作表)将被清空替换。

二、追加写入(保留原有数据,在末尾添加新行或新工作表)

追加写入需求更为复杂,主要分为两类:

  • 在现有工作表末尾追加新行:不破坏原有数据,仅续写内容。
  • 在同一文件中新增工作表:保留所有旧工作表,添加新Sheet。

2.1 使用 pandas + openpyxl 在现有工作表末尾追加行

pandasto_excel方法未提供直接的“追加行”参数,需通过其他方式实现。

方法一:先读取后合并再写入(适合数据量较小的情况)

核心思路:先读取旧数据,将其与新数据合并为新DataFrame,再一次性写回文件。这本质仍是覆盖写入,但覆盖内容为“旧数据+新数据”。

import pandas as pd
from openpyxl import load_workbook
# 原有文件路径
file_path = '成绩表.xlsx'
# 读取原有数据
try:
    df_old = pd.read_excel(file_path, sheet_name='Sheet1')
except FileNotFoundError:
    df_old = pd.DataFrame(columns=['姓名', '分数'])  # 如果文件不存在则创建空DataFrame
# 新数据
new_data = pd.DataFrame({'姓名': ['赵六', '小明'], '分数': [88, 95]})
# 合并
df_new = pd.concat([df_old, new_data], ignore_index=True)
# 写回文件(覆盖原文件,实际是替换整个内容)
df_new.to_excel(file_path, index=False, sheet_name='Sheet1')
print("追加写入完成")

此方法对小文件便捷,但若Excel文件较大或需频繁追加,反复读写整个文件将产生明显性能开销。

方法二:使用 openpyxl 直接追加(更高效,推荐)

openpyxl的优势在此凸显:可加载现有工作簿,直接定位到工作表末尾追加,完全不影响文件其他部分。

from openpyxl import load_workbook

file_path = '成绩表.xlsx'

# 加载工作簿
try:
    wb = load_workbook(file_path)
except FileNotFoundError:
    wb = Workbook()
ws = wb.active
if ws.title != 'Sheet1':
    ws.title = "Sheet1"

# 追加数据(假设已有表头,直接从下一行开始写)
new_rows = [
    ['赵六', 88],
    ['小明', 95]
]
for row in new_rows:
    ws.append(row)

wb.sa ve(file_path)
print("追加写入完成")

此方法高效安全,是追加行操作的首选方案。它不会影响其他工作表,性能远优于“先读后合再写”方式。

2.2 在现有 Excel 文件中新增工作表(不影响原有工作表)

如需添加全新工作表,可使用pandasExcelWriter在追加模式下优雅完成。

import pandas as pd
from openpyxl import load_workbook
file_path = '成绩表.xlsx'
# 新数据
df_new_sheet = pd.DataFrame({'科目': ['数学', '语文', '英语'], '成绩': [95, 88, 92]})
# 方法一:使用 pandas 的 ExcelWriter 添加新工作表
with pd.ExcelWriter(file_path, engine='openpyxl', mode='a', if_sheet_exists='replace') as writer:
    df_new_sheet.to_excel(writer, sheet_name='其他科目', index=False)
print("已新增工作表")

关键参数:mode='a'(追加模式)和engine='openpyxl'if_sheet_exists='replace'表示若存在同名工作表则替换;可设置为'new'避免覆盖。

三、核心操作总结与选择建议

为方便选择,将几种核心操作特点总结如下:

操作推荐方法特点
覆盖写入pd.DataFrame.to_excel()openpyxl.Workbook().sa ve()最简单,直接替换原文件
追加行openpyxlworksheet.append()不破坏原文件其他内容,性能较好
新增工作表pd.ExcelWriter(mode='a')保留原有工作表,添加新的 Sheet
完整追加(合并)pd.concat() + to_excel()适合少量数据,会重写整个文件

总体而言,若需频繁、大量执行追加行操作,直接使用openpyxl是性能最佳选择,可避免反复读写整个文件的开销。

四、综合应用示例

最后,通过一个综合示例演示如何结合覆盖与追加,灵活管理Excel文件中的多个工作表。

from openpyxl import Workbook, load_workbook

# 定义文件名和工作表名
filename = r"C:\Users\Administrator\Downloads\example.xlsx"

# 第一次写入(创建文件并写入两个sheet)
def first_write():
    # 加载或创建新工作簿
    try:
        wb = load_workbook(filename)
    except FileNotFoundError:
        wb = Workbook()
        wb.remove(wb.active)

    # 检查并删除已存在的 "作者" 工作表(如果存在)
    if "机构" in wb.sheetnames:
        del wb["机构"]
    sheet1 = wb.create_sheet("机构")
    for row in data1:
        sheet1.append(row)
    
    # 检查并删除已存在的 "作者" 工作表(覆盖/新建sheet)
    if "作者" in wb.sheetnames:
        del wb["作者"]
    sheet2 = wb.create_sheet("作者")
    for row in data2:
        sheet2.append(row)
    
    wb.sa ve(filename)

# 第二次写入(追加sheet)
def second_write():
    # 加载已存在的文件
    wb = load_workbook(filename)

    # 检查 "作者" 工作表是否存在,如果存在则获取它,否则创建一个新的
    if "作者" in wb.sheetnames:
        sheet2 = wb["作者"]
    else:
        sheet2 = wb.create_sheet("作者")
    for row in data3:
        sheet2.append(row)
    
    wb.sa ve(filename)

# 数据定义
data2 = [
    ['Header1', 'Header2', 'Header3'],
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

data1 = [
    ['Header11', 'Header12', 'Header13'],
    [11, 2, 3],
    [41, 5, 6],
    [71, 8, 9]
]

data3 = [
    [21, 2, 3],
    [42, 5, 6],
    [73, 8, 9]
]

# 执行写入操作
first_write()  # 首次写入
second_write() # 覆盖写入

此示例清晰展示了如何利用openpyxl检查、删除、创建和追加工作表,实现对Excel文件结构的复杂控制。掌握这些基本模式,即可应对绝大多数Python操作Excel的读写需求。

来源:https://www.jb51.net/python/363434zag.htm
上一篇IntelliJ IDEA Python代码提示优化方法与设置教程 下一篇Linux下Rust程序启动速度优化方法与技巧
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Java序列化中ObjectStreamField自定义字段控制详解
编程语言 · 2026-05-11

Java序列化中ObjectStreamField自定义字段控制详解

ObjectStreamField是描述序列化字段的元信息载体。通过声明serialPersistentFields数组并确保字段名、类型、顺序与类定义严格一致,可控制序列化字段。字段不匹配会导致静默反序列化失败。配合writeObject readObject方法可实现动态控制。应避免使用isUnshared、getOffset等底层方法。

实时操作系统RTOS线程调度与Java强实时变量处理对比分析
编程语言 · 2026-05-11

实时操作系统RTOS线程调度与Java强实时变量处理对比分析

实时操作系统(RTOS)通过优先级调度和中断机制确保微秒级确定性,而Java因垃圾回收、同步延迟和内存分配不确定性,难以满足强实时场景的严格时间要求,因此这类系统通常将核心逻辑交由RTOS处理。

Java并行流性能优化CollectorsgroupingByConcurrent方法详解
编程语言 · 2026-05-11

Java并行流性能优化CollectorsgroupingByConcurrent方法详解

Collectors groupingByConcurrent专为无需保持插入顺序、高并发写入的场景设计,能显著提升并行流分组性能。其底层通过所有线程直接写入同一个ConcurrentHashMap,避免了普通groupingBy的合并开销。适用于日志聚合、实时统计等高吞吐任务,但不适用于要求分组顺序的场景。使用时必须搭配并行流,且不支持自定义有序Map。在

循环队列数组实现详解头尾指针操作与取模运算实战指南
编程语言 · 2026-05-11

循环队列数组实现详解头尾指针操作与取模运算实战指南

循环队列通过数组实现,核心在于头尾指针的职责与取模运算。front指向队首,rear指向下一个空位,移动时需取模以确保回环。判空条件为front等于rear,判满则需牺牲一个存储单元。入队和出队操作后需立即取模,避免越界。动态内存管理时需注意分配与释放顺序,防止内存泄漏。

ThinkPHP入口文件配置参数修改与环境变量动态加载指南
编程语言 · 2026-05-11

ThinkPHP入口文件配置参数修改与环境变量动态加载指南

在ThinkPHP框架中动态调整数据库连接等配置参数,是许多开发者实现多环境部署的核心需求。然而,你是否曾遇到这样的困境:在入口文件中修改了配置值,刷新页面后却发现更改并未生效?这通常源于对框架配置加载机制的理解偏差。 本文将深入解析ThinkPHP配置生效的唯一正确路径,帮助你彻底规避“本地测试通