如何正确重命名Pandas DataFrame的列名:解决“can‘t set attribute ’columns‘”错误

在Pandas中直接通过赋值df.columns = [...]修改列名时,若遇到“can‘t set attribute ’columns‘”错误,通常表明当前DataFrame的列属性为只读。本文提供官方推荐的解决方案,即使用.rename()方法并配合inplace=True参数,或通过创建副本确保列名可修改,从而高效完成DataFrame列名重命名。
在Python的Pandas数据分析中,直接为df.columns属性赋予新的列表来修改列名,是一种常见的操作。然而,当程序抛出“AttributeError: can‘t set attribute ’columns‘”错误时,意味着此路不通。这通常是因为你操作的DataFrame其columns属性处于只读(read-only)模式。这种情况多见于DataFrame作为某个数据源的不可变视图(immutable view),例如源自特定的数据库查询结果、由Dask DataFrame转换而来,或在执行了某些操作(如访问.values属性)后触发了内部保护机制。
✅ 首选解决方案:使用 .rename(columns=..., inplace=True)
当直接赋值遭遇阻碍时,最可靠且兼容性最佳的方案是调用Pandas内置的.rename()方法。该方法语义清晰,是官方推荐的重命名方式,能有效规避底层属性的只读限制。
import pandas as pd
# 示例数据(100列可同理处理)
data = pd.DataFrame({f"col_{i}": range(5) for i in range(100)})
# 构建新列名列表(例如按规则生成)
new_columns = [f"ide_ads", "ide_any", "ide_sfdsdf"] + [f"col_{i}_renamed" for i in range(3, 100)]
# 方式1:尝试直接赋值(如果报错,则说明columns不可写)
# data.columns = new_columns # ❌ 若此处报错,则跳至方式2
# 方式2:使用 rename() —— 兼容性最强,始终有效
column_mapping = {old: new for old, new in zip(data.columns, new_columns)}
data.rename(columns=column_mapping, inplace=True)
⚠️ 操作时需要注意的细节
- 原地修改 vs 创建副本:设置
inplace=True会直接修改原DataFrame。若希望保留原始数据,可省略此参数并将结果赋给新变量,如data_renamed = data.rename(columns=...)。 - 长度必须一致:无论是直接赋值还是调用
rename,提供的新列名列表长度必须与原始列数完全一致,否则将引发ValueError。 - 警惕重复列名:
rename()方法允许处理重复列名,但直接赋值产生的重复列名可能导致后续的.groupby()等聚合操作失败。 - 检查数据来源:若DataFrame来源于
pd.read_sql()、dask.dataframe.to_pandas()或浅拷贝(.copy(deep=False)),建议先执行data = data.copy()创建独立副本,再尝试修改列名,这能有效解除潜在的只读约束。
