在MySQL 5.5及更早的版本中,为上亿级别的大表执行新增字段这类DDL操作时,整个过程会锁定整张表。锁表时间甚至可能长达数小时,这直接导致所有DML操作(如SELECT、INSERT、UPDATE、DELETE语句)被阻塞,严重影响线上业务。
兄弟们,面试官要是再问你“MySQL上亿大表,如何新增字段”,你就可以果断地告诉他:现在直接新增就行,不用扯那些没用的!
我来解释一下为什么现在可以这么硬气。
过去,在MySQL 5.5及之前的版本里,处理大表结构变更确实是个大麻烦。因为整个过程是锁表的,不仅操作时间长,还会完全阻塞正常的增删改查。
如果业务要求7×24小时不间断运行,不允许停机维护,那就不得不借助像pt-online-schema-change(Percona Toolkit)这样的工具来实现无锁新增字段了。它的核心原理是“影子表+触发器+分批拷贝”,能在全程不阻塞读写的情况下完成变更。
但到了MySQL 5.6及以上版本,情况就不同了,官方引入了在线DDL技术。它使得MySQL在执行大规模表结构变更(包括新增字段)时,能够尽量减少对表的锁定,允许DML操作并发进行,从而极大提升了服务的可用性。
那么MySQL 5.6版本是什么时候发布的呢?2013年,距今已经12年了。整整12年了啊,难道面试官还活在上个世纪吗?
我们把话题说回来,在线DDL可以通过以下方式进行配置。
图片
其中,`ALGORITHM=INPLACE` 表示对表结构进行原地修改,操作直接在原表数据上进行,无需创建临时表或复制数据。这种方式可以避免因数据拷贝带来的额外存储空间消耗和I/O压力,显著提升操作效率。
`LOCK=NONE` 则表示在执行DDL(如新增字段)操作时,不会阻塞并发的DML操作(如SELECT、INSERT、UPDATE、DELETE等),几乎不影响线上业务的正常运行。
更重要的是,到了MySQL 8.0版本,官方对在线DDL进行了大幅优化,主要包括以下几点:
1、这是MySQL 8.0最为核心的一项优化,那就是在亿级数据表中新增 NOT NULL 约束+带有默认值的字段,其耗时从之前的“小时级”优化到了“秒级”。
其原理在于,在MySQL 5.6中必须使用`ALGORITHM=COPY`(即全表拷贝)的方式,逐行为每条记录写入默认值,亿级表的操作耗时可达小时级;整个过程需要加上表级写锁,业务的读写操作被完全阻塞,必须在停机窗口执行;而且拷贝全表数据会导致磁盘 I/O 暴增,极易引发数据库性能雪崩。
而在MySQL 8.0中,支持在该场景下使用`ALGORITHM=INPLACE`,仅修改元数据字典(默认值存储在字典中,不更新历史数据),秒级即可完成;历史数据在读取时会动态返回默认值,无需逐行更新,彻底避免了全表拷贝。
2、原子DDL特性。MySQL 8.0 引入了原子 DDL,确保新增DDL操作要么完全成功,要么完全回滚,不会留下中间状态。
3、锁机制优化,实现更精细的锁粒度,彻底避免业务阻塞。在MySQL 5.6版本中,即使新增 NULL 字段指定`LOCK=NONE`,仍会在 DDL 启动、结束阶段加短暂的表级读锁,导致写操作排队。
而在MySQL 8.0版本中,仅在“元数据校验阶段”加毫秒级元数据锁,执行阶段完全释放,读写操作无感知;并将锁粒度从“表级”降至“列级”,新增字段仅影响目标列,不阻塞其他列的读写。
