游乐游手机版
首页/业界动态/文章详情

MySQL 导入数据后导致 SQL 性能下降

时间:2026-04-15 18:36
一、被关闭的自动统计数据收集 先来聊聊MySQL 8 0的统计信息机制。默认情况下,它启用了持久化统计(innodb_stats_persistent=ON)。这意味着表的行数、索引大小这些关键信息,不仅会放在内存里(比如table->stat_n_rows),还会被固化到mysql innodb_

一、被关闭的自动统计数据收集

先来聊聊MySQL 8.0的统计信息机制。默认情况下,它启用了持久化统计(innodb_stats_persistent=ON)。这意味着表的行数、索引大小这些关键信息,不仅会放在内存里(比如table->stat_n_rows),还会被固化到mysql.innodb_table_statsmysql.innodb_index_stats这两张系统表中。正常情况下,内存和表里的数据是同步的:先改内存,再落盘;重启后,再用表里的数据来初始化内存。

但这里有个暗坑:mysqldump操作可能会打破这种同步,甚至损坏系统表中的统计信息。

通常,当表的数据修改量超过当前统计行数的十分之一时,InnoDB会触发后台线程自动重新收集统计信息。然而,在特定场景下,MySQL会通过执行/*!50606 SET GLOBAL INNODB_STATS_AUTO_RECALC=OFF */关闭这个自动收集功能。这样一来,导入数据时,无论插入多少行,都不会触发统计更新。

那么,什么场景会触发这个“关闭”操作呢?主要就两点:

  • 导出的数据库包含了mysql系统库。
  • 导出时使用了--all-databases参数(这是主要原因)。

因为--all-databases必然会包含存放统计信息的mysql.innodb_table_statsmysql.innodb_index_stats表。

MySQL源码中有一个名为is_innodb_stats_tables_included的函数,正是用来定义和判断这种行为的。为了验证,我们借助了一些代码分析工具,输入提示词:“请帮我找到is_innodb_stats_tables_included函数,并且分析其调用方式和作用”。结果很明确,如下图所示(在trae auto model模式下分析所得)。未来或许可以考虑用更智能的Agent来辅助代码分析,这也不失为一种高效的方法。

\

而问题的根源,恰恰就在这里。正是这个机制,导致了统计信息的丢失。我们接着往下分析。

二、统计信息丢失

统计信息丢失发生在两个层面:内存中的信息和持久化到表中的信息。它们双双“失灵”了。

第一,内存信息失效。虽然导入的SQL文件里包含了innodb_table_stats表的旧数据,但SQL语句执行时,优化器依赖的是table->stat_n_rows这个内存值。由于前面提到的自动收集功能被关闭了,这个内存值在数据导入过程中得不到更新。通过调试器(gdb)可以看到,prebuilt->table->stat_n_rows的值变成了0。

第二,持久化信息被覆盖。整个导入过程可以拆解为:先DROP TABLE,再CREATE TABLE,然后INSERT数据。问题出在CREATE TABLE这一步——它会覆盖innodb_table_stats表中对应表的现有记录。于是,持久化的统计信息在表刚重建完时就被清零了。紧接着,虽然插入了大量数据,但因为自动收集被关闭,系统不会去重新计算。最终结果就是:数据导完了,但innodb_table_stats表里却留下了大量值为0的记录,统计信息完全缺失。

三、测试

口说无凭,我们实际测试一下。分别在MySQL 8.0.23和8.0.41版本中进行,结果一致。重点关注测试库mytest的统计信息变化。

导入前,统计信息是正常的:

mysql> desc select count(*) from mytest ;
+----+-------------+--------+------------+-------+---------------+------+---------+------+-------+----------+-------------+
| id | select_type | table  | partitions | type  | possible_keys | key  | key_len | ref  | rows  | filtered | Extra       |
+----+-------------+--------+------------+-------+---------------+------+---------+------+-------+----------+-------------+
|  1 | SIMPLE      | mytest | NULL       | index | NULL          | id   | 5       | NULL | 65920 |   100.00 | Using index |
+----+-------------+--------+------------+-------+---------------+------+---------+------+-------+----------+-------------+
1 row inset, 1 warning (0.00 sec)

(gdb) p prebuilt->table->stat_n_rows
$3 = 65920

mysql> select * from mysql.innodb_table_stats;
+---------------+---------------+---------------------+--------+----------------------+--------------------------+
| database_name | table_name    | last_update         | n_rows | clustered_index_size | sum_of_other_index_sizes |
+---------------+---------------+---------------------+--------+----------------------+--------------------------+
...| stattest      | mytest        | 2025-06-06 15:22:09 |  65920 |                  161 |                       97 |...
+---------------+---------------+---------------------+--------+----------------------+--------------------------+

可以看到,内存值(65920)和持久化表中的值(65920)是同步的。

导入后,问题出现了:

mysql> desc select count(*) from mytest ;
+----+-------------+--------+------------+-------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table  | partitions | type  | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+--------+------------+-------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | mytest | NULL       | index | NULL          | id   | 5       | NULL |    1 |   100.00 | Using index |
+----+-------------+--------+------------+-------+---------------+------+---------+------+------+----------+-------------+
1 row inset, 1 warning (0.00 sec)

(gdb) p prebuilt->table->stat_n_rows
$4 = 0

mysql> select * from mysql.innodb_table_stats;
+---------------+---------------+---------------------+--------+----------------------+--------------------------+
| database_name | table_name    | last_update         | n_rows | clustered_index_size | sum_of_other_index_sizes |
+---------------+---------------+---------------------+--------+----------------------+--------------------------+
...| stattest      | mytest        | 2025-06-06 07:00:06 |      0 |                    1 |                        1 |      ...

执行计划估算的行数变成了1(实际应为65920),内存统计值变成了0,持久化表中的n_rows也变成了0。统计信息彻底丢失了。

四、bug和建议

这个问题的潜在影响面其实挺广的,值得警惕。MySQL官方已将其确认为一个Bug,编号为:https://bugs.mysql.com/bug.php?id=98178。受影响的版本包括5.6、5.7和8.0系列。

那么,如何规避和解决呢?这里有几个建议:

A. 预防措施: 导出数据时,尽量避免使用--all-databases参数。只导出你真正需要的业务数据库,从根本上避免触发这个机制。

B. 事后检查: 数据导入新库后,务必检查mysql.innodb_table_statsmysql.innodb_index_stats这两张表。如果发现大量表的统计行数(n_rows)为0或异常小,可以考虑重启一次数据库实例。重启后,确认参数innodb_stats_auto_recalc是否为ON

C. 补救方案: 如果不幸已经中招,数据导入后出现了慢查询,最直接有效的办法就是立即手动触发全库的统计信息收集。执行命令:ANALYZE TABLE 表名; 对于受影响的表逐一处理,或者编写脚本批量处理。

来源:https://www.51cto.com/article/840211.html
上一篇重塑 iPhone 摄影,重构手机摄影创作体验 ——PGYTECH 发布 RetroVa 复古影像套装 下一篇vivo蓝图调色盘功能OTA计划公布,本月内下放至首批机型
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
九号N1机甲风电动车发布 模拟声浪轻量化车架3499元起
业界动态 · 2026-05-29

九号N1机甲风电动车发布 模拟声浪轻量化车架3499元起

九号发布N1机甲风电动车系列,三款起售价3499元。N170极速47km h,轻量化车架;N185极速55km h,可选模拟声浪;旗舰N190极速60km h,标配模拟声浪及双通道ABS,7月上市。

九号2026新品发布会最强阵容连发4款新车重新定义好车标准
业界动态 · 2026-05-29

九号2026新品发布会最强阵容连发4款新车重新定义好车标准

九号公司发布2026年新品,推出N1、M1、M3及Fz5四款新车,覆盖电摩与电自领域。N1主打短轴距声光电酷玩体验,M1配备双通道ABS与100公里真续航,M3下放AXC车架技术,Fz5首搭载双向转把功能。同时推出3年原厂换新质保等用户权益。

世界超级摩托车锦标赛阿拉贡站张雪机车超级杆位赛获亚军
业界动态 · 2026-05-29

世界超级摩托车锦标赛阿拉贡站张雪机车超级杆位赛获亚军

5月29日,世界超级摩托车锦标赛(WSBK)阿拉贡站传来一则引人瞩目的消息——中国摩托车制造商“张雪机车”旗下的法国车手瓦伦丁·德比斯,在WorldSSP组别的超级杆位赛中成功夺得第二名。 先简要科普一下赛事背景:世界超级摩托车锦标赛(WSBK)是由国际摩托车联合会于1988年创立的顶级公路摩托车赛

英雄联盟海克斯大乱斗重大更新 移除羁绊新增技能符文
业界动态 · 2026-05-29

英雄联盟海克斯大乱斗重大更新 移除羁绊新增技能符文

英雄联盟海克斯大乱斗将在26 12版本移除羁绊系统,上线技能符文体系。该符文能重构技能释放逻辑,实现布里茨钩五人、拉克丝定全队等效果。部分原有羁绊效果转为独立专属符文,更新预计2026年6月中旬登陆国服。

领克10/10+正式上市限时价16.99-23.59万号称弯道之王
业界动态 · 2026-05-29

领克10/10+正式上市限时价16.99-23.59万号称弯道之王

```html 5月29日晚间,领克终于将其备受关注的中大型运动纯电轿车正式推向市场——领克10与领克10+同步上市,官方直接打出“弯道之王”的旗号。我们先不深究它是否真能“弯道超车”,单从价格来看,就已经颇具冲击力。 先奉上一张价格速览表,让大家心里有个底: 领克 10 701 长续航 Max:指