游乐游手机版
首页/业界动态/文章详情

MySQL 导入数据后导致 SQL 性能下降

时间:2026-04-15 18:36
一、被关闭的自动统计数据收集 先来聊聊MySQL 8 0的统计信息机制。默认情况下,它启用了持久化统计(innodb_stats_persistent=ON)。这意味着表的行数、索引大小这些关键信息,不仅会放在内存里(比如table->stat_n_rows),还会被固化到mysql innodb_

一、被关闭的自动统计数据收集

先来聊聊MySQL 8.0的统计信息机制。默认情况下,它启用了持久化统计(innodb_stats_persistent=ON)。这意味着表的行数、索引大小这些关键信息,不仅会放在内存里(比如table->stat_n_rows),还会被固化到mysql.innodb_table_statsmysql.innodb_index_stats这两张系统表中。正常情况下,内存和表里的数据是同步的:先改内存,再落盘;重启后,再用表里的数据来初始化内存。

但这里有个暗坑:mysqldump操作可能会打破这种同步,甚至损坏系统表中的统计信息。

通常,当表的数据修改量超过当前统计行数的十分之一时,InnoDB会触发后台线程自动重新收集统计信息。然而,在特定场景下,MySQL会通过执行/*!50606 SET GLOBAL INNODB_STATS_AUTO_RECALC=OFF */关闭这个自动收集功能。这样一来,导入数据时,无论插入多少行,都不会触发统计更新。

那么,什么场景会触发这个“关闭”操作呢?主要就两点:

  • 导出的数据库包含了mysql系统库。
  • 导出时使用了--all-databases参数(这是主要原因)。

因为--all-databases必然会包含存放统计信息的mysql.innodb_table_statsmysql.innodb_index_stats表。

MySQL源码中有一个名为is_innodb_stats_tables_included的函数,正是用来定义和判断这种行为的。为了验证,我们借助了一些代码分析工具,输入提示词:“请帮我找到is_innodb_stats_tables_included函数,并且分析其调用方式和作用”。结果很明确,如下图所示(在trae auto model模式下分析所得)。未来或许可以考虑用更智能的Agent来辅助代码分析,这也不失为一种高效的方法。

\

而问题的根源,恰恰就在这里。正是这个机制,导致了统计信息的丢失。我们接着往下分析。

二、统计信息丢失

统计信息丢失发生在两个层面:内存中的信息和持久化到表中的信息。它们双双“失灵”了。

第一,内存信息失效。虽然导入的SQL文件里包含了innodb_table_stats表的旧数据,但SQL语句执行时,优化器依赖的是table->stat_n_rows这个内存值。由于前面提到的自动收集功能被关闭了,这个内存值在数据导入过程中得不到更新。通过调试器(gdb)可以看到,prebuilt->table->stat_n_rows的值变成了0。

第二,持久化信息被覆盖。整个导入过程可以拆解为:先DROP TABLE,再CREATE TABLE,然后INSERT数据。问题出在CREATE TABLE这一步——它会覆盖innodb_table_stats表中对应表的现有记录。于是,持久化的统计信息在表刚重建完时就被清零了。紧接着,虽然插入了大量数据,但因为自动收集被关闭,系统不会去重新计算。最终结果就是:数据导完了,但innodb_table_stats表里却留下了大量值为0的记录,统计信息完全缺失。

三、测试

口说无凭,我们实际测试一下。分别在MySQL 8.0.23和8.0.41版本中进行,结果一致。重点关注测试库mytest的统计信息变化。

导入前,统计信息是正常的:

mysql> desc select count(*) from mytest ;
+----+-------------+--------+------------+-------+---------------+------+---------+------+-------+----------+-------------+
| id | select_type | table  | partitions | type  | possible_keys | key  | key_len | ref  | rows  | filtered | Extra       |
+----+-------------+--------+------------+-------+---------------+------+---------+------+-------+----------+-------------+
|  1 | SIMPLE      | mytest | NULL       | index | NULL          | id   | 5       | NULL | 65920 |   100.00 | Using index |
+----+-------------+--------+------------+-------+---------------+------+---------+------+-------+----------+-------------+
1 row inset, 1 warning (0.00 sec)

(gdb) p prebuilt->table->stat_n_rows
$3 = 65920

mysql> select * from mysql.innodb_table_stats;
+---------------+---------------+---------------------+--------+----------------------+--------------------------+
| database_name | table_name    | last_update         | n_rows | clustered_index_size | sum_of_other_index_sizes |
+---------------+---------------+---------------------+--------+----------------------+--------------------------+
...| stattest      | mytest        | 2025-06-06 15:22:09 |  65920 |                  161 |                       97 |...
+---------------+---------------+---------------------+--------+----------------------+--------------------------+

可以看到,内存值(65920)和持久化表中的值(65920)是同步的。

导入后,问题出现了:

mysql> desc select count(*) from mytest ;
+----+-------------+--------+------------+-------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table  | partitions | type  | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+--------+------------+-------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | mytest | NULL       | index | NULL          | id   | 5       | NULL |    1 |   100.00 | Using index |
+----+-------------+--------+------------+-------+---------------+------+---------+------+------+----------+-------------+
1 row inset, 1 warning (0.00 sec)

(gdb) p prebuilt->table->stat_n_rows
$4 = 0

mysql> select * from mysql.innodb_table_stats;
+---------------+---------------+---------------------+--------+----------------------+--------------------------+
| database_name | table_name    | last_update         | n_rows | clustered_index_size | sum_of_other_index_sizes |
+---------------+---------------+---------------------+--------+----------------------+--------------------------+
...| stattest      | mytest        | 2025-06-06 07:00:06 |      0 |                    1 |                        1 |      ...

执行计划估算的行数变成了1(实际应为65920),内存统计值变成了0,持久化表中的n_rows也变成了0。统计信息彻底丢失了。

四、bug和建议

这个问题的潜在影响面其实挺广的,值得警惕。MySQL官方已将其确认为一个Bug,编号为:https://bugs.mysql.com/bug.php?id=98178。受影响的版本包括5.6、5.7和8.0系列。

那么,如何规避和解决呢?这里有几个建议:

A. 预防措施: 导出数据时,尽量避免使用--all-databases参数。只导出你真正需要的业务数据库,从根本上避免触发这个机制。

B. 事后检查: 数据导入新库后,务必检查mysql.innodb_table_statsmysql.innodb_index_stats这两张表。如果发现大量表的统计行数(n_rows)为0或异常小,可以考虑重启一次数据库实例。重启后,确认参数innodb_stats_auto_recalc是否为ON

C. 补救方案: 如果不幸已经中招,数据导入后出现了慢查询,最直接有效的办法就是立即手动触发全库的统计信息收集。执行命令:ANALYZE TABLE 表名; 对于受影响的表逐一处理,或者编写脚本批量处理。

来源:https://www.51cto.com/article/840211.html
上一篇重塑 iPhone 摄影,重构手机摄影创作体验 ——PGYTECH 发布 RetroVa 复古影像套装 下一篇vivo蓝图调色盘功能OTA计划公布,本月内下放至首批机型
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
中关村论坛年会AI未来论坛聚焦跃迁投资共生
业界动态 · 2026-06-30

中关村论坛年会AI未来论坛聚焦跃迁投资共生

3月30日,中关村国际创新中心成为人工智能领域瞩目的焦点——2026中关村论坛年会人工智能主题日的重要活动“AI未来论坛:跃迁·投资·共生”在此正式拉开帷幕。本次论坛传递出一个清晰的信号:人工智能正从技术突破迈向产业落地的关键阶段,而资本信心的背后,映射出产业演进的明确风向。海淀区明确表态,将以开放

泰国CP AXTRA与菜鸟合作复制中国闪购模式
业界动态 · 2026-06-30

泰国CP AXTRA与菜鸟合作复制中国闪购模式

3月27日,菜鸟集团与泰国正大集团旗下核心零售企业CP AXTRA正式签署战略合作协议。此次合作的核心目标十分明确:菜鸟将充分发挥自身在数字供应链技术、仓储自动化领域的技术优势,以及多年深耕海外仓的运营经验,全力支持CP AXTRA在泰国及东盟国家打造一套线上线下一体化的即时零售物流网络。 CP A

云英谷科技VTDR6135参评SID中国区显示行业奖
业界动态 · 2026-06-30

云英谷科技VTDR6135参评SID中国区显示行业奖

云英谷科技携国内首颗支持1 5KRealRGB显示的AMOLED驱动芯片VTDR6135参评SID中国区显示行业奖。该芯片已量产并用于高端手机,采用28nm制程,支持240Hz刷新率,集成自研APDBI技术与烧屏补偿机制。在ICDT2026大会C06展位展示。

马斯克警告柏林工厂扩张受外部干预需保自主
业界动态 · 2026-06-30

马斯克警告柏林工厂扩张受外部干预需保自主

3月1日消息,特斯拉CEO埃隆·马斯克向柏林工厂的员工传递了一个信号:如果工厂无法在“不受外界干扰”的环境下自主运转,那么后续的扩建计划可能需要延后。这番话源自一段提前录制的视频,由马斯克在得克萨斯州奥斯汀与格伦海德工厂厂长安德烈·蒂里格共同完成录制,随后在柏林超级工厂内部播放给员工观看。 这段视频

高通钱堃博鳌谈构建用户中心智能生态
业界动态 · 2026-06-30

高通钱堃博鳌谈构建用户中心智能生态

高通钱堃指出,AI正重塑人机交互,2026年称为智能体之年。6G被设计为AI原生系统,2026年为标准化关键年,高通已与近60家伙伴达成共识。高通构建以用户为中心的智能生态系统,通过端-边-云协同架构,结合5G 6G技术,并推出AI加速计划,推动个人、物理、工业AI规模化应用。