详解SQL查询中使用HAVING子句过滤聚合后结果的方法

时间：2026-07-02 08:58

写SQL的时候，HA VING 这个子句看着简单，但实际用起来踩坑的人可不少。先说个核心判断：它是专门用来过滤分组后的聚合结果的，跟 WHERE 完全是两码事。很多人搞混它俩，结果代码跑出来要么报错，要么数据对不上。下面把这几个核心要点拆开来说清楚。 HA VING 必须跟在 GROUP BY 后面

写SQL的时候，HA VING 这个子句看着简单，但实际用起来踩坑的人可不少。先说个核心判断：它是专门用来过滤分组后的聚合结果的，跟 WHERE 完全是两码事。很多人搞混它俩，结果代码跑出来要么报错，要么数据对不上。下面把这几个核心要点拆开来说清楚。

如何在SQL查询中使用HA VING子句过滤聚合后的结果？

HA VING 必须跟在 GROUP BY 后面，不能替代 WHERE

不少人一上来就写 HA VING，直接跟在 SELECT 后面，结果数据库甩回来一个 ERROR: HA VING clause without GROUP BY。根本原因在于，HA VING 只对已经分好组的数据起作用，它不是用来过滤单条记录的——那活儿归 WHERE 管。

一个典型的错误写法是这样的：

SELECT user_id, COUNT(*) FROM logs HA VING COUNT(*) > 5;
—— 缺少 GROUP BY，直接报错。

正确的结构必须长这样：SELECT ... FROM ... GROUP BY ... HA VING ...

WHERE 在分组之前过滤原始行，只能写字段名或普通条件，比如 WHERE status = 'active'
HA VING 在 GROUP BY 之后过滤分组结果，里面可以写聚合函数，比如 HA VING COUNT(*) >= 3
如果既要筛行又要筛组，两个子句完全可以共存：WHERE created_at > '2024-01-01' GROUP BY user_id HA VING SUM(amount) > 100

简单说，WHERE 是行级过滤，HA VING 是组级过滤，执行时机、作用对象都不一样，不能混着用。

HA VING 中不能用 SELECT 别名，得重复表达式

还有一个很常见的坑：想偷懒用别名。
比如写 SELECT A VG(score) AS a vg_score FROM exams GROUP BY class HA VING a vg_score > 85; —— 在 MySQL 5.7 及以上版本的严格模式下，这行会直接报错：Unknown column 'a vg_score' in 'ha ving clause'。

原因是 HA VING 的解析顺序比别名绑定早，它不认识什么 AS 定义的别名。必须老老实实把表达式再写一遍：HA VING A VG(score) > 85，或者更完整一点 HA VING (SUM(score)/COUNT(*)) > 85。

得注意：PostgreSQL 允许在 HA VING 里用别名，但 MySQL、SQL Server、SQLite 都不支持——跨数据库迁移时尤其容易在这里翻车
别名最安全的“活动范围”其实只有 SELECT 和 ORDER BY；WHERE、HA VING、GROUP BY 这些地方都别指望它
复杂表达式要重复写两遍，容易手滑出错。建议先把逻辑想清楚，再复制粘贴，别靠脑子临时改

NULL 值在 HA VING 中的处理很隐蔽

这一点经常被忽略，但坑起来真能让人查半天。当聚合函数遇到全为 NULL 的分组时，COUNT(*) 返回 0，但 COUNT(col)、SUM(col)、A VG(col) 统统返回 NULL。这时候如果写 HA VING SUM(revenue) > 1000，这个分组就会整个被跳过——因为 NULL > 1000 的结果是 UNKNOWN，不满足真值条件。

这不是 bug，是 SQL 三值逻辑的正常表现，但知道的人确实不多。

想包含 NULL 聚合结果的分组，得显式判断：HA VING SUM(revenue) > 1000 OR SUM(revenue) IS NULL
更常见的需求其实是“排除 NULL”，那就用 HA VING SUM(revenue) IS NOT NULL AND SUM(revenue) > 1000
COUNT(*) 永远不为 NULL，适合做存在性判断。但 HA VING COUNT(*) >= 1 总是成立，没实际意义；真正有用的是 HA VING COUNT(col) > 0，用来确认某列有非空值

性能上，HA VING 无法利用索引，慎用于大数据量分组

这一点必须警惕。HA VING 是在内存里对已经分组完成的结果做筛选，不像 WHERE 可以借助索引快速排除行。如果 GROUP BY 生成了几万个分组，再用 HA VING 全扫一遍，效率会明显下降。

优先把能下推的条件放进 WHERE：比如想查“近30天下单超5次的用户”，应该先写 WHERE order_time >= NOW() - INTERVAL 30 DAY，减少参与分组的行数，而不是让 HA VING COUNT(*) > 5 去处理全部历史数据
避免在 HA VING 里调用函数，比如 HA VING YEAR(created_at) = 2024，这会让引擎无法使用 created_at 列的索引
如果分组键基数极高，比如按 UUID 分组，GROUP BY + HA VING 很容易变成性能瓶颈。这时候需要想想是否真的要聚合，或者考虑在应用层做二次过滤

实际写代码的时候，先问自己一句：这个条件是要过滤原始行，还是过滤分组桶？只有筛桶的时候才轮到 HA VING 出场；一上来就写 HA VING，八成是逻辑还没理清楚。

来源：https://www.php.cn/faq/2749497.html

SQL

上一篇利用bulkWrite与Session在MongoDB事务中执行批量upsert操作的步骤详解 下一篇SQL触发器实现删除记录自动转入历史归档表

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

数据库 · 2026-07-02

Redis 7.0增量AOF重写RDB前导码配置详解

先说一个几乎所有人都踩过的典型误区：很多人把 aof-use-rdb-preamble yes 当作开启“增量重写”的开关。实际上，这个配置只干了一件事——让重写后的 AOF 文件头部带上 RDB 快照。它解决的是加载速度问题，跟“增量重写”本身的概念压根不是一回事。真正的增量重写，依赖的是 Red

数据库 · 2026-07-02

在Python Tornado异步框架中安全执行SQL命令的方法与最佳实践

直接在Tornado里用SQLAlchemy同步执行SQL，结果就是阻塞IOLoop，所谓“异步框架里写同步数据库代码”，等于白搭。安全执行的关键不是“怎么写SQL”，而是“怎么不卡住事件循环”。为什么不能在RequestHandler里直接调用session execute() 因为sessio

数据库 · 2026-07-02

利用SQL触发器实现在INSERT数据时自动同步到审计表

先说结论：可以用触发器把 INSERT 数据同步到审计表，但必须用 AFTER INSERT，并且审计表的字段顺序、类型、字符集得和源表严格一致。否则，轻则写入错位、数据截断，重则直接报错、丢数据。下面把这些坑一个一个掰开说。能，但必须用 AFTER INSERT，且审计表字段顺序、类型、字符集要

数据库 · 2026-07-02

如何用SQL编写按不同工作日统计员工出勤率

在实际业务中，统计不同工作日的出勤率是HR系统里的高频需求。如果直接按日期函数分组，很容易掉进语言环境、索引失效或分母口径的坑里。下面就来拆解具体的实现要点。必须用 CASE WHEN 将日期映射为固定 weekday 标签（如 Mon ）再分组，避免语言环境导致的分组断裂；需过滤 DOW IN

数据库 · 2026-07-02

Spring Boot 3动态拼接SQL为何引发严重安全漏洞

SQL注入漏洞的核心成因，本质上是因为用户输入直接参与了SQL语句的字符串拼接，而未采用参数化绑定机制。在MyBatis中使用${}、QueryWrapper中调用apply()与last()、JPA的@Query注解进行拼接等操作，都会绕过PreparedStatement的安全防护。动态字段必须