SQL查询中如何使用IS NULL筛选空值数据

时间：2026-05-10 13:32

筛选数据库空值数据时，必须使用ISNULL而非=NULL，因为NULL代表未知，等值比较会返回UNKNOWN导致结果为空。ISNULL和ISNOTNULL是跨数据库的标准方法。业务中“空”可能包含空字符串或空格，需结合TRIM等函数处理。大量数据时，ISNULL可利用索引，但高NULL比例或复合索引可能影响性能，需考虑优化策略。关键在于明确业务逻辑中“空”的

在数据库查询中，筛选空值数据是一个高频操作，但很多开发者，尤其是初学者，常常会在这里踩坑。一个最典型的错误就是试图用 = NULL 来查找空值，结果发现永远查不到数据。

记住这个核心结论：判断空值，请用 IS NULL，而不是 = NULL。后者在任何情况下都不会返回你想要的结果。

SQL中如何筛选出字段为空的数据_通过IS NULL语法判断空值

为什么 `= NULL` 一定失效

问题的根源在于对 NULL 的理解。NULL 在 SQL 中并非一个具体的“值”，而是代表“未知”或“缺失”的特殊标记。因此，任何与 NULL 进行的等值比较（包括 =、!= 或 <>），其结果都不是 TRUE 或 FALSE，而是第三个逻辑值：UNKNOWN。

而 SQL 的 WHERE 子句有一个基本原则：它只保留条件计算结果为 TRUE 的行。无论是 FALSE 还是 UNKNOWN，都会被过滤掉。这就导致了以下常见现象：

当你写下 WHERE email = NULL 时，即使表中所有 email 字段都是 NULL，查询结果也永远是空的。
更隐蔽的陷阱是，写 WHERE status != 'done' 时，那些 status 为 NULL 的记录也会被漏掉，因为 NULL != 'done' 的结果同样是 UNKNOWN，不会被纳入结果集。

`IS NULL` 和 `IS NOT NULL` 的基本用法

为了解决这个问题，SQL 标准专门引入了 IS NULL 和 IS NOT NULL 操作符。这是唯一正确且跨数据库（如 MySQL、PostgreSQL、SQL Server、Oracle）通用的空值判断方式。

具体怎么用？看几个例子就明白了：

查找空值记录：SELECT * FROM users WHERE email IS NULL
查找非空值记录：SELECT * FROM orders WHERE logistics_no IS NOT NULL
多字段同时非空：WHERE name IS NOT NULL AND phone IS NOT NULL

这里有个关键点需要注意：IS NOT NULL 只判断字段是否为 NULL。如果字段里存的是空字符串 '' 或者纯空格 ' '，它会被认为是“非空”的。这一点常常是业务逻辑混淆的开始。

业务上常说的“空”往往不止 NULL

在实际业务场景中，我们所说的“空”或“未填写”，其含义往往比单纯的 NULL 更广。例如，一个用户手机号字段，数据库里可能同时存在三种情况：真正的 NULL（未录入）、空字符串 ''（用户提交了空表单）、以及包含空格的字符串 ' '（前端未做修剪）。在业务逻辑上，这三者通常都需要被视为“无效数据”或“未填写”。

因此，更严谨的过滤方式应该是：

排除 NULL 和空字符串：WHERE phone IS NOT NULL AND phone != ''
进一步排除空白字符（适用于 MySQL/PostgreSQL）：WHERE phone IS NOT NULL AND TRIM(phone) != ''
在 SQL Server 中，修剪函数略有不同：WHERE phone IS NOT NULL AND RTRIM(LTRIM(phone)) != ''
SQLite 的 TRIM() 函数功能相对基础，但用于去除首尾空格通常是足够的。

容易忽略的性能和索引影响

语法正确只是第一步，在数据量大的场景下，性能考量同样重要。IS NULL 条件本身是可以利用索引的，但其效果受数据分布和索引结构的影响很大。

有几个关键点需要了解：

数据分布影响：如果一个字段中 NULL 值的比例极高（例如超过95%），数据库优化器可能会判断使用索引不如直接进行全表扫描更高效，从而放弃使用索引。
复合索引的限制：对于复合索引 (a, b)，查询条件 WHERE a IS NULL AND b = 1 通常无法有效利用该索引。因为索引的排序结构在遇到 NULL 时变得复杂。
优化策略：如果针对空值的查询非常频繁且是性能瓶颈，可以考虑创建函数索引（例如在 PostgreSQL 中：CREATE INDEX ON t ((col IS NULL))），或者在应用层设计时，就增加一个冗余的布尔标记字段来标识该字段是否为空，并对这个标记字段建立索引。

说到底，技术上的语法选择并不复杂。真正的挑战在于业务逻辑的厘清：你口中的这个“空”，到底指的是什么？是用户没填？是填了又被删除了？还是系统流程尚未走到生成该字段的那一步？不同的含义对应着不同的数据过滤组合。想不清楚这一点，就很容易写出要么漏数据、要么误筛数据的查询语句。

来源：https://www.php.cn/faq/2450235.html

其他

上一篇MySQL数据库QPS与TPS实时监控计算方法详解 下一篇MySQL 8.0重启后自增值回退的解决方案与持久化计数器详解

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

数据库 · 2026-07-01

MyBatis Hive多表关联实现方法

MyBatis处理Hive多表关联查询与普通数据库类似。需准备映射文件，使用association和collection标签定义关联；创建Java实体类包含集合成员变量承接一对多关系；编写Mapper接口声明查询方法；配置MyBatis环境注册映射；最后通过SqlSession调用即可获取关联数据。