SQL中NULL与空字符串''本质不同:NULL参与任何比较均返回UNKNOWN而被WHERE排除,''则是确定的空值;需用IS NOT NULL和!= ''联合判断才可真正过滤非空数据。

WHERE 字段 IS NOT NULL 和 != '' 是两回事
你是不是也曾经写过 WHERE name != '',就以为万事大吉,把所有“空”都过滤掉了?结果一查数据,那些显示为“空白”的 NULL 值,依然好端端地躺在结果集里。问题的根源在于,SQL世界里,NULL 和空字符串 '' 压根就不是一回事。前者代表“未知”,一个尚未定义的值;后者则是一个“已知”的、内容为空的字符串。这个根本差异,直接导致了 NULL 在参与任何比较操作(=、!=、)时,都会返回一个特殊状态:UNKNOWN。而 WHERE 子句只认 TRUE,所以 NULL 行就被默默地排除在外了——但这可不是你写的条件生效了,而是条件对它根本“无法判断”。
WHERE col IS NOT NULL:这只负责抓出NULL,但会放过所有的空字符串''。WHERE col != '':这只负责抓出空字符串,却会对NULL视而不见。- 所以,想要真正筛选出“有内容”的数据(既非
NULL也非''),必须双管齐下:WHERE col IS NOT NULL AND col != ''。
CHAR/VARCHAR 默认填充空格带来的陷阱
事情到这里还没完。如果你用的是 MySQL,并且字段类型是 CHAR,那么另一个经典的坑正在等着你。为了固定长度,CHAR 类型会自动用空格填满未使用的部分。比如,你在 CHAR(10) 的字段里存了一个字母 'a',数据库实际存储的是 'a' 后面跟着9个空格。这时候,如果你用 col = '' 去判断它是否为空,结果会是 FALSE;即使用 TRIM(col) = '',结果也是 FALSE;甚至用 LENGTH(col) = 0 去判断,得到的还是 FALSE,因为它的长度被固定为10了。这就会导致你以为过滤掉了空值,实则漏网之鱼一大堆。
- 最直接的避坑方法:优先使用
VARCHAR类型替代CHAR,从根本上避免隐式的空格填充。 - 如果业务必须使用
CHAR,那么在过滤空值时,建议统一使用TRIM(col) != '',而不是简单的col != ''。 - 需要注意的是,不同数据库行为各异:PostgreSQL 没有这个问题,SQL Server 虽有类似概念但默认不填充,务必留意你所用的数据库特性。
LIKE '%xxx%' 查询下空字符串和 NULL 都不会命中
还有一种常见的误解,发生在模糊查询的场景里。很多开发者会想当然地认为,WHERE name LIKE '%abc%' 这个条件,既然要求字段必须包含“abc”,那自然也就“顺便”把空值和 NULL 都过滤掉了。从结果上看,似乎没错,NULL 和 '' 确实都不会出现在结果里。但这里的逻辑需要厘清:NULL LIKE '%abc%' 返回的是 UNKNOWN(因为对未知值做任何判断都是未知),而 '' LIKE '%abc%' 返回的是 FALSE(空字符串显然不包含任何子串)。它们被过滤,是 WHERE 子句执行机制的结果,而非你主动过滤的意图。依赖这种“副作用”来过滤数据,代码的意图会变得模糊不清,也为日后埋下隐患。
- 明确建议:不要将
LIKE语句当作隐式的空值过滤手段。意图不明,且极易被后续的查询条件修改所破坏。 - 正确的做法是,如果业务上要求“空字符串”和“NULL”都算无效数据,那么就在模糊查询前显式写明:
WHERE name IS NOT NULL AND TRIM(name) != '' AND name LIKE '%abc%'。 - 一个小提示:确保你使用的
TRIM()函数符合数据库版本,例如在较旧的 MySQL 5.7 之前版本中,可能需要使用TRIM(BOTH ' ' FROM name)的完整语法。
ORM(如 Django/SQLAlchemy)里容易漏掉 NULL 判断
当我们使用 ORM 框架来构建查询时,这个问题会变得更加隐蔽。例如,在 Django 中写下 .filter(name__ne=''),或者在 SQLAlchemy 中使用类似的非等判断,ORM 通常只会生成 != '' 的 SQL 条件,而不会自动为你补上 IS NOT NULL。如果你的数据库字段恰好允许为 NULL,又没有设置默认值,那么表中就很可能存在大量的 NULL 记录。这会导致一个诡异的现象:前端页面显示一片“空白”,但你用这个查询条件却怎么也抓不到它们,排查起来费时费力。
- 在 Django 中,你需要组合使用:
.exclude(name='')加上.exclude(name__isnull=True),或者更简洁地使用Q对象:.exclude(Q(name='') | Q(name__isnull=True))。 - 在 SQLAlchemy 中,正确的写法是:
and_(Table.name != '', Table.name.isnot(None))。这里要特别注意,不是 Python 中的is not None,而是 SQLAlchemy 提供的.isnot(None)方法。 - 治本之策:在设计数据表时,就仔细审查迁移文件,为业务上不允许为空的字符串字段加上
nullable=False的约束,并从业务逻辑层面确保写入非空值,从而从源头上减少NULL出现的可能性。
说到底,厘清空字符串和 NULL 的区别,远不止是语法细节的较真。这背后是关于数据状态定义的基本假设。一旦在代码中将两者混为一谈,你的 WHERE 过滤条件就会变得不可靠,成为一种“概率性生效”的玄学操作——这次可能碰巧对了,下次换个数据就错了,问题还难以稳定复现。把这件事做对,是写出稳健数据查询逻辑的基石。
