不同数据库中LIKE查询的反斜杠并非默认转义符:MySQL 5.7+默认支持,PostgreSQL、SQL Server、SQLite不认,需显式用ESCAPE指定转义字符或SQL Server用方括号语法。

LIKE 查询中反斜杠不是默认转义符
在SQL标准里,LIKE操作符的通配符%和_大家都很熟悉。但问题来了:它们本身也是普通字符啊!当你真想查找一个真实的百分号时,就必须明确告诉数据库:“这个百分号不是通配符,请按字面意思处理”。这里的关键点在于:不同数据库对转义字符的默认处理方式大相径庭。比如,MySQL从5.7版本开始默认把反斜杠当作转义符,但PostgreSQL、SQL Server和SQLite可不认这套,如果你直接写LIKE '%%%',结果要么报错,要么逻辑完全不对。
那正确的做法是什么?答案是显式声明转义字符:
- MySQL:使用
ESCAPE '\'(注意在字符串里需要写成两个反斜杠) - PostgreSQL:必须指定一个单字符作为转义符,例如
ESCAPE '!',并且这个字符不能出现在你要匹配的文本里 - SQL Server:更推荐使用方括号语法
LIKE '%[%]%',这比ESCAPE更直观,也少了很多麻烦
来看几个具体示例(目标是查找字段中包含真实%符号的记录):
SELECT * FROM logs WHERE message LIKE '%%%' ESCAPE ''; -- MySQL
SELECT * FROM logs WHERE message LIKE '%!%%' ESCAPE '!'; -- PostgreSQL
方括号语法在 SQL Server 中更安全
对于SQL Server用户来说,[]这个字符字面量包装器简直是福音。它比ESCAPE语法清晰得多,能有效避免各种歧义。比如说,你想查找包含左方括号[、右方括号]、百分号%或下划线_的数据,完全不用去记哪个字符需要转义、哪个字符又是转义符本身。
常见的写法是这样的:
LIKE '%[[]%':匹配包含左方括号[的字符串(第一个[表示字符集的开始,第二个[才是要匹配的字面量)- 注意,
LIKE '%[]%'这种写法是无效的——右括号]必须紧跟在左括号之后,正确的写法是LIKE '%[]]%' LIKE '%[_]%':匹配包含下划线字符本身,而不是将其作为通配符
这里有个细节需要牢记:方括号语法只对单个字符生效。[a-z]表示一个字符范围,而[[]才表示字面意义上的左方括号。
正则表达式比 LIKE 更适合复杂特殊字符场景
当查询需求变得复杂,比如需要同时匹配多个特殊字符(例如反斜杠、制表符、各种控制字符或Unicode符号)时,LIKE就显得力不从心了。这时候,就得看你的数据库是否支持正则表达式:
- PostgreSQL:使用
~操作符,例如SELECT * FROM users WHERE name ~ E'\t.*\n'; - MySQL 8.0+:使用
REGEXP,注意转义需要双反斜杠:WHERE content REGEXP '\\x00'; - SQL Server:情况稍复杂,没有原生的正则支持。通常需要借助
CHARINDEX函数、CLR函数,或者升级到2022及以上版本,利用STRING_SPLIT配合LIKE来实现类似功能
需要特别注意的是,正则表达式有自己的一套元字符(比如.、*、+、?),它们的转义体系与LIKE的转义体系是相互独立的——千万别把ESCAPE的规则和正则的反斜杠转义混为一谈。
CHAR() 和 ASCII() 是定位不可见字符的底层手段
有些“特殊字符”根本没法直接输入或显示,比如ASCII 0(NULL)、ASCII 7(响铃符)、或者UTF-8文件的BOM头。面对这些情况,无论是LIKE还是正则表达式都可能失效,必须依靠字节级别的判断。
这里有几个通用的技巧:
- 使用
ASCII(SUBSTRING(col, n, 1))来查询字符串第n位字符的ASCII值(适用于SQL Server和MySQL) - PostgreSQL可以使用
get_byte(col::bytea, n)函数 - MySQL 8.0及以上版本可以用
ORD()函数替代ASCII() - 检查UTF-8 BOM头:
HEX(LEFT(content, 3)) = 'EFBBBF'
不过必须提醒的是,这类底层操作通常性能开销较大,不建议直接放在WHERE条件里进行全表扫描。更务实的做法是,先在应用层进行预处理,或者将数据导出后用脚本进行筛选。
说到底,真正的难点往往不在于写出正确的SQL语句,而在于如何准确识别你要处理的“特殊字符”。你眼前看到的那个“空格”,它到底是普通的空格CHAR(32)、不换行空格CHAR(160),还是零宽空格U+200B?肉眼根本无法区分,必须依赖编码工具进行验证。这才是关键所在。
