SQL字符串长度计算LENGTH与CHAR_LENGTH用法

时间：2026-06-27 06:54

在数据库开发中，处理字符串长度时，有一个特别容易踩的坑：LENGTH 和 CHAR_LENGTH 这两个函数，表面看都是算“长度”，实际上一个算的是字节数，一个算的是字符个数。尤其当字段里存的是中文、emoji 或者用 utf8mb4 编码的内容时，两者的差异能直接导致业务逻辑出错。比如一个汉字在

在数据库开发中，处理字符串长度时，有一个特别容易踩的坑：LENGTH 和 CHAR_LENGTH 这两个函数，表面看都是算“长度”，实际上一个算的是字节数，一个算的是字符个数。尤其当字段里存的是中文、emoji 或者用 utf8mb4 编码的内容时，两者的差异能直接导致业务逻辑出错。比如一个汉字在 utf8mb4 下占 3 或 4 个字节，LENGTH 会返回 3 或 4，而 CHAR_LENGTH 始终返回 1 —— 如果你要校验“用户输入不能超过10个字符”，就必须用 CHAR_LENGTH，否则用户只打3个汉字就可能被 LENGTH 误判为超长。只有做底层字节截断（比如适配老旧协议的字节限制）时，才应该用 LENGTH。

如何在SQL中使用LENGTH或CHAR_LENGTH计算字符串长度？

LENGTH 和 CHAR_LENGTH 在 MySQL 中到底有什么区别？

直接说结论：LENGTH 返回字节数，CHAR_LENGTH 返回字符个数。在 utf8mb4 编码下，一个中文汉字占 3 或 4 字节，一个 emoji 表情占 4 字节，所以 LENGTH('中') 是 3 或 4，CHAR_LENGTH('中') 是 1。这个差异在业务校验中尤其致命。

如果你要校验用户输入是否超过「10 个字符」，必须用 CHAR_LENGTH，否则中文输 3 个字就可能触发 LENGTH > 10
如果你在做底层字节截断（比如适配旧协议限制），才考虑 LENGTH
在 utf8mb4 + emoji 场景下，一个 ? 的 LENGTH 是 4，CHAR_LENGTH 是 1

PostgreSQL 和 SQL Server 怎么办？没有 CHAR_LENGTH？

不同数据库的函数命名和默认行为差异很大。PostgreSQL 只有一个 LENGTH，但它默认按字符计数——行为等价于 MySQL 的 CHAR_LENGTH，所以可以直接用。SQL Server 的 LEN 也按字符算，但有一个容易忽略的细节：它会自动忽略末尾空格。比如 LEN('abc ') 返回 3，要想得到 6 个字节数，得用 DATALENGTH('abc ')。注意 DATALENGTH 返回的是字节数，不是字符数。

PostgreSQL：LENGTH('你好') → 2，安全可用
SQL Server：LEN('abc ') → 3，要用 DATALENGTH('abc ') 才得 6（字节数），且注意 DATALENGTH 返回的是字节数，不是字符数
跨数据库写法？别硬套函数名，先确认目标库的文档里该函数定义是「字符」还是「字节」

WHERE 条件里用 LENGTH/CHAR_LENGTH 性能很差？

确实如此。在大表上对字段套 CHAR_LENGTH(name) > 10 基本无法走索引——MySQL 无法为函数结果建立普通 B+Tree 索引（除非用生成列 + 索引）。如果业务里有类似“查询字符长度大于10的记录”这种需求，更好的做法是提前设计好存储结构。

更高效的做法：加一个 name_length TINYINT UNSIGNED AS (CHAR_LENGTH(name)) STORED 生成列，再给它建索引
或者业务层控制：插入前就计算并存入 name_len 字段，查询直接用 name_len > 10
临时查？可以接受全表扫描时再用，但别放在高频查询的 WHERE 里

遇到 NULL 或 TEXT 字段时要注意什么？

空值很容易被忽略。记住：CHAR_LENGTH(NULL) 返回 NULL，不是 0。如果你判断空字符串只写了 CHAR_LENGTH(col) = 0，当 col 为 NULL 时这个条件永远假，会漏掉数据。正确写法是 CHAR_LENGTH(col) IS NULL OR CHAR_LENGTH(col) = 0，或者用 COALESCE(CHAR_LENGTH(col), 0) 统一转成数字。

对 TEXT 类型字段调用 CHAR_LENGTH 本身没问题，但某些老版本 MySQL 对超长 TEXT（如 > 65535 字节）可能截断计算结果。如果字段类型是 MEDIUMTEXT 或 LONGTEXT，建议在应用层校验长度，避免数据库隐式转换开销。

最后啰嗦一句：到底用哪个函数，取决于你真正想量的是「人眼看到的字符个数」还是「存储占了多少字节」。这两个概念在多字节编码里从不相等，混淆它们是线上出 bug 的常见源头。别嫌麻烦，写 SQL 之前先想清楚业务要什么。

来源：https://www.php.cn/faq/2693998.html

char

上一篇SQL视图嵌套层数建议不超过三层的可维护性原因 下一篇如何使用SQL中的AVG函数计算某一列的平均值教程

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

数据库 · 2026-07-19

利用AWR报告诊断表空间碎片对扫描性能的影响

通过AWR报告中dbfilesequentialread等待异常、物理读请求次数增幅远超读块数、以及SQL执行计划从索引扫描退化为全表扫描这三类信号交叉验证，可判断表空间碎片是否拖慢扫描性能，避免误判。

数据库 · 2026-07-19

MySQL第三方审计系统只读系统视图权限配置方法

为审计账号配置MySQL只读权限时，performance_schema必须逐表显式授权，不可使用* *或库级批量授权；认证插件必须指定mysql_native_password；无法通过视图封装，必须直接授权原始表。这是审计账号配置的关键注意事项，必须严格遵守，并遵循最小权限原则。

数据库 · 2026-07-19

Navicat团队项目自定义图标背景色设置方法

Navicat中设置团队项目图标背景色实为两个独立配置：模型图节点颜色需手动修改navicat ini文件并完全重启；SQL编辑器及主窗口背景色通过主题设置。版本一致、配置路径准确、激活ERD模式是效果一致的关键。修改后必须彻底退出程序。

数据库 · 2026-07-19

SQL嵌套查询中如何有效利用索引覆盖提升性能

SQL嵌套查询中，子查询字段未被索引覆盖会导致全表扫描，而外层EXPLAIN的Usingindex可能误导优化。需为子查询过滤字段建索引，联合索引将SELECT字段包含在内且顺序正确。PostgreSQL可用INCLUDE或组合索引，MySQL8 0+支持函数索引，物化视图需手动建索引并刷新统计信息。

数据库 · 2026-07-19

SQL窗口函数快速查找用户多设备登录顺序

使用ROW_NUMBER()配合PARTITIONBYuser_id和ORDERBYlogin_time，可快速按用户分组并排序登录顺序。漏掉PARTITIONBY会导致全局编号，且必须用ROW_NUMBER()保证编号连续，避免RANK()或DENSE_RANK()的跳号问题。区分首次登录可嵌套MIN()窗口函数。老版本MySQL用变量模拟易出错，建议升级