SQL面试必考窗口函数实战 ROW_NUMBER与RANK的区别分析

时间：2026-04-26 13:36

ROW_NUMBER() 与 RANK()：一字之差，逻辑天壤之别 ROW_NUMBER() 和 RANK() 的结果差异，根本不在写法，而在排序逻辑许多开发者在编写SQL窗口函数时，语法看似正确，但查询结果却与预期不符。问题的根源往往不在于代码本身，而在于对ROW_NUMBER()和RANK()

ROW_NUMBER() 与 RANK()：一字之差，逻辑天壤之别

ROW_NUMBER() 和 RANK() 的结果差异，根本不在写法，而在排序逻辑

许多开发者在编写SQL窗口函数时，语法看似正确，但查询结果却与预期不符。问题的根源往往不在于代码本身，而在于对ROW_NUMBER()和RANK()这两个核心函数的内在逻辑理解不足。它们对重复值的处理方式存在本质区别，这正是SQL面试和实际开发中的关键考点。

ROW_NUMBER() 严格按行分配唯一序号，无视数值是否相等。即使两行记录的salary字段完全相同（例如都是25000），它也会强制分配连续编号1和2。
RANK() 则遵循现实世界的排名规则：数值相同则名次并列，后续名次会跳过被占用的序号。例如，出现两个第一名后，下一个名次直接就是第三名。
通过一个经典案例可以清晰对比：对数据集[90, 85, 85, 80]执行降序排名，SELECT score, ROW_NUMBER() OVER (ORDER BY score DESC), RANK() OVER (ORDER BY score DESC)，两者的输出结果分别为[1,2,3,4]和[1,2,2,4]。这直观展示了SQL排名函数的核心差异。

选哪个？取决于你到底要“序号”还是“名次”

选择ROW_NUMBER()还是RANK()，绝非个人编码风格问题，而是直接关系到业务逻辑的准确性。用错函数可能导致数据分析结论完全错误。

需要唯一序号时用ROW_NUMBER()：例如，获取每个部门最新的一条订单记录。应使用ROW_NUMBER() OVER (PARTITION BY dept_id ORDER BY create_time DESC)生成序号，再通过WHERE rn = 1筛选。此场景要求序号绝对唯一，不允许并列。
需要真实排名时用RANK()：例如，制作销售业绩排行榜，且需处理并列情况。应使用RANK() OVER (ORDER BY amount DESC)，配合WHERE rk <= 3筛选前三名。这样，如果两人并列第一，一人第三，查询结果将正确返回三条记录。
常见误区警示：若错误地使用ROW_NUMBER()来实现“取前三名”，系统只会机械地返回前三行，所有并列的选手都会被遗漏。这是SQL面试和线上数据事故中的高频错误点，务必警惕。

常见踩坑点：别名不能直接在 WHERE 里用，PARTITION BY 写错就全乱了

窗口函数的使用存在几个典型陷阱。首先，由于SQL执行顺序（WHERE在SELECT之前计算），窗口函数生成的别名无法在同一查询层级的WHERE子句中直接引用。其次，PARTITION BY的分组维度一旦定义错误，整个排名逻辑将彻底失效。

错误写法示例：SELECT *, RANK() OVER (ORDER BY score) AS rk FROM scores WHERE rk <= 10。此语句将导致报错或逻辑混乱。
正确解决方案：必须使用子查询或公共表表达式（CTE）进行嵌套，在外部查询中过滤。例如：SELECT * FROM (SELECT *, RANK() OVER (...) AS rk FROM scores) t WHERE t.rk <= 10。
分组维度核对：如果将PARTITION BY dept_id误写为PARTITION BY city


MySQL 8.0+ 性能提示：没特殊需求时，优先用 ROW_NUMBER()
在MySQL 8.0及以上版本的大数据量场景实测中，ROW_NUMBER()的性能通常比RANK()稳定高出10%~15%。这是因为RANK()需要额外的计算来识别重复值并确定跳号规则，开销更大。

性能优先场景：如果业务需求仅为数据分页、结果去重、或获取不处理并列情况的Top N记录，那么ROW_NUMBER()是更轻量、更高效的选择。
注意性能波动：RANK()及其变体DENSE_RANK()在高并发的OLAP分析场景下，因其内部复杂的排序与缓存机制，可能导致性能波动。建议上线前进行充分的压力测试与对比。
版本兼容性提醒：ROW_NUMBER、RANK、DENSE_RANK等标准窗口函数均要求MySQL版本在8.0或以上。低版本虽可通过用户变量模拟，但该方案在多线程或复杂查询中极易出错，存在较高风险，不推荐在生产环境使用。

总而言之，掌握窗口函数的关键，不在于死记OVER子句的语法，而在于深入思考一个根本问题：你当前业务场景需要的，究竟是按行读取的“流水号”，还是反映真实位次的“竞赛排名”？厘清这一点，才能做出最准确的技术选型。


          来源：https://www.php.cn/faq/2307233.html
          
                                    其他                      
          
            上一篇Oracle如何限制用户查询特定列数据_利用视图屏蔽敏感字段            下一篇如何防御宽字节注入导致的SQL安全问题_统一数据库与连接池字符集编码          
          本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。


        
          相关推荐
补充同频道和同主题内容，方便继续浏览更多相关内容。
          
                                              
        
        
          同类最新
继续查看同栏目最近更新的文章。
更多
          
                                                
                            数据库 · 2026-07-02Redis 7.0增量AOF重写RDB前导码配置详解
先说一个几乎所有人都踩过的典型误区：很多人把 aof-use-rdb-preamble yes 当作开启“增量重写”的开关。实际上，这个配置只干了一件事——让重写后的 AOF 文件头部带上 RDB 快照。它解决的是加载速度问题，跟“增量重写”本身的概念压根不是一回事。真正的增量重写，依赖的是 Red
            
                                                
                            数据库 · 2026-07-02在Python Tornado异步框架中安全执行SQL命令的方法与最佳实践
直接在Tornado里用SQLAlchemy同步执行SQL，结果就是阻塞IOLoop，所谓“异步框架里写同步数据库代码”，等于白搭。安全执行的关键不是“怎么写SQL”，而是“怎么不卡住事件循环”。 为什么不能在RequestHandler里直接调用session execute() 因为sessio
            
                                                
                            数据库 · 2026-07-02利用SQL触发器实现在INSERT数据时自动同步到审计表
先说结论：可以用触发器把 INSERT 数据同步到审计表，但必须用 AFTER INSERT，并且审计表的字段顺序、类型、字符集得和源表严格一致。否则，轻则写入错位、数据截断，重则直接报错、丢数据。下面把这些坑一个一个掰开说。 能，但必须用 AFTER INSERT，且审计表字段顺序、类型、字符集要
            
                                                
                            数据库 · 2026-07-02如何用SQL编写按不同工作日统计员工出勤率
在实际业务中，统计不同工作日的出勤率是HR系统里的高频需求。如果直接按日期函数分组，很容易掉进语言环境、索引失效或分母口径的坑里。下面就来拆解具体的实现要点。 必须用 CASE WHEN 将日期映射为固定 weekday 标签（如   Mon  ）再分组，避免语言环境导致的分组断裂；需过滤 DOW IN
            
                                                
                            数据库 · 2026-07-02Spring Boot 3动态拼接SQL为何引发严重安全漏洞
SQL注入漏洞的核心成因，本质上是因为用户输入直接参与了SQL语句的字符串拼接，而未采用参数化绑定机制。在MyBatis中使用${}、QueryWrapper中调用apply()与last()、JPA的@Query注解进行拼接等操作，都会绕过PreparedStatement的安全防护。动态字段必须