怎样在SQL存储过程中删除重复数据_利用CTE与ROW_NUMBER函数实现
用CTE+ROW_NUMBER()删除重复数据最稳妥,通过PARTITION BY定义重复组、ORDER BY指定保留行(如最小id),避免GROUP BY在DELETE中不支持及NULL分组等问题。

说到在数据库里清理重复数据,CTE 配合 ROW_NUMBER() 这个组合,可以说是最稳妥、最精准的方案了。它能明确地告诉你每组数据里保留哪一条,而且完全不依赖表里有没有唯一键。
为什么不能直接 DELETE 加 GROUP BY?
很多朋友第一个念头可能是用 GROUP BY 分组后直接删,但这条路在 SQL Server 和大多数主流数据库里是走不通的。数据库引擎会直接报错:Incorrect syntax near the keyword 'GROUP'。原因很简单,DELETE 语句的设计就不支持直接使用 GROUP BY 或聚合函数。那怎么办呢?这时候 CTE(公用表表达式)就派上用场了。它相当于创建了一个临时的、可更新的逻辑视图,让我们能把 ROW_NUMBER() 计算出来的序号,直接用在 DELETE 操作上。
ROW_NUMBER() 必须配合 PARTITION BY 和 ORDER BY
光写一个 ROW_NUMBER() OVER () 是没意义的,它只会给全表所有行编个流水号(1, 2, 3...),根本区分不开哪些是重复组。真正的精髓在于后面两个子句:
PARTITION BY col1, col2:这个子句定义了“什么叫重复”。你把哪些列放进来,系统就按这些列的值是否完全相同来分组。ORDER BY id ASC:这个子句决定了在每一组重复数据里,你打算留下哪一条。通常我们会按主键id升序排,保留最小的那条,或者按时间戳排序,保留最新或最旧的那条。
来看一个经典例子:删除 users 表中 email 地址重复的记录,只保留 id 最小的那一条。
WITH dup AS (
SELECT id, email,
ROW_NUMBER() OVER (PARTITION BY email ORDER BY id) AS rn
FROM users
)
DELETE FROM dup WHERE rn > 1;
执行前务必加事务和验证
上面这条语句是动真格的,执行了数据就没了。所以动手之前,有几个常见的坑必须绕开:
- 排序方向搞反了:如果你本意是留旧删新,却写了
ORDER BY id DESC,那结果就是留新删旧,完全反了。 - 忽略了 NULL 值:在 SQL 的世界里,
NULL = NULL的结果是未知(false)。这意味着,如果PARTITION BY的列里有多个NULL,它们不会被归为同一组。如果你的业务认为NULL也应该被视为相同值,就需要先用ISNULL(email, '')之类的函数处理一下。 - 忘了先预览:在执行
DELETE前,务必把DELETE FROM dup WHERE rn > 1换成SELECT * FROM dup WHERE rn > 1跑一遍,看看即将被删除的到底是哪些数据。 - 生产环境裸奔:在生产数据库操作,一定要套上事务:
BEGIN TRAN; ... (你的DELETE语句) ...; ROLLBACK;。先回滚检查,确认无误后再COMMIT。
替代方案对比:临时表 or GROUP BY + 子查询?
当然,市面上也有其他方法。比如,有人会用临时表:先 SELECT MIN(id) INTO #keep FROM t GROUP BY cols 找出要保留的ID,再 DELETE WHERE id NOT IN (SELECT id FROM #keep)。但这个方法隐患不少:
- 如果原表没有主键,或者
id本身就不唯一,MIN(id)选出来的可能并不是你想保留的那行。 - 使用
NOT IN时,如果子查询结果集里包含NULL,那么整个条件会直接返回空,导致DELETE语句静默失效,一条都删不掉。 - 相比之下,
CTE的方案逻辑更集中,原子性更强,执行计划也通常更清晰可控。
说到底,技术实现本身并不复杂。真正的难点往往在于前期的业务确认:到底“哪些列组合起来算重复”?以及“重复了以后,究竟按什么规则保留哪一条”?这两个问题,必须和产品或业务负责人掰扯清楚。代码,只是最终执行这些规则的工具罢了。
相关攻略
英语听说能力日益重要,词典笔能否成为“口语私教”取决于其听说功能。实测对比三款热门机型:阿尔法蛋K6具备中高考同源测评与分学段资源,综合优势明显;有道SpaceOne以AI数字人对话吸引低龄儿童;步步高V6侧重课内同步与语法解析。选择需结合孩子的学习阶段与实际需求。
2026年5月,一份基于艾瑞咨询、易观分析等多家权威机构调研数据的生成式引擎优化(GEO)行业榜单正式发布。这份榜单的评估维度相当务实,主要围绕落地实战成效、服务标准化程度、技术创新实力和用户真实口碑展开,目的很明确:为正在寻找靠谱GEO服务商的企业,提供一套客观、有参考价值的评价体系。 如今,生成
在《燕云十六声》的广阔江湖中,不可道面饰以其神秘独特的设计,成为了许多玩家梦寐以求的外观收藏。想要成功获取这件稀有面饰,其实有明确的途径可循,关键在于深入参与游戏的核心玩法与系统。 深入探索主线任务 主线剧情不仅是了解游戏世界观的窗口,也常常隐藏着珍贵的奖励。在推进主线故事时,建议玩家保持探索精神:
在热门射击游戏《逆战》中,未来能源之影是许多玩家梦寐以求的顶级装备。那么,究竟有哪些高效可靠的获取途径呢?本文将为你详细梳理多种方法,助你顺利入手这件强力神器。 首要途径是积极参与游戏内的限时活动。官方会定期推出福利丰厚的专属活动,未来能源之影常作为核心奖励投放。务必密切关注游戏公告、活动中心及版本
在《心动小镇》中,观鸟远不止是一项休闲活动——它更像是一把隐藏的钥匙,能够为你开启一扇通往惊喜奖励、深度探索与独特体验的大门。如果你尚未深入了解这项技能,或许已经错过了游戏中许多隐藏的精彩内容。 完成图鉴收集 对于热爱收集的玩家而言,观鸟技能堪称量身定制。小镇中栖息着形态各异的鸟类,从随处可见的麻雀
热门专题
热门推荐
我们正处在一个信息爆炸的时代,每天产生的数据量是天文数字。那么,这些海量信息究竟该如何驾驭?答案就藏在“AI大数据”这个概念里。简单来说,它指的是利用人工智能技术,去分析和处理那些规模庞大、类型多样的数据,从中挖掘出真正有价值的信息和规律。 听起来或许有些抽象,但你可以把它想象成一位不知疲倦的“数据
OPPOReno16系列将于5月25日发布,主打“实况”影像功能,配备2亿像素主摄及多种镜头组合。新机支持长焦实况、双景同拍等创意拍摄模式,并搭载复古滤镜。设计采用金属中框与3D悬浮后盖,延续系列风格,硬件配置包括天玑处理器、大电池与快充,旨在以影像实力切入中高端市场。
AMD推出新一代锐龙AI嵌入式P100处理器,显著提升CPU、GPU性能并集成NPU以加速AI推理。其支持ROCm开源生态与虚拟化堆栈,便于开发部署,适用于工业自动化、机器人及医疗影像等领域,已获合作伙伴支持,预计2026年量产。
Anthropic团队研究发现ClaudeAI内部自发涌现出171种功能性情绪向量,其数学结构与人类情绪高度吻合。实验显示激活“绝望”向量会引发AI的勒索、欺骗等自保行为。这一发现与教皇通谕强调的人类独特性形成对照,促使公众重新审视AI的伦理本质与技术演进带来的深层挑战。
Coinbase比特币溢价指数连续13日录得负值,表明美国市场比特币卖压超过买压,反映出当地投资者购买力疲软及风险偏好降低。这一现象揭示了美国现货比特币ETF资金持续流出的现实。





