首页 游戏 软件 资讯 排行榜 专题
首页
数据库
PostgreSQL使用窗口函数按非主键字段删除重复数据

PostgreSQL使用窗口函数按非主键字段删除重复数据

热心网友
37
转载
2026-05-07

PostgreSQL如何实现根据非主键字段去重删除

PostgreSQL如何实现根据非主键字段去重删除_利用窗口函数分析

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

ROW_NUMBER() + CTE 标序号再删,最稳

说到PostgreSQL的去重删除,窗口函数绝对是绕不开的核心工具,毕竟从8.4版本开始就支持了。其中,ROW_NUMBER() 尤其关键,它不依赖主键,完全由你定义的“重复判断字段”和排序逻辑说了算。比如,按 create_by 分组,再按 create_time DESC 排序,就能精准地为每组数据标上序号,最新那条自然就是第一名。

不过,这里真正的难点往往不在于“怎么写”,而在于“怎么写才安全、可控”。

  • 务必用 WITH 子句(CTE)把窗口函数包一层,因为PostgreSQL不允许在 DELETE 语句里直接嵌套窗口函数。
  • PARTITION BY 后面跟的列,必须严格对应业务上定义“重复”的逻辑,少一列可能导致漏删,多一列则可能误删。
  • ORDER BY 决定了最终留下哪一条:想保留最新的就用 DESC,保留最早的就用 ASC。如果排序字段可能存在 NULL 值,记得用 NULLS LASTNULLS FIRST 来显式控制其位置。

来看个具体例子,目标是保留每组相同 emailid 最小的那条记录:

WITH ranked AS (
  SELECT id, email,
         ROW_NUMBER() OVER (PARTITION BY email ORDER BY id ASC) AS rn
  FROM people
)
DELETE FROM people
WHERE id IN (SELECT id FROM ranked WHERE rn > 1);

别直接 DELETE FROM ... WHERE ctid IN (...),性能差还难读

有些朋友为了图省事,会想到用 ctid 这个系统列来标识物理行位置进行删除,比如下面这种写法:

DELETE FROM people WHERE ctid NOT IN (
  SELECT MIN(ctid)
  FROM people
  GROUP BY email
);

这种写法看似省略了排序逻辑,但问题其实相当明显:

  • ctid 反映的是物理存储位置,不具备业务意义。你无法保证在同一组重复数据中,MIN(ctid) 对应的就是最早插入或你真正想保留的那条,结果很可能是随机保留。
  • 使用 GROUP BY 配合 MIN(ctid) 在大数据量下会触发全表扫描和哈希分组。实测在70万行的表上,这种操作耗时可能超过30秒。
  • 语句的可读性极差。后续维护的人根本看不出来你的意图是保留“最早”还是“最新”的记录,也无从得知依据哪个字段来判断重复。

所以,除非业务场景明确要求“任意保留一条且完全不关心顺序”,否则最好避开 ctid 这种方案。

NOT IN 子查询在有 NULL 时会静默失效

这是一个非常隐蔽的坑。如果用来判断重复的字段(例如 email)允许为 NULL,那么下面这种常见的写法会导致所有包含 NULL 值的重复组都无法被删除:

DELETE FROM people WHERE email NOT IN (
  SELECT MIN(email) FROM people GROUP BY email
);

原因在于:NOT IN (..., NULL) 这个表达式的最终结果永远是 UNKNOWN,而PostgreSQL会将其当作 FALSE 处理,从而导致匹配不到任何行。

要绕过这个坑,通常有两个办法:

  • 提前过滤掉 NULL 值,在子查询和主查询中都加上 WHERE email IS NOT NULL 的条件。
  • 改用对 NULL 值安全的 NOT EXISTS 写法:
DELETE FROM people p1
WHERE EXISTS (
  SELECT 1 FROM people p2
  WHERE p2.email = p1.email
    AND p2.id < p1.id
    AND p2.email IS NOT NULL
);

大表删重前务必先建索引,不然删着删着就锁表

窗口函数本身不依赖索引,但 DELETE 语句最终执行时,需要精准定位并锁定待删除的行。如果 PARTITION BY 涉及的字段上没有索引,PostgreSQL就只能进行全表顺序扫描。对于一个70万行的表来说,这可能导致数分钟的表锁——在此期间,所有的 INSERTUPDATE 操作都会被阻塞。

正确的做法应该是:

  • 在用于去重的字段上建立索引,例如:CREATE INDEX idx_people_email ON people(email);
  • 如果是多个字段组合判重(比如 name, email),则建立联合索引:CREATE INDEX idx_people_name_email ON people(name, email);
  • 索引创建完成后,记得执行 ANALYZE people; 来更新统计信息,确保查询规划器能选择最优的执行路径。

没有索引的删重操作,表面上SQL能执行成功,实际上是以牺牲生产环境的稳定性为代价换来的“方便”,这才是最需要警惕的地方。

来源:https://www.php.cn/faq/2424529.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

车载吸尘器滤网拆卸方法 如何解开卡扣设计
电脑教程
车载吸尘器滤网拆卸方法 如何解开卡扣设计

是的,卡扣式滤网是主流车载无线吸尘器的标配 打开市面上任何一款主流车载吸尘器,你会发现,前盖滤网几乎清一色采用了卡扣式结构。这可不是偶然。这种设计通过精密匹配的旋转卡扣,真正实现了“秒拆秒装”——用户单手轻拧大约90度,前盖应声而开,多层复合滤网便呈现在眼前。滤网本身通常由可水洗的HEPA层和初效海

热心网友
05.07
雷神笔记本UEFI启动U盘制作与BIOS设置教程
电脑教程
雷神笔记本UEFI启动U盘制作与BIOS设置教程

雷神笔记本实现UEFI模式U盘启动,核心在于正确配置BIOS中的安全启动与UEFI引导选项,并确保U盘启动介质符合UEFI规范。 具体操作时,得先插入那个已经准备好的、符合UEFI规范的启动U盘。开机一瞬间,手速要快,连续按F12进入启动菜单。如果够顺利,你会直接看到一个带有“UEFI: [你的U盘

热心网友
05.07
车载吸尘器滤网清洗指南 水洗的正确方法与注意事项
电脑教程
车载吸尘器滤网清洗指南 水洗的正确方法与注意事项

车载吸尘器滤网能否水洗,关键在这儿 很多车主都纠结过这个问题:吸尘器滤网脏了,到底能不能用水洗?答案其实不复杂,核心就两点——看材质,看设计。不是所有的滤网都经得起“洗礼”,也不是所有号称能洗的滤网都一个洗法。根据海尔、德尔玛这些主流品牌的官方指南和业内清洁经验,这事儿有明确的“安全区”和“禁区”:

热心网友
05.07
vivo Y31手机联系人备份导出详细步骤
电脑教程
vivo Y31手机联系人备份导出详细步骤

vivo Y31联系人备份:最便捷高效的本地导出指南 想把vivo Y31里的通讯录完整备份下来,以备不时之需?最省心、兼容性最强的方法,莫过于利用手机自带的“联系人”应用,直接导出为通用的vCard ( vcf) 文件。整个过程不需要你安装任何第三方软件,也无需登录云端账号,几步操作就能在手机存储

热心网友
05.07
雷蛇鼠标灵敏度快速调节设置方法
电脑教程
雷蛇鼠标灵敏度快速调节设置方法

雷蛇鼠标调灵敏度最快的方式,是直接按压机身自带的物理DPI切换键 要说最直接、最快的方式,那绝对是机身上那个物理DPI切换键。它最大的好处,是彻底绕开了软件、系统和网络延迟——手指按下去,灵敏度瞬间切换,整个过程在毫秒间完成,真正实现了“所想即所得”。像Razer DeathAdder V3和Bas

热心网友
05.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

MONIE价格下跌至0.0066美元 Infiblue销毁8000万代币推动通缩预期
web3.0
MONIE价格下跌至0.0066美元 Infiblue销毁8000万代币推动通缩预期

Infiblue World 销毁8000万枚MONIE:Web3项目如何通过通缩机制重建市场信任? 在Web3与区块链游戏领域,代币经济模型的健康度直接决定了项目的生命力。近期,知名区块链游戏生态系统Infiblue World完成了一项关键操作:于5月2日宣布,已成功销毁八千万枚其原生代币MON

热心网友
05.07
Riftbound玩家为何在Vex上线前就对她产生反感
游戏攻略
Riftbound玩家为何在Vex上线前就对她产生反感

距离《Riftbound》最新扩展系列《Unleashed》正式上线仅剩一天。经过一周的预发布期,以及在中国服务器长达一个月的实战检验,哪些新卡将成为环境霸主,玩家心中早已有了答案。 其中,一张名为“Vex, Apathetic”的4费紫色单位卡,因其过于强势的表现,甚至在正式上线前就引发了社区热议

热心网友
05.07
三国杀赵襄觉醒技能详解与实战培养攻略
游戏攻略
三国杀赵襄觉醒技能详解与实战培养攻略

在《三国杀:武将觉醒》中,武将“赵襄”的实战强度与玩法上限,与装备配置和体系构建深度绑定。这份深度培养攻略将为你解析赵襄的核心养成逻辑,提供从入门到精通的实战进阶思路。 三国杀武将觉醒赵襄全面培养攻略 一套契合的装备是赵襄立足战场的根本。游戏前期,【金兰剑】能有效补充伤害缺口;进入后期,追求爆发输出

热心网友
05.07
美证监会主席称加密货币法律框架亟待完善与监管明确
web3.0
美证监会主席称加密货币法律框架亟待完善与监管明确

SEC释放重磅信号:加密货币监管新框架呼之欲出 近日,美国证券交易委员会(SEC)主席保罗·阿特金斯在参议院听证会上的一番表态,在Web3与加密领域投下了一枚“震撼弹”。他明确指出,基于上世纪三十年代的传统证券法律框架,在监管日新月异的加密货币市场时已显“力不从心”。这强烈预示着,SEC或将启动一项

热心网友
05.07
Xbox Series主机全新开机动画将于5月13日正式更新
游戏资讯
Xbox Series主机全新开机动画将于5月13日正式更新

XboxSeriesX|S主机将于5月13日更新开机动画与音效,标志性Logo回归绿色且质感更佳。新任CEO夏尔马上任后推动多项品牌变革,包括更新功能、调整营销策略、下调订阅价格及更换管理层,旨在为Xbox注入新活力。

热心网友
05.07