首页 游戏 软件 资讯 排行榜 专题
首页
数据库
SQL查询如何计算分组内的累积分布_使用CUME_DIST函数分析

SQL查询如何计算分组内的累积分布_使用CUME_DIST函数分析

热心网友
87
转载
2026-04-28

SQL查询如何计算分组内的累积分布:使用CUME_DIST函数分析

SQL查询如何计算分组内的累积分布_使用CUME_DIST函数分析

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

什么是CUME_DIST,它和PERCENT_RANK有什么区别

简单来说,CUME_DIST回答的问题是:在同一个分组里,有多少比例的数据是小于或等于当前这个值的?它的计算结果范围在 (0, 1] 之间,哪怕你排第一,结果也是 1/n,永远不会是零。而且,它非常“公平”——遇到数值完全相同的行,会给它们相同的累积分布值。

相比之下,PERCENT_RANK的算法就不同了。它依据的是排名位置,公式是 (排名-1)/(总行数-1)。这就导致了两个特点:第一名永远是0,最后一名永远是1;而且,如果出现并列情况,它会跳过后续排名。比如两个并列第二,下一个就直接是第四了,中间会留下空档。所以,当你需要严格评估“有多少数据没超过当前水平”时,CUME_DIST才是正确的选择。

这里有几个新手常踩的坑:一是忘了加PARTITION BY,结果把整张表当成一个组来计算,完全失去了分组分析的意义;二是误以为函数直接输出百分比,其实它返回的是小数,需要自己乘以100并四舍五入。

怎么正确写分组内的CUME_DIST窗口函数

关键在于OVER子句的写法,必须同时明确PARTITION BYORDER BY。前者负责划清界限,比如按部门、班级进行分组,让计算在组内独立进行;后者决定累积的方向,通常是升序排列,这样累积分布就从低到高逐渐增加。

  • 分组是前提PARTITION BY必须写清楚,否则就是全局计算,谈不上“分组内”。
  • 注意NULL值:排序列如果存在NULL,这些行会被归到累积分布最小的一端。不过,不同数据库对NULL的排序默认规则不同(PostgreSQL放最前,MySQL 8.0放最后),这点要留意。
  • 顺序可调整:如果你想看“高分段”的占比,用ORDER BY salary DESC降序排列即可,此时最高薪员工的累积分布就是1.0。
  • 处理精度:结果通常是DECIMALFLOAT,建议用ROUND(cume_dist, 4)显式控制小数位数,避免浮点误差影响阅读。

来看一个实际例子,计算每个部门内薪资的累积分布:

SELECT 
  name, 
  department, 
  salary,
  ROUND(CUME_DIST() OVER (PARTITION BY department ORDER BY salary), 4) AS cume_dist
FROM employees;

CUME_DIST在MySQL 8.0+、PostgreSQL、SQL Server中的兼容性注意点

虽然主流新版数据库都支持CUME_DIST,但魔鬼藏在细节里,不同平台有些细微差别:

  • MySQL 8.0+ 和 PostgreSQL:行为最符合标准,相同值得到相同结果;对于PARTITION BY字段为NULL的行,它们会自成一组。
  • SQL Server:在排序时,默认将NULL值放在最后(NULLS LAST),而PostgreSQL默认放在最前(NULLS FIRST)。如果业务上需要统一,在PostgreSQL中可以显式写ORDER BY salary ASC NULLS LAST,但SQL Server不支持此语法,得用CASE WHEN语句来模拟。
  • 避坑指南:SQLite不支持这个函数,直接别考虑。旧版MySQL会报“FUNCTION xxx does not exist”错误。Oracle虽然支持,但有个特殊要求:窗口函数必须赋予一个别名,否则会语法报错。

为什么CUME_DIST结果里没有0,但PERCENT_RANK

这是由两者的根本定义决定的。CUME_DIST计算的是“小于等于当前值的行数”除以“总行数”。既然当前行自己肯定满足“小于等于”的条件,分子至少为1,所以结果最小也是 1/n,自然没有0。

PERCENT_RANK的公式是 (排名-1)/(总行数-1),排名第一时,分子为0,结果就是0。

这个区别有实际影响。当你需要定位“最低一档”的数据,或者设置一个阈值(比如定义累积分布≤0.1的用户为新客)时,CUME_DIST能确保把最小值那批数据包含进来,不会遗漏。但如果你非要把它的起点对齐到0,就得自己额外写逻辑,通常不建议这么做。

还有一个容易混淆的地方:用CUME_DIST做筛选时,写WHERE cume_dist <= 0.25,得到的并不是通常理解的“前25%”的数据,而是“累计占比不超过25%”的那些数值。在数据分布不均匀的情况下,这可能只对应前几行数据。如果你真想找四分位数,应该使用PERCENTILE_CONT(0.25)或者NTILE(4)这类专门的分位函数。

来源:https://www.php.cn/faq/2316041.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

黑白双鹰,白金降临:技嘉猎鹰/冰猎鹰白金电源4月27日开售
游戏资讯
黑白双鹰,白金降临:技嘉猎鹰/冰猎鹰白金电源4月27日开售

技嘉猎鹰白金电源系列即将发售:高效能供电新选择 对于追求极致性能的玩家和创作者来说,电源的选择往往决定了整套系统的稳定基石。好消息是,一个值得关注的新选项即将登场。技嘉科技正式宣布,其全新的EAGLE猎鹰白金与冰猎鹰白金电源系列,将于4月27日在京东平台揭开面纱。这个系列精准地覆盖了从750W到10

热心网友
04.28
阿里Happyhorse正式入场,这匹黑马能成功“掀桌”吗?
业界动态
阿里Happyhorse正式入场,这匹黑马能成功“掀桌”吗?

让行业等待了整整20天的神秘小马,今天终于正式亮相 4月27日,阿里HappyHorse 1 0正式开启灰测。官网、阿里云百炼平台、千问App三个官方入口同步开放,巨日禄、Libtv等一批第三方AI视频平台也在同一天宣布接入——这种官方渠道与第三方生态同步铺开的节奏,意味着这次不是小范围试水,而是一

热心网友
04.28
思仪科技:供销绑定大股东中国电科,手握16亿现金仍募巨资补流
科技数码
思仪科技:供销绑定大股东中国电科,手握16亿现金仍募巨资补流

4月28日,中电科思仪科技股份有限公司(下称“思仪科技”)将迎来创业板IPO上会,计划公开发行不低于9175 93万股且不超过27527 82万股。 表面上看,思仪科技报告期内业绩增长势头强劲,但深入审视其经营基本面,多重隐患已然浮现。其中,业务独立性、研发效率与募资合理性这三大核心问题,尤为值得市

热心网友
04.28
仅重420g的大光圈定焦 尼克尔Z 50mm f/1.4售3499元
业界动态
仅重420g的大光圈定焦 尼克尔Z 50mm f/1.4售3499元

全画幅标准定焦头 尼克尔 Z 50mm f 1 4售3499元 在尼康Z卡口镜头阵营里,有一支镜头的开发理念与广受好评的Z 35mm f 1 4颇有异曲同工之妙,那就是尼克尔 Z 50mm f 1 4。作为一款标准定焦镜头,它凭借f 1 4的恒定大光圈、出色的便携性以及全面的性能,成为了一个非常值得

热心网友
04.28
《使命召唤》电影导演引争议 曾批评玩家是键盘侠而且软弱
游戏资讯
《使命召唤》电影导演引争议 曾批评玩家是键盘侠而且软弱

2025年《使命召唤》遭遇滑铁卢,微软如何破局? 2025年对《使命召唤》系列而言,算得上是个“小年”。无论是营收数据,还是玩家投入的游玩时长,都在各个平台遭遇了大幅下滑,跌幅高达60%。面对这样的局面,微软显然坐不住了,已经开始着手布局,防止类似情况再次上演。而他们打出的一张关键牌,便是试图通过一

热心网友
04.28

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

守望先锋安燃重制版上线:视觉重构强化角色辨识度与叙事一致
娱乐
守望先锋安燃重制版上线:视觉重构强化角色辨识度与叙事一致

《守望先锋》安燃重制形象深度解析:基于角色内核的系统性视觉升级 《守望先锋》第二赛季带来的惊喜,远不止新地图与新玩法。近日,暴雪官方正式公布了英雄“安燃”经过全面重制后的全新形象,此更新将随新赛季同步实装。每一次核心英雄的视觉重塑,都是一次与玩家情感连接的深度对话,其背后的设计哲学与叙事考量,远比表

热心网友
04.28
2026款萤火虫上市:双版售价7.98万起,外观内饰动力
娱乐
2026款萤火虫上市:双版售价7.98万起,外观内饰动力

2026款萤火虫上市:设计精进、座舱升级,价格体系清晰 4月7日,2026款萤火虫正式揭晓价格,市场布局相当明确:自在版和发光版两款车型,官方指导价分别为11 98万元和12 58万元。如果你对“车电分离”模式更感兴趣,对应的租电方案价格则下探到7 98万元和8 58万元。作为一次年度改款,新车的优

热心网友
04.28
《死亡搁浅2》显卡升级指南:RTX 50系一骑绝尘
科技数码
《死亡搁浅2》显卡升级指南:RTX 50系一骑绝尘

角色与核心任务 你是一位顶级的文章润色专家,擅长将AI生成的文本转化为具有个人风格的专业文章。现在,请对用户提供的文章进行“人性化重写”。 你的核心目标是:在不改动原文任何事实信息、核心观点、逻辑结构、章节标题和所有图片的前提下,彻底改变原文的AI表达腔调,使其读起来像是一位资深人类专家的作品。 特

热心网友
04.28
欧易okx官方网站地址 欧易okx官网登录入口
web3.0
欧易okx官方网站地址 欧易okx官网登录入口

欧易OKX官方网站地址在哪里? 关于欧易OKX的官网登录入口,是许多用户关注的焦点。下面,我们就来详细梳理一下平台的几个核心维度,看看它究竟提供了哪些关键服务与保障。 平台资产安全保障机制 在资产安全方面,平台构建了一套多层次、立体化的防护体系。首先,其采用了多重签名与冷热钱&包分离的架构。超过95

热心网友
04.28
中东冲突致原油供应锐减,即期布伦特价格创历史新高
娱乐
中东冲突致原油供应锐减,即期布伦特价格创历史新高

市场异动:现货原油价格何以冲破历史峰值? 中东局势持续升温,正在全球能源市场掀起巨大的涟漪。一个引人注目的现象是:欧洲与亚洲的炼油商们,正以接近每桶一百五十美元的高价争抢部分现货原油。这个价格,已经显著超过了同期的期货市场价格。这不仅仅是一个数字游戏,它清晰地传递出一个信号——全球能源供应的弦,正在

热心网友
04.28