首页 游戏 软件 资讯 排行榜 专题
首页
AI
阿里云AI性能压测:英伟达GPU用量锐减82%,213卡实现1192卡效能

阿里云AI性能压测:英伟达GPU用量锐减82%,213卡实现1192卡效能

热心网友
34
转载
2025-10-19

10月18日,《南华早报》今日(10月18日)发布报道,称在韩国首尔举办的第31届操作系统原理研讨会(SOSP)上,阿里云发布的“Aegaeon”计算池化解方案研究成果成功入选,这一方案能够解决当前AI模型服务中普遍存在的GPU资源浪费问题。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

查阅公开资料可知,SOSP是计算机操作系统领域的顶尖会议,堪称该领域的“奥斯卡”,其论文录用率控制在极低水平,每年收录的论文数量仅数十篇。入选论文通常代表了操作系统与软件领域最具价值的研究成果。

研究指出,云服务商当前在提供AI模型服务时,普遍面临严重的资源利用效率问题。一个平台往往需要同时托管数千个AI模型以应对海量并发的API调用,但用户请求却高度集中在少数几个热门模型上,例如阿里巴巴推出的Qwen系列模型。

研究人员发现,这种“长尾效应”导致了严重的资源闲置:在阿里云模型市场中,居然有17.7%的GPU算力仅用于处理1.35%的用户请求,造成了巨大的成本浪费。

为应对这一痛点,Aegaeon系统应运而生。该系统通过创新的GPU资源池化技术,使单个GPU能够动态服务于多个不同的AI模型,打破了以往GPU需与特定模型绑定的低效模式。

英伟达 GPU 用量削减 82%!阿里云打造“AI性能压榨魔鬼”,213张卡干1192张卡的活

在阿里云模型市场持续三个多月的Beta测试中,Aegaeon系统展现了卓越的效能。测试数据显示,在服务参数量高达720亿的大模型时,所需的英伟达H20 GPU数量从1192个成功减少至213个,削减幅度高达82%。

英伟达 GPU 用量削减 82%!阿里云打造“AI性能压榨魔鬼”,213张卡干1192张卡的活

这项由北京大学与阿里云合作完成的研究,被认为是首个公开揭示并解决市场上并发大语言模型服务存在过高成本问题的重要工作,为行业提供了全新的优化思路。

值得一提的是,阿里云首席技术官周靖人也是该论文的作者之一。周靖人同时是国际电气与电子工程师协会会士(IEEE Fellow)、国际计算机协会会士(ACM Fellow),并担任阿里巴巴集团副总裁、阿里云智能CTO及达摩院副院长。

来源:https://www.ithome.com/0/890/485.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

英伟达全新架构带动PCB用量增长2~3倍 同宇新材“20CM”涨停
科技数码
英伟达全新架构带动PCB用量增长2~3倍 同宇新材“20CM”涨停

4月7日,PCB概念反复活跃,截至发稿,成分股同宇新材(301630 SZ)20CM涨停,宏昌电子(603002 SH)、圣泉集团(605589 SH)等涨停,中英科技(300936 SZ)、铜冠铜

热心网友
04.07
季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?
AI
季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

AI 时代最赚钱的公司,可能从来不是做 AI 的那个。作者|张勇毅编辑|靖宇淘金热里最稳赚的人,从来不是淘金的,是卖铲子的。这句老话在 2026 年的科技行业又应验了一次。只不过这次卖铲子的不是英伟

热心网友
04.07
韩FuriosaAI今年量产2万颗RNGD芯片,计划云与端侧双轨并行
科技数码
韩FuriosaAI今年量产2万颗RNGD芯片,计划云与端侧双轨并行

IT之家 4 月 3 日消息,韩国 AI 芯片企业 FuriosaAI 当地时间昨日举行了其首届 RENEGADE 峰会,宣布了有关其高能效数据中心 AI 推理芯片产品线的一系列进展。根据该企业提供

热心网友
04.07
博通+谷歌打出TPU组合拳:3.5GW算力喂饱Anthropic
科技数码
博通+谷歌打出TPU组合拳:3.5GW算力喂饱Anthropic

快科技4月7日消息,据博通当地时间(4月6日)向美国证券交易委员会(SEC)提交的监管文件披露,该公司已与谷歌达成一项长期协议,将为谷歌生产未来版本的定制人工智能芯片。根据协议内容,博通将为谷歌未来

热心网友
04.07
DLSS 5遭全网造谣抹黑!实测拆穿三大谣言:错怪英伟达了
电脑教程
DLSS 5遭全网造谣抹黑!实测拆穿三大谣言:错怪英伟达了

上个月,英伟达正式推出 DLSS 5 技术,该技术主打为 PC 游戏带来大幅画面画质升级。因为 DLSS 5 依托 AI 实现功能,大批网友直接跟风开始抨击这项技术,大量不实谣言在短时间内快速传播。

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币重探7万美元,市场已全面消化美伊战争风险?
web3.0
比特币重探7万美元,市场已全面消化美伊战争风险?

清明节假期期间,A 股和港股休市,但比特币行情永不停歇。 4月6日,当多数市场还在假期中沉睡时,比特币已经悄然启动。价格从亚洲早盘的低点67400美元出发,一路向上试探,盘中最高涨破70300美元,不仅刷新了3月26日以来的高位,较日内低点的涨幅也超过了4%。以太坊的表现同样不俗,从2050美元附近

热心网友
04.07
魏思琪换上新机!REDMI K90至尊版来了 小米首款风冷旗舰
网络安全
魏思琪换上新机!REDMI K90至尊版来了 小米首款风冷旗舰

4月5日消息,日前,REDMI K90至尊版通过3C认证,预计将于本月发布。今日,小米中国区市场部总经理魏思琪用小米新机发布微博,不出意外,这正是即将登场的REDMI K90至尊版,这将是小米首款配

热心网友
04.07
WPS动态交互图表制作指南:让数据变化直观呈现
电脑教程
WPS动态交互图表制作指南:让数据变化直观呈现

WPS演示中图表不随数据更新时,可通过四种方法实现自动同步:一、用OFFSET+COUNTA定义动态名称绑定图表;二、用组合框控件联动VLOOKUP提取数据;三、用数据透视图配合切

热心网友
04.07
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品
科技数码
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用

热心网友
04.07
天上的马桶与地上的火药桶,都在让美国出糗
科技数码
天上的马桶与地上的火药桶,都在让美国出糗

太空中的马桶堵了,边飞边修还能勉强用。但中东被点燃的火药桶,美国怎么来扑灭?靠一再延期的“最后通牒”?还是靠无底线的轰炸?2300万美元的马桶美国航空航天局4名宇航员1日搭乘“猎户座”飞船升空,执行

热心网友
04.07