首页 游戏 软件 资讯 排行榜 专题
首页
AI
英伟达每美元性能是AMD15倍?成本解析帮你省更多

英伟达每美元性能是AMD15倍?成本解析帮你省更多

热心网友
85
转载
2026-01-01

梦晨 发自 凹非寺量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

为什么AI算力霸主永远是英伟达?

不算不知道,一算吓一跳:在英伟达平台每花一美元,获得的性能是AMD的15倍。

尽管英伟达卖的更贵,但只要买齐一套,就更省钱。



来自Signal65的一份最新详尽报告揭示了这个现实,一定条件下生成同样数量的token,英伟达的成本只有AMD的十五分之一。

这份报告基于SemiAnalysis Inference MAX的公开基准测试数据,时间跨度从2025年10月到12月,覆盖了从密集模型到前沿MoE推理模型的全场景测试。



黄仁勋的“买的越多,省的越多”原来是真的。



MoE时代:8卡系统撞上Scaling天花板

AI模型正在经历一场架构革命,打开Artificial Analysis排行榜就会发现,智能度排名前十的开源模型清一色都是MoE(Mixture of Experts,专家混合)推理模型。



另一项来自OpenRouter的数据显示,超过50%的token流量正在被路由到推理模型上。



MoE架构的核心思路是把模型参数拆分成多个专门化的“专家”子网络,每个token只激活其中一小部分。

以经典的DeepSeek-R1为例,它拥有6710亿总参数,但每个token只激活370亿——这让它能以更低的计算成本提供前沿级别的智能。



问题随之而来。当专家分布在多块GPU上时,GPU之间的通信延迟会导致计算单元空闲等待数据,这些空闲时间直接转化为服务商的成本。

报告指出,无论是英伟达B200还是AMD MI355X,所有8卡系统在超出单节点规模后都会撞上“扩展天花板”(scaling ceiling)。

英伟达GB200 NVL72的解法是把72块GPU通过NVLink连接成一个单一域,提供130 TB/s的互联带宽。

在软件层面,整个系统就像一块巨型GPU一样运作。配合英伟达Dynamo推理框架的分离式预填充-解码调度和动态KV缓存路由,这套架构能够有效突破8卡系统的通信瓶颈。

模型越复杂,英伟达的优势越明显

报告测试了三类典型模型:模型越复杂,英伟达的优势越明显。

在密集模型Llama 3.3 70B上,英伟达B200对比AMD MI355X的领先幅度相对温和。

在基线交互性(30 tokens/sec/user)下,B200的性能约为MI355X的1.8倍;当交互性要求提升到110 tokens/sec/user时,这一差距扩大到6倍以上。



中等规模的MoE模型GPT-OSS-120B开始让差距变得更加显著。

这款OpenAI开源模型拥有1170亿总参数,但每个token只激活约51亿参数。在2025年12月的测试数据中,100 tokens/sec/user交互性下B200的性能接近MI355X的3倍。

在更符合推理模型需求的250 tokens/sec/user条件下,差距扩大到6.6倍。



两个平台的绝对性能相比10月都有显著提升,英伟达的峰值吞吐从约7000 tokens/sec跃升至14000以上,AMD则从约6000提升到8500左右,但相对差距反而拉大了。



真正的分水岭出现在前沿推理模型DeepSeek-R1上。

这款模型集MoE路由、大参数规模和高强度推理生成于一身,对基础设施的要求极为苛刻。

测试结果显示:在25 tokens/sec/user交互性下,GB200 NVL72的每GPU性能是H200的10倍、MI325X的16倍;在60 tokens/sec/user下,相比H200的优势扩大到24倍,相比MI355X达到11.5倍;在75 tokens/sec/user下,GB200 NVL72的性能是B200单节点配置的6.5倍,是MI355X的28倍。



更关键的是,GB200 NVL72能够达到竞争平台根本无法企及的水平,在28卡配置下可以输出超过275 tokens/sec/user,而MI355X在相当吞吐水平下的峰值只有75 tokens/sec/user。

Token经济学:贵了1.86倍,便宜了15倍

直觉上,性能更强的平台应该更贵。事实也确实如此:根据Oracle Cloud的公开定价,GB200 NVL72的每GPU每小时价格为16美元,MI355X为8.60美元,前者是后者的1.86倍。

如果参照CoreWeave的定价,GB200 NVL72相比上一代H200的价格也贵了约1.67倍。



但报告的计算揭示了一个反直觉的结论:

在25 tokens/sec/user交互性下,GB200 NVL72的性能优势为5.85倍,除以1.86倍的价格溢价,每美元性能仍是MI355X的3.1倍。

在75 tokens/sec/user交互性下,28倍的性能优势除以1.86倍的价格,每美元性能达到MI355X的15倍,这意味着生成同等数量的token,英伟达平台的成本只有AMD的十五分之一。



与上一代产品的对比同样惊人。

报告估算在DeepSeek-R1的典型工作负载下,GB200 NVL72相比H200的性能提升约20倍。



而GB200 NVL72价格仅上涨1.67倍,换算下来每美元性能提升约12倍,单token成本降至H200的十二分之一。



MoE推理让网络成为推理成本的瓶颈,而机柜级的GB200 NVL72恰好解决了这个问题。价值的衡量标准正在从单纯的算力转向“每美元能产出多少智能”。

报告在结论中指出,AMD的竞争力并未被完全否定——在密集模型和容量驱动的场景下,MI325X和MI355X仍有用武之地。

AMD的机柜级解决方案Helios也在开发中,可能在未来12个月内缩小差距。

但就当前的前沿推理模型而言,从芯片到互联到软件的端到端平台设计,已经成为成本效益的决定性因素。


[1]https://signal65.com/research/ai/from-dense-to-mixture-of-experts-the-new-economics-of-ai-inference/

来源:https://www.163.com/dy/article/KI6IGLUA0511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AMD R9 9950X3D2 下月上市,微星技嘉华擎主板陆续支持
科技数码
AMD R9 9950X3D2 下月上市,微星技嘉华擎主板陆续支持

AMD锐龙9 9950X3D2正式发布:桌面处理器首次搭载双CCD 3D V-Cache技术 北京时间本周四,AMD官方正式发布了其锐龙处理器家族的全新旗舰——锐龙9 9950X3D2 Dual Edition处理器。该处理器已确认将于2026年4月22日全球同步发售,为追求极致性能的用户带来全新选

热心网友
04.02
AMD开启智能体主机时代,锐龙AI Max打造端侧AI算力底座
科技数码
AMD开启智能体主机时代,锐龙AI Max打造端侧AI算力底座

AMD定义AI计算新纪元:2026年智能体主机概念及锐龙AI Max全系产品深度解析 2026年3月20日,AMD于一场行业创新沙龙中重磅推出“智能体主机(Agent Computer)”的全新品类概念,并以此为核心,发布了驱动该变革的算力核心——锐龙AI Max系列处理器。这不仅标志着传统个人电脑

热心网友
04.02
索尼 PlayStation 5 首席架构师:PSSR 超分辨率升级版采用 INT8 数据格式
科技数码
索尼 PlayStation 5 首席架构师:PSSR 超分辨率升级版采用 INT8 数据格式

揭秘索尼 PSSR 技术方案:PlayStation 5 Pro 首席架构师详解 INT8 数据格式优势 2024年3月27日,行业传来一则关键信息。索尼PlayStation 5系列产品首席系统架构师Mark Cerny在接受著名技术媒体Digital Foundry专访时正式确认,最新推出的PS

热心网友
04.02
极夜 Next 2 迷你主机发售:R7 H255 准系统 2999 元,支持独显 + 双网口
科技数码
极夜 Next 2 迷你主机发售:R7 H255 准系统 2999 元,支持独显 + 双网口

极夜Next 2迷你主机震撼发布:支持独显扩展,迷你机性能新标杆 迷你主机市场迎来一位实力强劲的新成员。知名品牌极夜(TOPFEEL)近日正式发布了其全新Next 2系列迷你主机,其核心搭载了性能出色的AMD锐龙R7 H255处理器。仅看CPU配置或许不算独特,但这款迷你电脑拥有一项足以颠覆同类产品

热心网友
04.02
AMD发布FSR SDK 2.2,支持超分辨率4.1、光线再生1.1
科技数码
AMD发布FSR SDK 2.2,支持超分辨率4.1、光线再生1.1

AMD发布FSR SDK 2 2:开源核心升级,FSR 4 1与光线再生1 1正式登场 3月24日,AMD在其开源的GPUOpen平台上,正式向全球游戏开发者发布了AMD FidelityFX Super Resolution SDK 2 2版本。此次更新的一大亮点是,它直接集成了随Adrenali

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化
游戏资讯
《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化

《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照

热心网友
04.02
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀
科技数码
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀

雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战

热心网友
04.02
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验
科技数码
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验

借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动

热心网友
04.02
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情
游戏攻略
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情

冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让

热心网友
04.02
iPhone 18 Pro设计挤牙膏了 继续用前代模具
科技数码
iPhone 18 Pro设计挤牙膏了 继续用前代模具

iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消

热心网友
04.02