英伟达GB200 NVL72性能实测：超越AMD MI355X达28倍

在最新公布的 SemiAnalysis InferenceMAX 基准评测中，Signal65 对 Deepseek-R1 0528 混合专家（MoE）模型的推理能力进行了深度评估

近期，SemiAnalysis发布的InferenceMAX基准测试报告显示，Signal65对Deepseek-R1 0528混合专家（MoE）模型的推理能力进行了全面评估。测试结果指出，在同等规模条件下，英伟达GB200 NVL72机架级系统的推理性能显著优于AMD Instinct MI355X集群。

混合专家架构的核心优势在于能够根据任务需求动态调用最匹配的“专家”子模型，从而有效提升计算效率。然而，随着模型规模不断扩大，节点间通信延迟与带宽压力也随之加剧，极易演变为系统级瓶颈。

英伟达 GB200 NVL72 性能超越 AMD MI355X 达 28 倍

英伟达采用“深度协同设计”理念重构GB200 NVL72架构：通过超高速互连技术整合72颗GPU芯片，并集成高达30TB的统一内存池，大幅降低跨芯片数据搬运开销，有效缓解延迟难题。实测数据显示，在相近配置条件下，该系统单卡吞吐量达75 tokens/秒，性能约为AMD MI355X的28倍。

对头部云服务商而言，总体拥有成本（TCO）始终是部署决策的关键依据。Signal65结合Oracle云平台定价信息分析指出，GB200 NVL72不仅具备顶尖性能，更展现出极强的成本竞争力——其单位token成本仅为AMD方案的1/15，同时支持更高频次的交互响应。

尽管英伟达当前在MoE推理场景中占据明显领先地位，AMD仍保有差异化优势。报告特别提到，MI355X凭借大容量HBM3e显存，在稠密型模型推理任务中依然具备扎实的落地能力。

截至目前，AMD尚未发布可对标GB200 NVL72的新一代机架级产品。不过，随着AMD Helios平台与英伟达Vera Rubin平台之间的竞争日趋激烈，双方在整机扩展能力、能效比及软件生态层面的博弈将愈发关键。

源码地址：点击下载

英伟达GB200 NVL72性能实测：超越AMD MI355X达28倍

相关推荐

同类最新

优必选CEO周剑：家庭机器人生态核心投入过半精力

CPO/NPO/OIO开启封装级光连接价值空间，技术路线尚未收敛

龙岗AR实景剧本游内测体验短板有效破解之道

南下资金6月30日净买入中芯国际与建滔积层板

电动汽车电池新国标7月实施热失控不起火不爆炸