近期,SemiAnalysis发布的InferenceMAX基准测试报告显示,Signal65对Deepseek-R1 0528混合专家(MoE)模型的推理能力进行了全面评估。测试结果指出,在同等规模条件下,英伟达GB200 NVL72机架级系统的推理性能显著优于AMD Instinct MI355X集群。
混合专家架构的核心优势在于能够根据任务需求动态调用最匹配的“专家”子模型,从而有效提升计算效率。然而,随着模型规模不断扩大,节点间通信延迟与带宽压力也随之加剧,极易演变为系统级瓶颈。

英伟达采用“深度协同设计”理念重构GB200 NVL72架构:通过超高速互连技术整合72颗GPU芯片,并集成高达30TB的统一内存池,大幅降低跨芯片数据搬运开销,有效缓解延迟难题。实测数据显示,在相近配置条件下,该系统单卡吞吐量达75 tokens/秒,性能约为AMD MI355X的28倍。
对头部云服务商而言,总体拥有成本(TCO)始终是部署决策的关键依据。Signal65结合Oracle云平台定价信息分析指出,GB200 NVL72不仅具备顶尖性能,更展现出极强的成本竞争力——其单位token成本仅为AMD方案的1/15,同时支持更高频次的交互响应。
尽管英伟达当前在MoE推理场景中占据明显领先地位,AMD仍保有差异化优势。报告特别提到,MI355X凭借大容量HBM3e显存,在稠密型模型推理任务中依然具备扎实的落地能力。
截至目前,AMD尚未发布可对标GB200 NVL72的新一代机架级产品。不过,随着AMD Helios平台与英伟达Vera Rubin平台之间的竞争日趋激烈,双方在整机扩展能力、能效比及软件生态层面的博弈将愈发关键。
源码地址:点击下载
