
2025年12月20日,国产GPU企业摩尔线程正式推出了全新一代图形处理器架构,其在人工智能与游戏应用领域的性能表现均实现了显著飞跃。更为突出的是,其游戏性能相较前代产品提升高达15倍。此前该公司刚刚完成上市,市值一度突破4000亿元,此次新架构的亮相进一步展现了其扎实的技术进取步伐。
尽管当前产品在整体硬件规格上与国际顶尖水平仍有一定差距,但摩尔线程一直通过联合生态伙伴持续推进显卡性能优化。近期,硅基流动宣布,在搭载摩尔线程MTT S5000显卡的平台上,国产GPU在AI推理性能方面取得了重要突破。
实测数据显示,经过系统级工程调优并结合FP8精度加速技术,MTT S5000单卡在Prefill(预填充)阶段的吞吐能力已超过4000 tokens/秒,而在Decode(解码)阶段的吞吐也突破了1000 tokens/秒。若以NVIDIA H100显卡作为参照,在相同测试场景下,H100的Prefill吞吐约为6500 tokens/秒。这意味着S5000在实际运行性能上已达到H100的61%以上。虽然此次对比局限于特定工作阶段,但这一表现无疑在国产GPU发展历程中具有标志性意义。
MTT S5000基于摩尔线程自研的“平湖”GPU架构打造,是首款支持FP8精度格式的国产AI显卡,其理论算力可达1024 TFLOPS。而同类国际产品如H100在FP8模式下的算力接近4000 TFLOPS。尽管绝对算力仍有差距,但通过软硬件协同优化,其在真实应用场景中的性能释放已取得明显进展。
此次性能提升的背后,是硅基流动与摩尔线程在底层驱动、计算框架和模型部署等多个环节深入协作的成果。这表明,即便在硬件工艺和规模受限的情况下,国内厂商仍可通过系统性工程优化,充分挖掘现有平台的潜力,实现在某些关键应用场景下的性能跃升。
目前,摩尔线程在硬件制程、芯片规模等方面仍面临客观制约,软件生态建设也尚处于追赶阶段,尚无法与成熟厂商全面比肩。但随着国内产业链上下游企业的协同推进,相关环境正在逐步改善。未来几年,随着硬件能力持续增强与软件生态不断完善,国产GPU有望在AI计算和图形处理等领域推出具备市场竞争力的产品,逐步形成对主流产品的挑战能力。
