12月20日最新动态显示,前不久刚登陆资本市场的国产GPU新锐摩尔线程,在实现市值突破4000亿的亮眼成绩后,如今再度发布了全新一代GPU架构,其AI运算和游戏性能均迎来跨越式提升,其中游戏性能更是飙涨了15倍之多。
即便在当前一代显卡中,摩尔线程也持续与合作伙伴携手推进技术优化——硅基流动今日宣布,已在S5000显卡上实现了国产GPU推理性能的飞跃。
根据实测数据显示,经过系统级工程优化与FP8精度加速,摩尔线程MTT S5000单卡在Prefill阶段的吞吐量突破4000 tokens/s,而Decode性能更是超过1000 tokens/s。
这意味着什么?通过与NVIDIA H100显卡的对比可见,在相同场景下H100的Prefill性能约为6500 tokens/s,而MTT S5000实现了4000+ tokens/s的实际吞吐,达成了NVIDIA H100实测性能的约61%。
虽然这仅是Prefill阶段的性能表现,但S5000能达到H100显卡60%以上的水准,无疑标志着国产显卡迈出了重要一步。

MTT S5000作为摩尔线程基于"平湖"GPU架构推出的AI显卡,首次支持FP8精度运算,理论性能可达1024TFLOPS,而H100的FP8性能接近4000TFLOPS。
关于硅基流动与摩尔线程如何优化S5000显卡的详细技术方案,可参阅他们发布的最新技术文档。值得关注的是,尽管国产显卡在硬件参数上与业界旗舰仍有差距,但通过深度的工程优化,其实际性能表现正在实现超乎预期的提升。
目前摩尔线程的发展瓶颈除了受制于硬件规模与制程工艺等因素,软件生态方面也尚无法与NVIDIA直接抗衡。但随着国内厂商的协同发力,这一领域已开始显现积极变化。未来几年,随着硬件规模持续扩大与软件生态不断完善,不论是AI计算卡还是游戏显卡,国产厂商打造出让NVIDIA感到竞争压力的产品也并非遥不可及。

