
2025年12月21日,AMD正式发布了一份披露Zen6架构设计的关键文档,内容为AMD Family 1Ah Model 50h-57h处理器性能监控计数器。这份文件通过性能监控接口,揭开了Zen6架构背后的诸多技术细节。
此次信息聚焦于EPYC数据中心处理器所采用的Zen6核心架构,虽然未涉及消费级产品,但其底层的设计思路具有很高的参考价值。
此前业界已知,基于台积电2纳米工艺打造的EPYC Zen6,将成为支持单芯片最高256核心的高性能处理器。最新公布的文档进一步揭示,Zen6并非基于Zen4或Zen5的小幅迭代,而是一次针对高吞吐量计算场景、进行全面重构的架构升级,具备更宽的指令执行能力。其指令调度引擎实现了8路并行宽度,接近苹果同类设计的9路水平,同时继续保留对SMT同步多线程技术的支持。
在架构层面,Zen6显著加强了对矢量运算与浮点运算状态的监控能力,反映出其对高强度数学计算负载的高度重视。每个核心都集成了专用性能计数器,能够精准追踪调度窗口空闲状况、后端流水线阻塞以及线程选择带来的性能损耗,进一步验证了该架构在宽发射机制与SMT资源调度策略上的深度优化。
在指令集支持方面,Zen6延续了对完整512位宽度AVX-512指令集的支持,兼容FP64、FP32、FP16及BF16等多种数据格式,并支持FMA融合乘加、MAC乘积累加等关键运算模式。同时支持浮点与整数混合的矢量运算,涵盖VNNI矢量神经网络指令、AES加密指令以及SHA安全哈希算法等功能。
尤为值得注意的是,Zen6在AVX-512指令的持续吞吐能力上实现了显著提升。其每周期可完成的矢量运算量,已超出传统性能测量手段的覆盖范围,因此必须依赖新型合并式性能计数器才能实现准确监控。近年来,AVX-512已成为AMD在高性能计算领域的重要技术优势,而Zen6的表现进一步巩固了这一地位。
综合来看,Zen6标志着AMD首次从底层出发,专门针对数据中心与人工智能应用需求构建的全新微架构,将在高性能计算领域展现强大潜力。至于未来消费级产品将继承哪些特性,实际运行表现如何,仍有待后续信息揭晓。
