3月16日消息,据Linux补丁追踪平台Coelacanth-Dream爆料,AMD正针对指令集进行深度优化,重点在于提升Dual+Issue VALU与FMA指令的协同效率。这一改进有望在特定的工作负载下,实现GPU性能的成倍提升。
Dual+Issue VALU并非全新概念,已有的RDNA 3与RDNA 4架构已经设计了双ALU通道,理论上每个时钟周期可以执行两条指令。
然而,此前的架构在编译器层面难以对代码进行有效分组,导致硬件潜力无法完全释放。
而RDNA 5通过引入关键的FMA机制,允许编译器更轻松地将复杂的算术操作配对并发送至计算单元,从而使双通道的并行效率达到理想状态,进而让FP32计算能力在理论上实现翻倍。
这对游戏玩家与AI应用均有显著影响。在标准光栅化游戏中,更高效的指令调度将转化为更高且更稳定的帧率表现。
在神经网络与AI工作负载领域,FMA指令的优化同样至关重要,它能增强AMD下一代AI驱动的超分辨率技术与插帧功能。

