9月17日,据科技媒体Wccftech报道,AMD于9月16日正式推出ROCm 7.0计算软件平台,旨在挑战英伟达CUDA在AI领域的主导地位。该版本新增了对最新算法和模型的支持,同时扩展了AMD锐龙AI处理器及Radeon显卡的兼容性。

最新发布的ROCm 7.0更新公告显示,其最显著的优化体现在AI推理性能方面。根据AMD公布的数据,在DeepSeek R1基准测试中,Instinct MI355X显卡的FP8运算性能相较NVIDIA Blackwell B200提升了30%。

实际测试表明,相比前代ROCm 6,新版本在主流大模型上的性能提升显著:Llama 3.1 70B提升3.2倍,Qwen2-72B提升3.4倍,DeepSeek R1更是实现3.8倍的速度飞跃。

功能升级方面,ROCm 7.0整合了最新的AI算法支持、增强的扩展功能、对MI350系列GPU的优化,以及企业级集群管理工具,显著提升了大规模AI应用的稳定性和扩展能力。
新版本还新增了对Instinct MI355X/MI350X显卡的支持,并适配Ubuntu 24.04.3和Rocky Linux 9系统,同时终止了对部分旧版操作系统的维护。
在AI框架支持上,ROCm 7.0同步更新至PyTorch 2.7、TensorFlow 2.19.1等主流深度学习框架的最新版本,同时优化了数学计算库和通信库,为大模型训练和高性能计算提供了更强有力的支持。
