9月16日最新动态显示,NVIDIA称霸AI市场的秘诀不止于GPU性能优势,其CUDA软件生态的壁垒作用同样功不可没。
面对这一格局,AMD正加速完善AI生态系统,继6月份预告后正式推出全新ROCm 7平台。此次升级堪称AMD向CUDA阵营发起的重要挑战,更值得关注的是该平台采用开源策略,目前已正式入驻GitHub代码托管平台。
ROCm 7带来了全方位升级:原生支持MI350X/MI355X系列显卡,新增GPU KVM直通功能,同时适配PyTorch 2.7、TensorFlow 2.19.1、ONNX 1.22、Triton 3.3以及JAX 0.6.0等主流AI框架。
详细更新日志可查阅官方文档:rocm.docs.amd.com

据发布会演示数据显示,ROCm7在不同AI模型上展现出显著性能飞跃:Llama 3.1 70B提速达3.2倍,Qwen2-72B提升3.4倍,DeepSeek R1更是取得3.8倍的性能突破。
在训练任务方面,Llama 2 70B、Llama 3.1 8B以及Qwen 1.5 7B三类模型平均性能提升幅度达到3倍。
AMD同时透露,2024年内将持续优化ROCm7的生态兼容性:将扩展对锐龙移动平台的支持范围,完善Linux系统适配,并将Windows系统支持纳入正式版本。这些举措将有效解决开发者长期诟病的平台支持问题。

