11月9日消息,长期以来,NVIDIA凭借其强大的CUDA生态系统牢牢占据AI领域的主导地位,相比之下,竞争对手如AMD所推出的ROCm等方案至今仍不够成熟。不过,这一相对固化的格局正在迎来破局者——微软。
据一位微软内部高级别员工透露,公司已着手开发一款专用“工具包”,可将原本基于NVIDIA CUDA的模型高效转换或转译为ROCm兼容代码,从而使模型能够在AMD系列GPU上顺利运行。
此举的核心意图在于打破当前CUDA所形成的“生态壁垒”,为其日益增长的AI推理工作负载寻找更具成本效益的替代解决方案。
微软之所以积极投入相关工具开发,是因为他们观察到AI推理任务的业务需求正在快速攀升。相较于价格高昂的NVIDIA GPU,AMD的AI芯片在推理场景中展现出更优的性价比。
通过软件层面的转换技术,微软有望充分利用AMD硬件在成本方面的优势,进而有效控制自身的运营投入。
有分析指出,该工具包可能采用类似ZLUDA所使用的运行时兼容层架构,在不改动源代码的前提下,将CUDA API调用实时翻译为ROCm指令。
不过也要看到,由于ROCm平台本身仍处于不断完善阶段,部分CUDA代码在转换过程中仍缺乏完整的功能映射,可能导致转换后的性能出现一定损失。这一问题在大型数据中心运行环境中仍是一个需要克服的挑战。

