NVIDIA 将持续提供由 SchedMD 开发的中立开源 Slurm 软件,确保其在高性能计算 (HPC) 及 AI 领域的广泛应用性。
NVIDIA 今日宣布收购 SchedMD——作为 Slurm 的主要开发商,SchedMD 所开发的这款开源工作负载管理系统,是支撑 HPC 和 AI 应用的关键基础设施。此次收购旨在进一步夯实开源软件生态系统,助力研究人员、开发者和企业持续进行 AI 创新。
未来,NVIDIA 将继续开发并提供这款厂商中立、开源的 Slurm 软件,支持其在各类硬件和软件环境中广泛部署与应用,并获得来自高性能计算与 AI 社区的持续支持。
高性能计算与人工智能工作负载通常涉及在集群上运行复杂的并行任务计算,这需要对计算资源进行高效的编排、调度与分配。随着 HPC 和 AI 集群的规模日益庞大、性能愈发强大,实现高效的资源利用变得至关重要。
作为在可扩展性、吞吐量与复杂策略管理方面领先的工作负载管理器与作业调度系统,Slurm 为全球超级计算机 TOP500 榜单中位列前十及前一百的一半以上系统提供了核心支撑。
Slurm 不仅获得 NVIDIA 最新硬件平台的支持,也是构建生成式 AI 所需关键基础设施的一部分。基础模型开发者与 AI 构建者们利用它来管理大规模的模型训练与推理需求。
SchedMD 首席执行官 Danny Auble 表示:“我们非常高兴能与 NVIDIA 携手合作。此次收购充分验证了 Slurm 在严苛的 HPC 与 AI 环境中发挥的关键作用。NVIDIA 在加速计算领域的深厚专业能力和投入,将进一步推动 Slurm 的发展,而 Slurm 也将继续保持开源,以满足下一代 AI 与超级计算的演进需求。”
NVIDIA 与 SchedMD 的合作已超过十年,未来也将持续投入 Slurm 的开发,确保其持续成为 HPC 与 AI 领域领先的开源调度系统。
NVIDIA 将加速 SchedMD 对新架构的访问,使 NVIDIA 加速计算平台的用户能够优化其整个计算基础设施的工作负载。同时,我们也将支持多样化的硬件和软件生态系统,帮助用户能够运用最新的 Slurm 创新,运行异构集群。
NVIDIA 将持续为 SchedMD 的数百家客户提供 Slurm 的开源软件支持、培训与开发服务。这些客户涵盖云服务提供商、制造企业、AI 公司与研究实验室,行业遍及自动驾驶、医疗健康与生命科学、能源、金融服务、制造业等。
NVIDIA 正携手 SchedMD,共同支持开源软件生态系统,推动各行各业、各种规模的高性能计算与人工智能创新。
