游乐游手机版
首页/AI热点日报/热点详情

Pure Storage与Meta联合开发AI超级计算机

类型:热点整理2026-07-05
PureStorage与Meta成功合作开发AI超级计算机RSC,采用FlashArray C和FlashBlade全闪存储方案,提供微秒级超低延迟、99 9999%企业级极高可用性及高密度QLC架构,满足数万亿超大规模示例训练与多模态数据分析需求,支撑元宇宙与增强现实工具研发。

  这篇文章将深入解析Pure StorageMeta联合打造的人工智能超级计算机Research SuperCluster (RSC)的技术架构、核心优势以及其背后的存储解决方案。无论你是AI研究人员、IT架构师,还是对超级计算领域感兴趣的读者,都能从中获得清晰、实用的信息。

一、项目背景:Meta 的 AI 超级计算机 RSC

  Meta(原 Facebook)正在推进其下一代 AI 超级计算机项目——Research SuperCluster(RSC)。Meta 表示,RSC 是目前运算速度顶尖的 AI 超级计算机之一,并计划在 2022 年年中完成部署后,成为全球范围内性能最强的 AI 超级计算机。

  • 核心目标:助力 AI 研究人员构建更强大的模型,这些模型能够基于数万亿个示例进行学习,支持数百种语言,并能无缝分析文本、图像与视频内容。
  • 应用场景:开发全新的增强现实工具,并为 元宇宙 的技术基础建设铺平道路。由 AI 驱动的应用与产品将在该平台中扮演关键角色。

小提示: RSC 并非普通的服务器集群,它需要处理海量的结构化和非结构化数据,因此对存储系统的性能、可靠性以及扩展性提出了极为严苛的要求。

二、为什么 Meta 选择 Pure Storage?

  Meta 之所以选择 Pure Storage 作为合作伙伴,关键在于 Pure 能够提供强大且具备可扩展性的存储能力,完美契合 RSC 的复杂需求。Pure 是 Meta 的长期技术供应商,早在 2017 年就参与了 Meta 第一代 AI 研究基础设施的设计工作。RSC 是双方长期合作结出的又一硕果。

  Pure Storage 首席技术官 Rob Lee 表示:“为元宇宙赋能的技术,需要大规模且强大的计算方案,以即时分析不断增长的数据量。Meta 公司的 RSC 是超级计算领域的一项重大突破,我们非常荣幸能够参与到这一项目中。”

Pure Storage 的技术优势

  • 简易性: 管理流程简便,有效降低运维复杂度。
  • 可靠性: 提供经过验证的 99.9999% 可用性,确保业务连续性。
  • 可持续性: 在追求环保的前提下,通过高性能架构优化方案,从容应对大规模 AI 工作负载。
  • 高性能: 支持结构化和非结构化数据的快速分析与处理。

三、RSC 所用的 Pure 存储解决方案详解

  以下是 Meta 的 RSC 具体采用的 Pure Storage 产品组合:

1. FlashArray//C — 高容量企业级存储平台

  • 核心特性: 专为要求严苛的环境设计,提供超高系统整合率,有效节省空间。
  • 性能指标: 经过验证的 99.9999% 可用性,以及 毫秒以下的超低微秒级 I/O 延迟
  • 独特架构: 采用 QLC 架构,使存储阵列能够满足 RSC 环境对性能、功耗、密度和空间利用的严格要求。

2. FlashBlade — 全闪存文件与对象存储解决方案

  • 设计目标: 专为整合高并发的文件与对象数据存储服务而设计。
  • 并行能力: 借助一套大规模的并行运算平台,能够为 数十亿的对象和文件 提供超高性能的存储服务。
  • 适用场景: 非常适合 AI 训练过程中大量非结构化数据(如图像、视频、日志等)的快速读写与处理。

小提示: 在构建类似 RSC 的超级计算机时,需注意存储与计算节点之间的网络带宽匹配。Pure 的 FlashBlade 通过并行架构有效消除了传统 NAS 的性能瓶颈,特别适合大规模分布式 AI 训练场景。

四、常见问题与解答

问题1:RSC 超级计算机与普通的 AI 服务器集群有什么区别?

答: RSC 是为处理超大规模 AI 模型而专门设计的超级计算机。其具备以下特点:

  • 超强算力: 训练模型的数据量可达数万亿个示例,远超常规服务器的处理能力。
  • 统一存储: 需要同时高效处理结构化和非结构化数据,且要求极低的延迟和高吞吐量。Pure 的 FlashArray//C 和 FlashBlade 分别针对这两类数据进行了优化,形成了互补的解决方案。
  • 长期可靠性: 99.9999% 可用性意味着年计划外停机时间不超过 31.5 秒,这是普通企业级存储难以达到的可靠水平。

问题2:Pure 的 QLC 架构在 AI 场景中是否足够快?

答: 是的,完全足够。传统观点认为 QLC(四层单元)闪存速度不如 TLC,但 Pure 的 FlashArray//C 采用了独特的 DirectFlash 模块Purity 操作系统,有效消除了硬件控制器的性能瓶颈,实现了微秒级延迟。在 RSC 这种对功耗和空间要求极为苛刻的环境中,QLC 的高密度、低功耗优势比极致的绝对速度更重要。对于需要更高性能的元数据密集型操作,Pure 还有 FlashArray//X 等 TLC 产品可供选择,但在 RSC 的应用场景下,QLC 已完全能够胜任。

问题3:Meta 为什么会选择长期合作 Pure,而不是其他存储厂商?

答: 主要基于以下三点考虑:

  1. 历史基础: 自 2017 年起,Pure 就为 Meta 的第一代 AI 研究设施提供存储支持,双方已建立了深厚的技术磨合与信任。
  2. 性能与扩展性: Pure 的 FlashArray 和 FlashBlade 能够无缝支持从 TB 级到 EB 级的数据增长,且无需对现有架构进行大规模重构。
  3. 环保与可持续性: Pure 的产品在同等性能下功耗更低,完全符合 Meta 对数据中心碳排放的严格要求,这也是 RSC 项目的重要考量因素之一。

五、总结与展望

  Pure Storage 与 Meta 的合作,充分证明了 全闪存存储在高性能计算(HPC)和 AI 领域的巨大潜力。通过 FlashArray//C 和 FlashBlade 的灵活组合,RSC 获得了无与伦比的性能、可靠性以及可持续发展能力。未来,随着元宇宙等新兴应用的兴起,对存储实时数据处理能力的要求将进一步提升,Pure 的解决方案将继续发挥至关重要的支撑作用。

  如果你正在设计或运维 AI 训练平台,不妨参考 RSC 的存储选型思路:对结构化数据采用高可用、低延迟的块存储,对非结构化数据采用高吞吐、具备并行能力的文件/对象存储,并确保两者都具备灵活的弹性扩展能力。

来源:https://m.elecfans.com/article/1789151.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。