OpenAI与Cerebras近日正式达成一项为期多年的战略合作协议,约定自2026年起分批部署总计达750兆瓦的Cerebras晶圆级计算系统,以支撑OpenAI面向全球用户的AI服务。该项目有望成为全球迄今规模最大、带宽最高的AI实时推理基础设施。据内部消息人士透露,该合作总金额逾100亿美元。
据双方联合声明,本次协作的核心聚焦于显著增强OpenAI大模型的在线推理性能,尤其针对当前仍存在明显响应延迟的高复杂度任务,实现毫秒级响应突破。

OpenAI在其最新技术博客中强调,这批新型系统将大幅压缩长链推理与多步决策任务的端到端延迟,从而推动人机交互体验迈向更高自然度与流畅性。Cerebras联合创始人兼首席执行官Andrew Feldman指出:“正如带宽重塑了互联网的使用范式,实时推理能力的普及,也将彻底重构人工智能的应用边界。”
Cerebras成立于2015年,深耕芯片架构与系统级AI加速已逾十年;而自2024年ChatGPT爆发以来,其全栈自研的晶圆级引擎(WSE)技术迅速引发业界广泛关注。公司宣称,相比主流基于英伟达GPU构建的推理方案,其原生AI芯片在吞吐与能效比方面具备结构性优势。
事实上,双方的技术对话可追溯至2017年,此次大规模落地标志着大语言模型能力与专用硬件架构之间真正进入深度协同阶段。实测数据显示,Cerebras系统在运行典型大语言模型时,推理延迟较传统GPU集群最高降低达15倍。OpenAI工程副总裁Sachin Katti表示:“Cerebras提供的超低延迟专用推理平台,是实现真正沉浸式、拟真化AI对话的关键基石。”Cerebras方亦指出,依托此次合作,其晶圆级技术将首次规模化服务于数亿乃至数十亿终端用户。
