IT之家2月13日消息,Cerebras与OpenAI联合发布了全新的GPT-5.3-Codex-Spark模型,专注于实时编程场景。这也是OpenAI与Cerebras达成合作后首次公开的技术成果。
IT之家备注:该模型由Cerebras提供算力支持,已于当地时间2月12日以“研究预览版”形式对外开放。

据介绍,Codex-Spark主要面向对交互速度要求极高的实时软件开发场景,可实现超过1000 tokens/秒的推理速度,从而提供近乎即时的编码反馈体验。
OpenAI在公告中指出,近年来“智能体编程”正在逐步改变软件开发模式,机器能够在较少人工监督的情况下持续工作数小时甚至数日。但这种模式也可能带来新的挑战,包括开发者等待时间延长、对开发过程的掌控感降低等问题。
OpenAI表示,软件开发本质上属于迭代过程,需要开发者在过程中持续把控方向、进行审美判断与决策。因此Codex-Spark被设计为与Codex实时协作的模型,强调“快速响应、及时反馈、易于引导”,让开发者始终保持在工作的主导位置。
从定位来看,Codex-Spark被描述为“具备高度能力的小型模型”,主要针对快速推理场景进行了优化。OpenAI称,在SWE-Bench Pro、Terminal-Bench 2.0等软件工程基准测试中,Codex-Spark在显著缩短任务耗时的同时,能够给出比GPT-5.1-Codex-mini更优质的回答。
在具体能力方面,OpenAI强调Codex-Spark擅长进行精确代码修改、计划调整,并能围绕代码库进行上下文问答。最新消息还提到,该模型适用于快速可视化新布局、优化样式,以及测试界面变更等工作。
OpenAI同时对Cerebras的硬件能力进行了介绍。据悉,Wafer-Scale Engine拥有业内最大的SoC片上内存,可支持用户实现每秒数千token级别的高速推理,并可扩展到数千套系统,将高速内存容量扩展至多TB级别,以支持万亿参数模型的训练与推理。OpenAI表示,预计在2026年将这种“超高速推理”能力扩展到更大规模的前沿模型。
在线上服务范围方面,OpenAI称Codex-Spark将以研究预览形式向ChatGPT Pro用户推送,覆盖Codex应用、命令行工具以及VS Code扩展,同时API访问将向部分设计合作伙伴逐步开放。
