OpenAI发布GPT-5.3-Codex-Spark模型：千条Tokens秒级响应

IT之家 2 月 13 日消息，Cerebras 与 OpenAI 宣布推出最新的 GPT-5 3-Codex-Spark 模型，主打实时编程。这也是 OpenAI 与 Cerebras 合作的首个

IT之家2月13日消息，Cerebras与OpenAI联合发布了全新的GPT-5.3-Codex-Spark模型，专注于实时编程场景。这也是OpenAI与Cerebras达成合作后首次公开的技术成果。

IT之家备注：该模型由Cerebras提供算力支持，已于当地时间2月12日以“研究预览版”形式对外开放。

据介绍，Codex-Spark主要面向对交互速度要求极高的实时软件开发场景，可实现超过1000 tokens/秒的推理速度，从而提供近乎即时的编码反馈体验。

OpenAI在公告中指出，近年来“智能体编程”正在逐步改变软件开发模式，机器能够在较少人工监督的情况下持续工作数小时甚至数日。但这种模式也可能带来新的挑战，包括开发者等待时间延长、对开发过程的掌控感降低等问题。

OpenAI表示，软件开发本质上属于迭代过程，需要开发者在过程中持续把控方向、进行审美判断与决策。因此Codex-Spark被设计为与Codex实时协作的模型，强调“快速响应、及时反馈、易于引导”，让开发者始终保持在工作的主导位置。

从定位来看，Codex-Spark被描述为“具备高度能力的小型模型”，主要针对快速推理场景进行了优化。OpenAI称，在SWE-Bench Pro、Terminal-Bench 2.0等软件工程基准测试中，Codex-Spark在显著缩短任务耗时的同时，能够给出比GPT-5.1-Codex-mini更优质的回答。

在具体能力方面，OpenAI强调Codex-Spark擅长进行精确代码修改、计划调整，并能围绕代码库进行上下文问答。最新消息还提到，该模型适用于快速可视化新布局、优化样式，以及测试界面变更等工作。

OpenAI同时对Cerebras的硬件能力进行了介绍。据悉，Wafer-Scale Engine拥有业内最大的SoC片上内存，可支持用户实现每秒数千token级别的高速推理，并可扩展到数千套系统，将高速内存容量扩展至多TB级别，以支持万亿参数模型的训练与推理。OpenAI表示，预计在2026年将这种“超高速推理”能力扩展到更大规模的前沿模型。

在线上服务范围方面，OpenAI称Codex-Spark将以研究预览形式向ChatGPT Pro用户推送，覆盖Codex应用、命令行工具以及VS Code扩展，同时API访问将向部分设计合作伙伴逐步开放。