OpenAI发布GPT-5.3-Codex-Spark：提速主攻的首个模型来了

首页

热心网友

转载

2026-02-13

作为GPT-5.3-Codex的轻量化版本，这款模型也是OpenAI首个专门为实时编程场景打造的人工智能。

OpenAI最新推出了GPT-5.3-Codex-Spark编程助手。

这个轻量级版本基于GPT-5.3-Codex架构优化而成，更是OpenAI专为实时编程协作设计的首创模型。

最突出的优势在于响应速度：模型运行在Cerebras晶圆级芯片（WSE-3）上，推理速度突破每秒1000+token。

这也是OpenAI与Cerebras达成合作后的首个落地成果，致力于在超低延迟硬件上提供近乎即时的代码编写体验。

以往Codex这类前沿模型的强项在于长程任务——能够自主工作数小时、数天甚至数周。但在日常编程场景中，开发者往往只需修改某个逻辑、调整某个接口，如果还要等待模型长时间思考，体验就会大打折扣。

Codex-Spark正是为了填补这一空白而生。它专注于实时协作：你可以边查看输出结果，边进行打断、修正或重定向操作，真正实现"跟手"般的交互体验。

为了追求极致响应，模型的默认工作模式非常克制：只进行最小化、针对性的代码编辑，除非明确要求，否则不会自动运行测试用例。

在SWE-Bench Pro和Terminal-Bench 2.0两大基准测试中，Codex-Spark表现亮眼，耗时仅为GPT-5.3-Codex的零头。

为了匹配这种高速响应，OpenAI对底层推理管线进行了深度优化。

通过引入持久化WebSocket连接和重构推理栈，整个请求-响应链路的延迟显著降低：

客户端/服务器往返开销降低80%。每个token的额外开销减少30%。首个token的生成时间缩短50%。

这种WebSocket路径目前对Codex-Spark默认启用，很快也会推广至所有模型。

在硬件策略上，Cerebras负责极低延迟的推理服务层，而GPU仍然是训练和通用推理的基石。未来在单一工作负载中，两者可以混合使用，兼顾性能与成本。

目前，Codex-Spark已作为研究预览版向ChatGPT Pro用户开放，集成在最新的Codex应用、CLI和VS Code扩展中。

现阶段支持128k上下文长度，仅限文本输入。由于运行在专用硬件上，它有独立的速率限制，且不占用标准额度。

这只是第一步。

OpenAI的后续规划是让长线推理和实时协作两种模式深度融合：Codex可以在与你保持紧密交互的同时，将耗时的长任务分发给后台的子智能体或并行模型。用户不需要预先做选择，系统会自动平衡广度与速度。

随着模型能力不断增强，交互速度正成为最大瓶颈。超快推理将收紧这个反馈循环，让想法转化为软件的过程更加自然流畅。

来源:https://www.51cto.com/article/836503.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：机器人自学20分钟获满分：数字孪生技术颠覆RL训练效率下一篇：Anthropic估值3800亿成AI新王，300亿美金加冕马斯克急了

相关攻略

业界动态

OpenAI员工月耗940万token训练龙虾之父模型

AI编程团队30天调用OpenAIAPI费用达130万美元，消耗6030亿token，由OpenAI承担。该费用用于开发多智能体协作项目OpenClaw，通过小型专用AI协同完成代码审查等任务。尽管成本高昂，但相比旧金山人力成本，其效率与回报率更优，预示软件开发模式革新。

热心网友

05.17

业界动态

OpenAI资助AI程序员团队月耗130万美元引热议

一个三人团队通过运行约100个AI智能体进行软件开发，月消耗130万美元，由OpenAI全额承担。这些AI深度参与代码审查、漏洞修复等协作流程，极大提升了效率。此举展示了AI作为“数字员工”的潜力，随着成本下降，大规模AI协作或将成为创业团队的常态，预示软件开发模式的根本变革。

热心网友

05.17

OpenAI与微软分道扬镳七年合作后直面马斯克挑战

2024年8月，比尔·盖茨给OpenAI团队出了一道AP生物考试题。他当时断言，语言模型想在这类考试中拿高分，至少还得等上三年。结果呢？OpenAI只用了两个月，就交出了一份满分答卷。后来，盖茨在播客里回忆那个瞬间，称之为“人生中见过最震撼的技术演示”。当时恐怕没人能想到，这场看似寻常的测试，会

热心网友

05.17

OpenAI生命科学推理模型GPT-Rosalind详解与应用

GPT-Rosalind是什么在生命科学领域，一个能真正理解复杂生物学问题、并能像资深研究员一样进行推理的AI助手，长久以来似乎都停留在想象中。现在，OpenAI将这一想象推向了现实，推出了名为GPT-Rosalind的专用推理模型。这个名字，致敬了揭示DNA双螺旋结构的关键科学家——罗莎琳德·富

热心网友

05.17

OpenAI遭集体诉讼 ChatGPT被指泄露用户隐私数据

OpenAI公司因数据隐私问题在美国加州面临集体诉讼。原告指控其在ChatGPT网站中嵌入了MetaPixel和GoogleAnalytics等追踪工具，导致用户的邮箱、ID及输入的查询文本等敏感信息可能被分享给Meta和谷歌等第三方。此案争议焦点在于，ChatGPT处理的信息通常高度私密，涉及

热心网友

05.17

热门推荐

科技数码

Keychron Z11 Ultra 8K分体式Alice键盘5月13日上市

Keychron（渴创）即将发布全新旗舰级机械键盘Z11 Ultra 8K。官方宣布，这款备受期待的“铝坨坨”键盘将于5月13日在全平台正式上市。其核心设计亮点在于采用了创新的平面式分体结构，并基于无Fn区的紧凑型Alice人体工学配列。这种设计旨在显著提升长时间打字或编程的舒适度，通过更符合自然手

热心网友

05.17

web3.0

Token与Session和Cookie的区别及在Web3中的应用解析

针对cookie、session和token的区别问题，提供了多个更口语化且符合搜索习惯的标题优化版本，包括直接提问式、场景式、详解清单式和简单直白式，旨在更直观地突出核心比较信息并控制标题长度。

热心网友

05.17

科技数码

Arm客户两年内对AGI芯片需求突破20亿美元

Arm近期的发展势头持续强劲，在最新公布的2026财年第四季度财报会议中，公司披露了一项关键进展：客户对其首款自研处理器——Arm AGI CPU——在2027至2028财年期间的总需求预估已超过20亿美元。相比今年3月产品发布时的初期预期，这一数字增长超过一倍，反映出市场对Arm自研芯片的高度期待

热心网友

05.17

科技数码

Cerebras AI芯片IPO获超20倍认购拟上调发行价近30%

资本市场对AI硬件的热情，似乎找到了一个新的焦点。路透社昨日援引知情人士消息称，AI芯片新锐Cerebras Systems即将进行的首次公开募股（IPO），获得了投资者的热烈追捧，超额认购倍数已突破20倍。根据资本信息平台Dealogic的数据，这桩IPO有望成为2026年以来全球规模最大的一笔。

热心网友

05.17

web3.0

Token分类全解析：从功能型到治理型如何定义与区分

加密货币代币主要分为实用型、证券型、支付型、治理型和资产型五大类。其分类依据核心功能与属性，如是否代表资产、提供使用权或参与治理等。区分标准需结合具体设计、经济模型及法律框架综合判断。

热心网友

05.17