首页 游戏 软件 资讯 排行榜 专题
首页
AI
OpenAI发布GPT-5.3-Codex-Spark:提速主攻的首个模型来了

OpenAI发布GPT-5.3-Codex-Spark:提速主攻的首个模型来了

热心网友
36
转载
2026-02-13

作为GPT-5.3-Codex的轻量化版本,这款模型也是OpenAI首个专门为实时编程场景打造的人工智能。

OpenAI最新推出了GPT-5.3-Codex-Spark编程助手。

这个轻量级版本基于GPT-5.3-Codex架构优化而成,更是OpenAI专为实时编程协作设计的首创模型。

最突出的优势在于响应速度:模型运行在Cerebras晶圆级芯片(WSE-3)上,推理速度突破每秒1000+token。

这也是OpenAI与Cerebras达成合作后的首个落地成果,致力于在超低延迟硬件上提供近乎即时的代码编写体验。

以往Codex这类前沿模型的强项在于长程任务——能够自主工作数小时、数天甚至数周。但在日常编程场景中,开发者往往只需修改某个逻辑、调整某个接口,如果还要等待模型长时间思考,体验就会大打折扣。

Codex-Spark正是为了填补这一空白而生。它专注于实时协作:你可以边查看输出结果,边进行打断、修正或重定向操作,真正实现"跟手"般的交互体验。

为了追求极致响应,模型的默认工作模式非常克制:只进行最小化、针对性的代码编辑,除非明确要求,否则不会自动运行测试用例。

在SWE-Bench Pro和Terminal-Bench 2.0两大基准测试中,Codex-Spark表现亮眼,耗时仅为GPT-5.3-Codex的零头。

为了匹配这种高速响应,OpenAI对底层推理管线进行了深度优化。

通过引入持久化WebSocket连接和重构推理栈,整个请求-响应链路的延迟显著降低:

客户端/服务器往返开销降低80%。每个token的额外开销减少30%。首个token的生成时间缩短50%。

这种WebSocket路径目前对Codex-Spark默认启用,很快也会推广至所有模型。

在硬件策略上,Cerebras负责极低延迟的推理服务层,而GPU仍然是训练和通用推理的基石。未来在单一工作负载中,两者可以混合使用,兼顾性能与成本。

目前,Codex-Spark已作为研究预览版向ChatGPT Pro用户开放,集成在最新的Codex应用、CLI和VS Code扩展中。

现阶段支持128k上下文长度,仅限文本输入。由于运行在专用硬件上,它有独立的速率限制,且不占用标准额度。

这只是第一步。

OpenAI的后续规划是让长线推理和实时协作两种模式深度融合:Codex可以在与你保持紧密交互的同时,将耗时的长任务分发给后台的子智能体或并行模型。用户不需要预先做选择,系统会自动平衡广度与速度。

随着模型能力不断增强,交互速度正成为最大瓶颈。超快推理将收紧这个反馈循环,让想法转化为软件的过程更加自然流畅。

来源:https://www.51cto.com/article/836503.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenAI员工月耗940万token训练龙虾之父模型
业界动态
OpenAI员工月耗940万token训练龙虾之父模型

AI编程团队30天调用OpenAIAPI费用达130万美元,消耗6030亿token,由OpenAI承担。该费用用于开发多智能体协作项目OpenClaw,通过小型专用AI协同完成代码审查等任务。尽管成本高昂,但相比旧金山人力成本,其效率与回报率更优,预示软件开发模式革新。

热心网友
05.17
OpenAI资助AI程序员团队 月耗130万美元引热议
业界动态
OpenAI资助AI程序员团队 月耗130万美元引热议

一个三人团队通过运行约100个AI智能体进行软件开发,月消耗130万美元,由OpenAI全额承担。这些AI深度参与代码审查、漏洞修复等协作流程,极大提升了效率。此举展示了AI作为“数字员工”的潜力,随着成本下降,大规模AI协作或将成为创业团队的常态,预示软件开发模式的根本变革。

热心网友
05.17
OpenAI与微软分道扬镳 七年合作后直面马斯克挑战
AI
OpenAI与微软分道扬镳 七年合作后直面马斯克挑战

2024年8月,比尔·盖茨给OpenAI团队出了一道AP生物考试题。他当时断言,语言模型想在这类考试中拿高分,至少还得等上三年。 结果呢?OpenAI只用了两个月,就交出了一份满分答卷。后来,盖茨在播客里回忆那个瞬间,称之为“人生中见过最震撼的技术演示”。 当时恐怕没人能想到,这场看似寻常的测试,会

热心网友
05.17
OpenAI生命科学推理模型GPT-Rosalind详解与应用
AI
OpenAI生命科学推理模型GPT-Rosalind详解与应用

GPT-Rosalind是什么 在生命科学领域,一个能真正理解复杂生物学问题、并能像资深研究员一样进行推理的AI助手,长久以来似乎都停留在想象中。现在,OpenAI将这一想象推向了现实,推出了名为GPT-Rosalind的专用推理模型。这个名字,致敬了揭示DNA双螺旋结构的关键科学家——罗莎琳德·富

热心网友
05.17
OpenAI遭集体诉讼 ChatGPT被指泄露用户隐私数据
AI
OpenAI遭集体诉讼 ChatGPT被指泄露用户隐私数据

OpenAI公司因数据隐私问题在美国加州面临集体诉讼。原告指控其在ChatGPT网站中嵌入了MetaPixel和GoogleAnalytics等追踪工具,导致用户的邮箱、ID及输入的查询文本等敏感信息可能被分享给Meta和谷歌等第三方。此案争议焦点在于,ChatGPT处理的信息通常高度私密,涉及

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Keychron Z11 Ultra 8K分体式Alice键盘5月13日上市
科技数码
Keychron Z11 Ultra 8K分体式Alice键盘5月13日上市

Keychron(渴创)即将发布全新旗舰级机械键盘Z11 Ultra 8K。官方宣布,这款备受期待的“铝坨坨”键盘将于5月13日在全平台正式上市。其核心设计亮点在于采用了创新的平面式分体结构,并基于无Fn区的紧凑型Alice人体工学配列。这种设计旨在显著提升长时间打字或编程的舒适度,通过更符合自然手

热心网友
05.17
Token与Session和Cookie的区别及在Web3中的应用解析
web3.0
Token与Session和Cookie的区别及在Web3中的应用解析

针对cookie、session和token的区别问题,提供了多个更口语化且符合搜索习惯的标题优化版本,包括直接提问式、场景式、详解清单式和简单直白式,旨在更直观地突出核心比较信息并控制标题长度。

热心网友
05.17
Arm客户两年内对AGI芯片需求突破20亿美元
科技数码
Arm客户两年内对AGI芯片需求突破20亿美元

Arm近期的发展势头持续强劲,在最新公布的2026财年第四季度财报会议中,公司披露了一项关键进展:客户对其首款自研处理器——Arm AGI CPU——在2027至2028财年期间的总需求预估已超过20亿美元。相比今年3月产品发布时的初期预期,这一数字增长超过一倍,反映出市场对Arm自研芯片的高度期待

热心网友
05.17
Cerebras AI芯片IPO获超20倍认购 拟上调发行价近30%
科技数码
Cerebras AI芯片IPO获超20倍认购 拟上调发行价近30%

资本市场对AI硬件的热情,似乎找到了一个新的焦点。路透社昨日援引知情人士消息称,AI芯片新锐Cerebras Systems即将进行的首次公开募股(IPO),获得了投资者的热烈追捧,超额认购倍数已突破20倍。根据资本信息平台Dealogic的数据,这桩IPO有望成为2026年以来全球规模最大的一笔。

热心网友
05.17
Token分类全解析:从功能型到治理型如何定义与区分
web3.0
Token分类全解析:从功能型到治理型如何定义与区分

加密货币代币主要分为实用型、证券型、支付型、治理型和资产型五大类。其分类依据核心功能与属性,如是否代表资产、提供使用权或参与治理等。区分标准需结合具体设计、经济模型及法律框架综合判断。

热心网友
05.17