游乐游手机版
首页/AI热点日报/热点详情

Codex仅解锁1%潜力,大神优化让它一天运行71小时

类型:热点整理2026-07-04
GPT-5 6还没大规模铺开,监管倒是先一步堵在了门口。 据外媒消息,美国政府要求OpenAI把GPT-5 6的早期访问权限限制在少数经批准的企业客户手中,理由很直接——安全评估。 ▲ 外媒报道:美国政府出于安全考虑,要求OpenAI分阶段发布新模型 几乎同一时间,OpenAI放出了一篇关于Code

GPT-5.6还没大规模铺开,监管倒是先一步堵在了门口。

据外媒消息,美国政府要求OpenAI把GPT-5.6的早期访问权限限制在少数经批准的企业客户手中,理由很直接——安全评估。

▲ 外媒报道:美国政府出于安全考虑,要求OpenAI分阶段发布新模型

几乎同一时间,OpenAI放出了一篇关于Codex的研究报告。里面的大量数据,似乎从侧面解释了这种紧张感的来源——AI已经从“回答问题”,实实在在地走向了“替人完成一段工作”。

这份报告名为《向智能体AI的转变:来自Codex的证据》。研究对象是OpenAI自家的Codex——也就是这段时间以来国内外的流量密码,一个能读文件、跑命令、改代码、生成文档、调用工具的agent产品。

报告里有些数据相当夸张。比如,OpenAI每周可能消耗上千万亿Token,其中99.8%都来自Codex。

ChatGPT曾一度是OpenAI内部的默认工作工具。2025年8月,OpenAI员工平均花在Codex上的Token还不到10%。

但到了今年6月,情况彻底变了——从工程、法务、金融到人事,OpenAI员工平均超过90%的工作量都交给了Codex,而活跃员工中,有97.9%用过Codex。

按每天Codex运行总时长从低到高排序,排到第99百分位的那批重度用户,平均每天可以产生超过60小时的Codex智能体运行时间。没错,因为多个agent可以并行跑,一天累计时间超过24小时是常事。

▲ 有网友发梗图表示震惊:怎么会有用户一天能跑Agent 71个小时?

换句话说,在OpenAI内部,工作场景里的AI使用,几乎已经全面切换到了Codex上。

“你用不用AI”,正在变成一个废问题

过去三年,几乎所有关于AI的讨论都绕着一个问题转:你要不要用?

OpenAI早先发过一份分析ChatGPT使用情况的报告,结论是:人们用ChatGPT,将近一半的时间是在“问”——问问题、找信息、要建议。

▲ 去年OpenAI的ChatGPT分析报告显示,49%的消息都属于询问

Codex把整个逻辑倒了过来。人们用它“做”——调试、重构、验证、配环境、写文档、跑数据。

当AI只会聊天时,“用没用”确实是个好指标:我们问它,它回答,用了就是用了。可一旦AI能替我们干活,问题就变成了:我们能交出去多少活?以及,有没有开始围着“给AI分配任务”来重新安排自己的一天?

Codex的这份报告,将衡量AI应用深度的指标锚定在三个维度上:我们交出去的任务有多复杂、agent替人类跑了多久、用户是不是在同时盯着好几条工作线。

报告里也很清晰地说明了Codex现在适合哪些场景、哪些人。他们把用户分成三类:个人用户、外部组织用户、OpenAI员工。

差异很明显。截至2026年6月11日前的28天,个人活跃用户中只有0.7%用过Codex;外部组织用户高不少,达到17.3%;而OpenAI内部则接近全员,达到97.9%。

但如果按输出token来算,Codex的存在感就强得多了。个人用户中,Codex贡献了16.5%的输出token;外部组织用户里,这个比例已经跃升到63.3%;OpenAI内部更极端,Codex占Codex和ChatGPT总输出的99.8%。

数据说得很明白:用Codex的人还没那么多,但一旦用上,使用强度极高。尤其在组织内部,Codex已经从一个小众工具,变成了重度用户的主要工作界面。

报告里还有一张很关键的图:Codex的增长已经不单靠开发者来拉动。

2026年6月,外部组织账号里的非开发者Codex活跃用户,相对2025年8月1日已接近189倍;个人账号里的非开发者用户也超过了130倍。

曾经,Codex还被许多人当成程序员专属工具。但现在,增长最快的新增人群,已经来自非开发者。可以说,Codex的扩散路径,正从写代码的人,走向做文档、数据、研究、销售、招聘、法务和运营的人。

具体到岗位来看,工程师仍然是最早、最明显的一批。外部组织用户中,工程技术岗位的平均Codex输出占比达到26.8%,数据和分析岗位约15.2%。法务、招聘等非技术岗位也在增长,但平均占比还比较低,比如法务只有1.9%。

OpenAI内部的曲线更激进。工程、数据岗位直接飙升,随后招聘、法务等岗位也快速跟上。

报告指出,2026年初,OpenAI的法务、招聘等岗位几乎还没怎么用Codex;但到4月左右,这些岗位的Codex输出占比已经和工程数据一样,快速冲到了很高的位置。

当然,OpenAI内部的数据,某种程度上只能算作一个“低摩擦样本”——毕竟OpenAI员工熟悉模型,公司有充裕的使用额度,内训和经验分享也多。

它可能无法直接代表普通公司今天的状态,但它展示了一种潜在的未来公司形态:当权限、工具、流程都打开之后,非技术岗位也能开始用agent来高效完成工作。

用户拿Codex做什么?

报告把任务分成几大类:代码实现、代码理解、代码验证、工程运维、应用管理、数据分析、研究、知识产物、协作、业务流程。

从图表上看,软件相关任务仍然占大头。用户不只是让Codex写新代码,也会让它读已有代码、解释架构、修bug、跑测试、配置环境、管理仓库、处理构建和发布问题。

到了OpenAI内部,任务范围继续向外扩展。报告提到,OpenAI员工会用Codex做研究和数据分析等工作,外部组织用户也开始出现类似用法,尤其是销售、市场、招聘等岗位,会用Codex生成知识产物,比如文档、材料、说明、报告等。

这些任务有多重?

报告里有一张任务复杂度图,专门估算用户交给Codex的任务,如果让熟练人类独立完成,大概需要多久。

在个人用户样本里,2025年12月,35.4%的活跃用户提交过至少一个“熟练人类需要1小时以上”的任务。到2026年5月,这个比例升到了70.2%。

更重的任务也在增加。提交过至少一个“8小时以上”任务的用户比例,从2.1%升到了25.6%。

怎么用,也变了。

报告主要看三个指标:并发、运行时间、skill。并发方面,大多数人开始在一周内同时跑多个Codex任务,管理多个Agent。运行时间上,平均每天71小时的Codex运行时间最能说明问题。

而skill则代表了另一种变化——用户开始把重复工作沉淀成可复用流程。报告说,活跃Codex用户中,调用过skill的比例从2026年3月1日的5.4%,升到6月11日的26.6%。个人用户是25.7%,外部组织用户是30.4%,OpenAI内部则高达96.2%。

这些数据或许还不能直接等同于生产率提升,但足以说明:Codex进入工作流后,AI的使用形态已经发生了质变。

前段时间Fable 5关闭,社交媒体上很多人嘲讽Anthropic的CEO:“谁让你天天搞那些耸人听闻的营销?什么被吓到了,恐怖到要关闭,现在真的被关闭了吧!”

▲ 说是回归,但能体验到的仍是少数

现在,GPT-5.6的命运似乎也要和Fable 5相似——甚至还没正式发布,就被美国政府要求审核分批发布。

当Agent真实地在改变工作组织方式时,一个人可以同时开几个任务:让一个agent查资料,一个agent改脚本,一个agent生成表格,一个agent写说明文档。人站在中间,像项目经理,也像编辑,决定哪些结果能进入下一步。

Codex渗透到越来越多场景的能力,似乎能解释为什么GPT-5.6的发布节奏会变得敏感。

当模型只是在聊天框里回答问题,风险主要来自它说了什么;当模型可以调用工具、读写文件、执行任务,风险就会进入真实工作流。能力越接近执行层,发布就越像基础设施上线,无法再按普通产品更新来理解。

AI的能力,可能会像资源一样,既是人力资源,也是物质资源。

不过,虽然Codex已经这么强了,报告里还有一个很现实的数据:在过去28天内活跃于ChatGPT或Codex的Go、Free、Pro和Plus套餐用户中,使用Codex的用户不到1%。

来源:https://www.bestblogs.dev/article/00f2533c?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。