Codex仅解锁1%潜力，大神优化让它一天运行71小时_AI热点日报

Codex仅解锁1%潜力，大神优化让它一天运行71小时

类型：热点整理2026-07-04

GPT-5 6还没大规模铺开，监管倒是先一步堵在了门口。据外媒消息，美国政府要求OpenAI把GPT-5 6的早期访问权限限制在少数经批准的企业客户手中，理由很直接——安全评估。 ▲ 外媒报道：美国政府出于安全考虑，要求OpenAI分阶段发布新模型几乎同一时间，OpenAI放出了一篇关于Code

GPT-5.6还没大规模铺开，监管倒是先一步堵在了门口。

据外媒消息，美国政府要求OpenAI把GPT-5.6的早期访问权限限制在少数经批准的企业客户手中，理由很直接——安全评估。

▲ 外媒报道：美国政府出于安全考虑，要求OpenAI分阶段发布新模型

几乎同一时间，OpenAI放出了一篇关于Codex的研究报告。里面的大量数据，似乎从侧面解释了这种紧张感的来源——AI已经从“回答问题”，实实在在地走向了“替人完成一段工作”。

这份报告名为《向智能体AI的转变：来自Codex的证据》。研究对象是OpenAI自家的Codex——也就是这段时间以来国内外的流量密码，一个能读文件、跑命令、改代码、生成文档、调用工具的agent产品。

报告里有些数据相当夸张。比如，OpenAI每周可能消耗上千万亿Token，其中99.8%都来自Codex。

ChatGPT曾一度是OpenAI内部的默认工作工具。2025年8月，OpenAI员工平均花在Codex上的Token还不到10%。

但到了今年6月，情况彻底变了——从工程、法务、金融到人事，OpenAI员工平均超过90%的工作量都交给了Codex，而活跃员工中，有97.9%用过Codex。

按每天Codex运行总时长从低到高排序，排到第99百分位的那批重度用户，平均每天可以产生超过60小时的Codex智能体运行时间。没错，因为多个agent可以并行跑，一天累计时间超过24小时是常事。

▲ 有网友发梗图表示震惊：怎么会有用户一天能跑Agent 71个小时？

换句话说，在OpenAI内部，工作场景里的AI使用，几乎已经全面切换到了Codex上。

“你用不用AI”，正在变成一个废问题

过去三年，几乎所有关于AI的讨论都绕着一个问题转：你要不要用？

OpenAI早先发过一份分析ChatGPT使用情况的报告，结论是：人们用ChatGPT，将近一半的时间是在“问”——问问题、找信息、要建议。

▲ 去年OpenAI的ChatGPT分析报告显示，49%的消息都属于询问

Codex把整个逻辑倒了过来。人们用它“做”——调试、重构、验证、配环境、写文档、跑数据。

当AI只会聊天时，“用没用”确实是个好指标：我们问它，它回答，用了就是用了。可一旦AI能替我们干活，问题就变成了：我们能交出去多少活？以及，有没有开始围着“给AI分配任务”来重新安排自己的一天？

Codex的这份报告，将衡量AI应用深度的指标锚定在三个维度上：我们交出去的任务有多复杂、agent替人类跑了多久、用户是不是在同时盯着好几条工作线。

报告里也很清晰地说明了Codex现在适合哪些场景、哪些人。他们把用户分成三类：个人用户、外部组织用户、OpenAI员工。

差异很明显。截至2026年6月11日前的28天，个人活跃用户中只有0.7%用过Codex；外部组织用户高不少，达到17.3%；而OpenAI内部则接近全员，达到97.9%。

但如果按输出token来算，Codex的存在感就强得多了。个人用户中，Codex贡献了16.5%的输出token；外部组织用户里，这个比例已经跃升到63.3%；OpenAI内部更极端，Codex占Codex和ChatGPT总输出的99.8%。

数据说得很明白：用Codex的人还没那么多，但一旦用上，使用强度极高。尤其在组织内部，Codex已经从一个小众工具，变成了重度用户的主要工作界面。

报告里还有一张很关键的图：Codex的增长已经不单靠开发者来拉动。

2026年6月，外部组织账号里的非开发者Codex活跃用户，相对2025年8月1日已接近189倍；个人账号里的非开发者用户也超过了130倍。

曾经，Codex还被许多人当成程序员专属工具。但现在，增长最快的新增人群，已经来自非开发者。可以说，Codex的扩散路径，正从写代码的人，走向做文档、数据、研究、销售、招聘、法务和运营的人。

具体到岗位来看，工程师仍然是最早、最明显的一批。外部组织用户中，工程技术岗位的平均Codex输出占比达到26.8%，数据和分析岗位约15.2%。法务、招聘等非技术岗位也在增长，但平均占比还比较低，比如法务只有1.9%。

OpenAI内部的曲线更激进。工程、数据岗位直接飙升，随后招聘、法务等岗位也快速跟上。

报告指出，2026年初，OpenAI的法务、招聘等岗位几乎还没怎么用Codex；但到4月左右，这些岗位的Codex输出占比已经和工程数据一样，快速冲到了很高的位置。

当然，OpenAI内部的数据，某种程度上只能算作一个“低摩擦样本”——毕竟OpenAI员工熟悉模型，公司有充裕的使用额度，内训和经验分享也多。

它可能无法直接代表普通公司今天的状态，但它展示了一种潜在的未来公司形态：当权限、工具、流程都打开之后，非技术岗位也能开始用agent来高效完成工作。

用户拿Codex做什么？

报告把任务分成几大类：代码实现、代码理解、代码验证、工程运维、应用管理、数据分析、研究、知识产物、协作、业务流程。

从图表上看，软件相关任务仍然占大头。用户不只是让Codex写新代码，也会让它读已有代码、解释架构、修bug、跑测试、配置环境、管理仓库、处理构建和发布问题。

到了OpenAI内部，任务范围继续向外扩展。报告提到，OpenAI员工会用Codex做研究和数据分析等工作，外部组织用户也开始出现类似用法，尤其是销售、市场、招聘等岗位，会用Codex生成知识产物，比如文档、材料、说明、报告等。

这些任务有多重？

报告里有一张任务复杂度图，专门估算用户交给Codex的任务，如果让熟练人类独立完成，大概需要多久。

在个人用户样本里，2025年12月，35.4%的活跃用户提交过至少一个“熟练人类需要1小时以上”的任务。到2026年5月，这个比例升到了70.2%。

更重的任务也在增加。提交过至少一个“8小时以上”任务的用户比例，从2.1%升到了25.6%。

怎么用，也变了。

报告主要看三个指标：并发、运行时间、skill。并发方面，大多数人开始在一周内同时跑多个Codex任务，管理多个Agent。运行时间上，平均每天71小时的Codex运行时间最能说明问题。

而skill则代表了另一种变化——用户开始把重复工作沉淀成可复用流程。报告说，活跃Codex用户中，调用过skill的比例从2026年3月1日的5.4%，升到6月11日的26.6%。个人用户是25.7%，外部组织用户是30.4%，OpenAI内部则高达96.2%。

这些数据或许还不能直接等同于生产率提升，但足以说明：Codex进入工作流后，AI的使用形态已经发生了质变。

前段时间Fable 5关闭，社交媒体上很多人嘲讽Anthropic的CEO：“谁让你天天搞那些耸人听闻的营销？什么被吓到了，恐怖到要关闭，现在真的被关闭了吧！”

▲ 说是回归，但能体验到的仍是少数

现在，GPT-5.6的命运似乎也要和Fable 5相似——甚至还没正式发布，就被美国政府要求审核分批发布。

当Agent真实地在改变工作组织方式时，一个人可以同时开几个任务：让一个agent查资料，一个agent改脚本，一个agent生成表格，一个agent写说明文档。人站在中间，像项目经理，也像编辑，决定哪些结果能进入下一步。

Codex渗透到越来越多场景的能力，似乎能解释为什么GPT-5.6的发布节奏会变得敏感。

当模型只是在聊天框里回答问题，风险主要来自它说了什么；当模型可以调用工具、读写文件、执行任务，风险就会进入真实工作流。能力越接近执行层，发布就越像基础设施上线，无法再按普通产品更新来理解。

AI的能力，可能会像资源一样，既是人力资源，也是物质资源。

不过，虽然Codex已经这么强了，报告里还有一个很现实的数据：在过去28天内活跃于ChatGPT或Codex的Go、Free、Pro和Plus套餐用户中，使用Codex的用户不到1%。

来源：https://www.bestblogs.dev/article/00f2533c?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

解锁

延伸阅读

补充最近整理过的热点入口。