首页 游戏 软件 资讯 排行榜 专题
首页
AI
OpenAI自曝:用Codex将100%代码工作自动化,程序员未来已来

OpenAI自曝:用Codex将100%代码工作自动化,程序员未来已来

热心网友
69
转载
2026-01-26


新智元报道

编辑:好困 Aeneas

【新智元导读】100%是用Codex写的。还有内部爆料说,Codex让他们仅用三天时间就搭出了服务器,三周就发布了APP。人类程序员,真的要退出历史舞台了?

硅谷的空气里再次充满了躁动,而这一次的震源中心,回到了OpenAI。

OpenAI的奇点时刻,也要来了?

就在刚刚,X被一条爆料彻底刷屏——

Codex,已经正式接管了OpenAI研究员「Roon」100%的代码编写工作!


Roon发出了感慨万千的宣告:

编程一直很痛苦,然而却是必经之路。我很高兴,它终于结束了。

我惊讶于自己竟然这么快就摆脱了编程的阴影,而且一点都不怀念它。甚至我有点遗憾,从前的电脑为什么不是这样的。


早在去年12月,Claude Code之父Boris Cherny就曾投下一枚震撼弹——

自己对Claude Code的贡献100%都是由Claude Code完成的。

这一「套娃式」的自我进化,直接引爆了硅谷的自动编码狂潮。

面对如此巨大的蛋糕,OpenAI显然不会拱手相让。

如今,反击已经开始。

在刚刚过去的周末,Sam Altman已经公开预告:接下来一个月会发布一堆关于Codex编码模型的新产品。


社区的风向也开始发生微妙的转变。

一些资深开发者评论道:在90%的情况下,GPT-5.2-Codex都能一次性完成我提出的请求。

Claude虽然不错,但它偶尔会偷偷插入「坏代码」;相比之下,OpenAI的新方案更像苹果——主打一个开箱即用。


看来,Codex和Claude Code的大战,已经一触即发!

人类写代码的时代,彻底结束?

OpenAI研究员Roon的这个爆料,也让网友们直言:AI终于到达了这个奇点!

看来,人类直接手写代码的时代,真的结束了。

经过多年的模型迭代与数据积累,我们似乎真的站在了一个临界点上:

人类直接手写代码,正在变得不再有任何意义,甚至是一种效率的浪费。


在Roon的评论区,人们开始集体对编程时代说再见。

是的,我热爱电脑,热爱软件开发,对我而言,编程只是实现目标的手段,仅此而已。


复杂的语法只是是我们为了让逻辑得以执行而必须付出的昂贵代价。

如今,这些中间商终于可以退场了。



激进的观点开始涌现。

甚至有人建议,既然不需要人类阅读代码了,我们就该让模型跳过人类可读的汇编语言,直接使用机器代码。

今天的编程就像曾经的打孔卡一样,应该永远消失了。




与此同时,另一个炸裂的消息从OpenAI内部流出——

一位研究员爆料,在Codex的辅助下,他们仅用了三天时间,就从零搭建了OpenAI的MCP服务器,并完成了规模验证。

不仅如此,他们还在3周内推出了Sora的安卓应用;此外,还有一大波由Codex构建、甚至由Codex自我审核的内部工具正在排队上线。

如果没有Codex的话,很难想象OpenAI能以如此惊人的速度发布产品。

有趣的是,这位大佬似乎还玩起了Claude Code之父的梗:

过去30天,我花了大量时间审核Plan和PR,几乎没写一行代码!


有人评价,这正是「起飞」第一阶段的样子。

而下一步,或许就是真正的端到端AI自主研究。


还有人问,确定你们这不是营销?

这位研究者详细解释说,绝对不是。


具体的使用过程是这样的:

首先,他会花很多时间来撰写规格说明,并在脑海中构想输出应该是什么样子。

然后,会启动一个「4×Codex」的云端并发任务。这样不仅可以一次性看到多种不同的变体,也能补上自己一开始遗漏的细节。

接下来,就是让Codex自己发挥。等它跑完,人类再介入进行测试和验证。

Codex CLI 0.9+来了!

既然「人机协作」的范式已经改变,那么承载这种范式的工具自然也要升级。

面对Anthropic在的步步紧逼,OpenAI显然有备而来。

就在今天,Codex CLI连续推送了两次更新,版本号直接来到了0.91.0。


其中,Codex 0.9.0带来了最受大家期待的功能——Plan Mode(计划模式)!


Code模式是Codex的默认体验,它的工作方式和其他AI智能体一样。

这点咱们就不多费口舌了。


但Plan模式则完全不同,它将编程任务拆解为两个截然不同的阶段:

第一阶段:理解意图(明确目标、划定范围、识别约束条件、制定验收标准)

第二阶段:技术规格(生成决策完备的实施方案)

在这种模式下,输出的内容非常详尽,无需任何后续追问即可直接执行。


Plan模式最聪明的地方在于:它坚持「证据优先探索」。

在开口问问题之前,Codex会先在你的代码库中进行2次以上的针对性搜索,检查配置、Schema结构、程序入口等。

此外,Plan模式还可以调用全套工具:

它可以(并且将会)调用各种技能、子智能体和后台终端,从而构建高层级的实施计划。


当Codex确实需要你输入时,它是结构化的,而且只有关键且聚焦的问题:

· 尽可能提供选项

· 总是包含一个推荐选项(对新手极其友好)

· 只问那些会实质性改变计划的问题

为了实现这一交互,它利用了新的request_user_input工具。

这个工具会暂停执行流程,抛出一道有针对性的多项选择题,并支持你在选择时补充反馈或上下文。

更贴心的是,一旦它在任何时候检测到歧义,尤其是当你在引导它时指令模糊,它会立即停下来确认,而不是盲目执行。

现在,开发流程变成了这样:

用户请求一个计划 -> AI研究代码库与规划 -> 针对性询问用户 -> AI完善并完成计划 -> 提示是否执行?


但是,代码谁来审?

看起来完美无缺,对吧?Codex负责思考,Codex负责执行,Codex负责填满你的GitHub。

但就在我们为这种极致的效率欢呼时,一个被忽视的深渊正在脚下裂开——

在这个新时代,最大的悬念不再是谁在写代码,而是谁来审核代码。

当AI火力全开,每天向仓库甩出10+个PR时,人类开发者面临的实际上是一场针对注意力的DDoS攻击。

AI生成代码是毫秒级的,而人类理解代码上下文是分钟级甚至小时级的。

这种「生产与审查的极度不对称」带来了两个可怕的后果:

审查者被淹没,开始习惯性点「Approve」,Code Review沦为形式。

那些看起来能跑、但缺乏系统性思考的代码块,正在像癌细胞一样在代码库中扩散。

利益冲突显而易见,但我们需要看透这一层。

Claude Code的创造者吹捧自己的工具天经地义——这是商业的本能。

但作为受众,我们不能把「Demo里的完美世界」当成日常。

毕竟,Demo不会展示调试三小时都找不到的竞态条件,也不会展示由于上下文丢失导致的逻辑断层。

除此之外,数据里还藏着一个迷人的悖论。

Ars Technica曾报道称,开发者对AI工具的使用量在涨,信任度却在跌。

为什么?因为AI正在跨越「恐怖谷」。

以前的AI代码烂得很明显,现在的AI代码烂得很隐蔽——它引用了不存在的库,或者在一个极其边缘的Case上埋了雷。

人们用得越多,踩的坑越多,信得自然越少。

正如Jaana Dogan所警示的,我们正在面临软件工程「琐碎化」的风险。

100个提交,可能让GitHub的绿格子很好看。

1个架构变更,可能需要三天思考,零行代码产出。

前者廉价如尘土,后者珍贵如黄金。

问题从来不是AI能不能写代码,而是它写的代码,是不是我们系统真正需要的,以及我们是否有能力维护它。

这对我们意味着什么?

无论我们是否准备好,这个时代已经来了。对于不同的人群,这意味着完全不同的生存法则。

致开发者

AI编码工具不是「即将来临」,它们已经破门而入。

问题在于,如何在不丢失自身核心价值的前提下整合它们。

技术大牛们依然在做那些艰难的思考工作,AI只是接过了「打字员」的工作。

如果你只会「搬运代码」,那你确实该慌了。

致非开发者

「技术工作」与「非技术工作」的边界正在消融。

Claude Cowork这类工具创造了新物种。曾经需要开发者才能搞定的任务,可能很快只需要你能清晰描述出你想要什么。

清晰描述需求的能力,将成为新的编程语言。

最后的话

虽然OpenAI的研究员和Claude Code的创造者都在宣称AI包办了100%的代码,但请记住——

那是他们的实验室环境,不是你的生产环境。

唯一可以确定的是,我们正在经历从「写代码」到「指挥写代码」的不可逆的转变。

而且,正在加速。

参考资料:

https://x.com/tszzl/status/2015253546372153347

https://jpcaparas.medium.com/the-claude-code-creator-says-ai-writes-100-of-his-code-now-956b2a5905ba?sk=4c840f27eb03694c8210086834a41691

https://x.com/LLMJunky/status/2015487691891024052


来源:https://www.163.com/dy/article/KK6VMGKM0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

雷科技到底是谁?!!!悟空给出的答案,太抓人了!
科技数码
雷科技到底是谁?!!!悟空给出的答案,太抓人了!

从零到一:用AI生成一份专业的媒体影响力报告 但凡在内容或运营团队待过的人,大概都对制作《媒体影响力报告》这类活儿记忆犹新。那过程,堪称一场跨部门接力赛:运营同事得先从各个平台后台手动扒拉数据,计算阅读量、粉丝增长和互动率;拿到一堆冰冷数字后,还得拉着账号负责人反复琢磨定位和文案;最后,抱着半成品火

热心网友
05.01
全国五一劳动奖章获得者聂海平:突破国外技术壁垒 用代码“敲”出属于中国的铺丝机
科技数码
全国五一劳动奖章获得者聂海平:突破国外技术壁垒 用代码“敲”出属于中国的铺丝机

封面新闻记者 邹阿江 图由航空工业成飞提供 2026年“五一”国际劳动节前夕,航空工业成飞的技术专家聂海平,荣获了一枚全国五一劳动奖章。 消息传来,身边同事都说,“大师”拿奖是实至名归。可聂海平自己呢,还是那副老样子——摆摆手,说自己不过是个普通人,幸运地站在一个好平台上,干着点自己感兴趣的事儿罢了

热心网友
05.01
每天3小时就够了,技术大牛:在AI时代坚持8小时工作制,你不是在努力,是在自杀
业界动态
每天3小时就够了,技术大牛:在AI时代坚持8小时工作制,你不是在努力,是在自杀

编辑 | 王凤枝 “AI时代,每天干3个小时就足够了。” 这句话出自前亚马逊资深工程师、技术大牛史蒂夫·雅吉(Steve Yegge)之口,算得上是对当前AI狂热的一剂清醒剂。 当整个行业都在为“10倍提效”而欢呼雀跃时,雅吉却点出了一个被普遍忽视的代价:在AI的高强度辅助下,程序员的产出固然爆炸式

热心网友
04.22
你的代码为什么又长又乱?可能是函数没用好
业界动态
你的代码为什么又长又乱?可能是函数没用好

一、概述 每天重复相同的操作,是不是感觉有点枯燥?比如,你每天都要煮饭,得经历洗米、加水、按下煮饭键这三步。如果每次都要从头到尾念叨一遍这个过程,那可就太费劲了。 别担心,函数就是来拯救你的。在Python的世界里,函数就像一个“一键煮饭”的智能按钮。你只需要把那些重复的步骤打包成一个固定的“命令”

热心网友
04.22
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定
业界动态
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定

吃透Pandas两大“数据汇总神器”:透视表与交叉表实战指南 在数据处理的工具箱里,如果说基础的清洗、筛选是基本功,那么多维度、交叉式的数据汇总,往往就是区分新手与熟手的分水岭。面对诸如“按地区加品类统计销售额”、“分析不同省份的商品订单分布”这类需求,如果还停留在手动分组、多层循环的老路上,不仅代

热心网友
04.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

《Zero Parades: For Dead Spies》游戏评分与媒体评价汇总
游戏攻略
《Zero Parades: For Dead Spies》游戏评分与媒体评价汇总

《Zero Parades: For Dead Spies》的媒体评测已经解禁,结果相当亮眼。这款被许多人视为《极乐迪斯科》精神续作的作品,在OpenCritic上拿到了86分的媒体均分,在Metacritic上也有83分。游戏将于5月21日正式登陆PC平台,看来2026年的必玩叙事RPG名单上,又

热心网友
05.18
Excel多级分类汇总一句话快速完成
AI
Excel多级分类汇总一句话快速完成

目录 你是否也遇到过这些问题 处理效果 前置准备 超简单AI自动化解决方案 第1步:准备好你的原始数据 第2步:针对指定的文件下达指令 第3步:验收 还能解决这些同类问题 指令为什么这么有用? 更多场景直接抄作业 销售数据三级汇总 成本数据多级汇总 库存数据汇总 员工薪资汇总 常见问题答疑 核心价值

热心网友
05.18
Kimi K2.6 智能体功能深度解析与体验评测
AI
Kimi K2.6 智能体功能深度解析与体验评测

AI Agent 的发展,正迎来一个关键的转折点,从概念验证迈向真正的生产力交付。 想象一下,当一个 AI 智能体能够在无需人工介入的情况下,独立完成一个复杂项目的全流程,并将成功经验固化为可随时调用的“技能”——这是否标志着 AI 在职场中的角色,已经从辅助工具演变为自主的生产力单元? 随着 Op

热心网友
05.18
苹果WWDC26前瞻 iOS27新Siri界面交互升级预测
AI
苹果WWDC26前瞻 iOS27新Siri界面交互升级预测

彭博社的马克・古尔曼在最新报道中透露了一个有趣的发现:苹果为WWDC 26发布的宣传海报,其设计细节可能暗藏玄机,指向了即将在iOS 27中亮相的全新Siri交互界面。 根据古尔曼的分析,新版Siri的核心变化在于与灵动岛的深度融合。唤醒时,它将不再以传统的全屏或底部卡片形式出现,而是会以一个扩展的

热心网友
05.18
GitHub刷星乱象调查 AI项目成虚假评分重灾区
AI
GitHub刷星乱象调查 AI项目成虚假评分重灾区

GitHub 的 Star 数量还值得信赖吗?真相可能比你想象的更严峻。 开源社区中“购买 Star”的现象早已不是秘密,其便捷程度甚至超过点外卖,单价低廉且支持批量折扣。然而,卡内基梅隆大学(CMU)一项被 ICSE 2026 顶会收录的最新研究,首次系统性地揭示了这场“造假生意”的惊人规模:Gi

热心网友
05.18