龙虾上身Codex完整攻略

时间：2026-06-10 12:47

这一次 Codex 的版本更新，堪称一次“史诗级”的能力跃迁——它不再仅仅是编写代码的辅助工具，而是进化为一款能够直接操控电脑的智能助手。官方甚至用了一句颇具“雄心”的宣传语：“Codex for (almost) everything ” 意为“Codex，几乎无所不能”。简单回顾一下：过去的

这一次 Codex 的版本更新，堪称一次“史诗级”的能力跃迁——它不再仅仅是编写代码的辅助工具，而是进化为一款能够直接操控电脑的智能助手。

官方甚至用了一句颇具“雄心”的宣传语：“Codex for (almost) everything.” 意为“Codex，几乎无所不能”。

简单回顾一下：过去的 Codex，能力边界非常清晰——你提出需求，它生成代码。而这次升级之后，这个边界被彻底打破了。

它现在可以直接操控你的电脑，打开应用程序，在不同软件之间自由切换；它能够将一个任务“挂起”，隔几天再回来继续执行；它甚至可以根据你以往的操作习惯，主动给出下一步应该做什么的建议。

这些能力组合在一起，给人的直观感受就是——Codex 仿佛“龙虾（OpenClaw）”附体。它不再只是一个工具，而是开始真正地“工作”了。

从写代码到“动手执行”

本次更新最核心的亮点，就是 Codex 开始直接操作电脑了。

具体怎么操作？说白了就是：它能“看到”你的屏幕，“移动”鼠标，“敲击”键盘，然后直接使用你电脑上的任何一款应用。它不是通过调用 API 接口来完成的，而是用自己的光标，在界面上进行一系列操作。

过去，AI 的能力很大程度上取决于它能接入多少 API。一旦遇到那些没有开放接口的工具——比如设计软件、本地应用程序、公司内部系统——它的能力就会立刻受限。但现在，Codex 可以绕过这些限制，直接在界面上动手操作，这确实非常强大。

而且，这种操作并不会干扰你当前的工作。多个 Agent 可以在后台并行运行，在不同应用之间自如切换，你完全可以继续做自己的事。

这个功能目前已在 macOS 上抢先上线，其他操作系统的用户还需要再等待一段时间。

除了操控桌面，这一版本的 Codex 也直接接入了网页。

它的桌面应用内置了浏览器，你可以在页面上圈选某个按钮、某段文字，甚至直接在画面上写一条评论。这个“位置”本身就成了指令，Codex 会根据你的圈选和标注，去修改界面、调整逻辑或者检查问题。

这个功能对前端设计和游戏开发来说，简直是福音。尤其是当界面本身就是用 Codex 生成的代码时，直接在生成的界面上标注修改，体验极其流畅。

最新文档显示，他们计划随着时间推移，让 Codex 能够更完整地控制浏览器，不再局限于本地运行的网页应用。

此外，它还新增了原生的图像生成功能。Codex 现在可以直接使用 gpt-image-1.5 模型生成和迭代图像，用于产品设计、界面草图或者游戏素材，完全不需要额外接入 API。

围绕开发流程本身，这次更新也把许多原本分散的环节补全了。例如，它可以处理 GitHub 上的评审评论；可以打开多个终端标签；可以通过 SSH 连接远程开发环境；还能在侧边栏直接预览 PDF、表格和各种文档。

还有一个汇总面板，让你能够清晰地看到它当前在做什么、使用了哪些信息、产出了什么结果。

这些能力不完全是全新功能，很多以前零散存在，现在被统一整合进了 Codex 的开发流程中。

Codex 还扩展了插件和工具集成，接入了 90 多个插件，包括 JIRA、GitLab、Microsoft 套件等。这意味着任务开始跨工具流动，而不局限于某一个应用里。你可以一句话让它同时查询 Slack、Gmail、Notion，然后为你整理出一份需要处理的事项清单。

还有一个非常关键的升级：Codex 现在可以把任务“留到以后再做”。

它可以复用已有的上下文，在未来任何一个时间点自动继续执行任务，整个过程可以跨越几天甚至几周。换句话说，之前已经完成的整理、讨论过的问题，以及还没做完的工作，都不会被丢掉。它们会被带入下一步，成为后续任务的一部分。

与此同时，记忆能力也开始发挥作用。Codex 会记录你的偏好、修改习惯以及已经整理过的信息，让后续任务不需要反复说明就能继续推进，并逐渐贴合你的工作方式。

当它掌握了足够的上下文之后，Codex 就可以从不同工具中提取信息，识别出需要处理的评论或任务，整理出一份有优先级的行动建议，告诉你应该从何处开始继续一个项目。

不只是功能升级

上面列举的许多功能，乍一看可能互不搭界，但它们指向了同一个核心变化：工作流。

过去，Codex 存在于某一个具体环节里——写代码、改代码、解释代码。你需要在不同工具之间来回切换，把任务拆成一段一段再交给它完成。

但现在，这些事情开始连在一起了。它可以在应用里执行操作，在网页中获取信息，在终端里运行命令，再把结果带回到代码中；它也可以把这些步骤延续下去，在几天之后继续推进同一个任务。

可以说，原本分散在不同工具、不同时间里的工作，正在被串成一条连续的流程，被整合在一个系统里。

原生的 Mac 集成，让 Codex 可以操作你的电脑，在本地环境中操作应用、协调任务，并在不同工具之间流转信息。它没有取代你原本的应用，但开始在这些应用之间流动，把任务从一个地方带到另一个地方。

这也是为什么很多人认为，Codex 正在变成知识工作的“操作系统”。

另外，相比接入更多应用，有人认为记忆能力可能才是这次更新的关键。因为一旦 AI 开始理解你的工作方式，并在后续任务中复用这些信息，它会逐渐贴合你的习惯，让你用起来越来越顺手。

这确实指向了一个趋势：未来的 AI 竞争，可能不只是模型能力本身，而是谁能更深入地嵌入你的工作流程，并持续理解你是如何完成工作的。

“超级应用”

说到深入工作流的能力，很多人可能会觉得这和 OpenClaw 的方向很像。没错，两者的目标确实一致：让 AI 去完成任务，而不是只回答问题。

不同的地方在于，OpenClaw 更偏“调用工具”，通过接口把流程串起来；而 Codex 这次更新则是把 AI 放进了系统内部，让它直接操作应用。所以说是“龙虾”附体——把这套逻辑并入系统里，可不是附体么。

这种相似或许和 Peter Steinberger（OpenClaw 创始人）加入 OpenAI 有点关系，但更可能的情况是，OpenAI 本身就想做生态整合，做一个能搞定所有事情的“超级应用”（super app）。

据 OpenAI 最新统计，Codex 现在每周有超过 300 万用户，其中近一半的使用是非编码任务。它的使用场景已经不再局限于代码，这次的更新可能就是 OpenAI 想做“超级应用”的第一步。

从上线节奏来看，这次更新也在分阶段推进：桌面控制的功能目前只在 macOS 上推出；记忆和上下文感知建议的功能先开放给美国用户，欧盟、英国、教育版、企业版稍后。

能力还在铺开，但方向已经非常明确了：Codex 正在从一个写代码的工具，变成一个可以跨应用、跨时间持续完成任务的系统。

这条路当然不只是 OpenAI 在走。几乎是同一时间，Perplexity AI 也发布了名为“Personal Computer”的 Mac 桌面应用，同样在尝试把本地文件、原生应用和浏览器操作整合在一起，让 AI 可以在一个统一环境中执行任务。顺便一提，最近更新的 Claude Opus 4.7 已经成为 Personal Computer 的默认协作（orchestration）模型。

而 Anthropic，他们的产品本身已经具备较强的 Agent 能力，可以调用工具、执行多步任务，但更多集中在开发环境和工具调用层面，暂时还没有形成一个直接操作桌面应用的统一系统。

国内的趋势也大致相同：几乎所有大厂都在布局类似 OpenClaw 的 Agent 体系，同时也开始尝试让 AI 直接操作本地环境、执行任务。

说白了，目标都是让 AI 不再停留在对话里，而是能够进入实际的工作环境。

从聊天到写代码，到操作应用，再到跨时间推进工作——当 AI 开始“动手”，工作方式就真的变了。“龙虾”附体的 Codex，只是其中一步。

来源：https://36kr.com/p/3771691809321734

其他

上一篇2026年4月绿联NAS私有云入门到旗舰选购指南 下一篇Vite Plus安装器发布让Windows用户更顺畅

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。