游乐游手机版
首页/AI教程/文章详情

Codex从代码工具进化为电脑工作流Agent

时间:2026-06-23 14:56
Codex正从AI编程助手演变为通用电脑工作流Agent,通过持久线程、任务引导与排队、多工具触达(浏览器、桌面、MCP等)及带验证器的Goals,实现从写代码到接管电脑重复工作流的闭环,共享记忆则落于文件而非对话。

最近看到一篇深入探讨如何高效运用 Codex 的文章,内容非常扎实,全面梳理了 Codex 应用中的各项能力:持久线程、语音输入、任务转向、排队、浏览器、Computer Use、MCP、连接器、自动化、Goals、侧边栏、共享记忆等等。如果只盯着这些功能看,很容易把它当作一份产品功能介绍来读。但真正值得关注的,并不是某个具体功能,而是 Codex 的定位正在发生根本性转变:它不再仅仅是一个 AI 编程助手,而是在朝着通用电脑工作流 Agent 的方向演进。

从写代码到掌控电脑上的工作

\

大多数人初次接触 Codex,肯定还是冲着写代码来的:查看仓库、修改代码、运行测试、发起 PR。这依然是它的核心应用场景。但问题在于,电脑上很多工作本质上就是用代码和工具串联起来的。例如:执行 shell 命令、浏览网页、调用 API、导出文档、查阅 Slack 和 Gmail、处理日程、生成 PDF/表格/PPT、等待反馈后再修改。过去这些事情分散在不同的软件中,人是中间的胶水。而现在,Codex 可以通过 thread 保留上下文,借助 browser、computer-use、MCP 和 connector 接触外部系统,还能利用 automation 和 goals 让任务持续运行。这就不再只是“帮我写一段代码”,而是“帮我把一件电脑上的工作做完”。

持久线程,Agent 的工作空间

之前一直强调,AI 编程最重要的不是单次问答,而是上下文工程。文中提到的 durable threads(持久线程),本质上就是 Codex 里的工作空间。不是每次开一个新聊天,让 AI 重新理解你是谁、项目是什么、上次的决策是什么;而是把线程按长期工作流固定下来。这和我们做软件系统很像——临时脚本能解决一次问题,但长期系统一定要有状态、有上下文、有边界。Codex 的 thread 正好在给 Agent 提供这个状态。

引导与排队:真正像 Agent 的关键

\

文章里有两个概念值得单独拎出来。一个是 Steering(引导):Codex 正在执行任务时,你发现它方向不对,可以打断它,告诉它往另一个方向走。比如它正在改页面,你可以直接说“这个间距不对”“这个文案错了”“这个地方缩小一点”。另一个是 Queuing(排队):不打断当前任务,而是告诉它做完以后继续做下一件事。比如:改完以后把预览链接发给 reviewer;测试通过以后整理一版 release note;文档更新后再检查一次链接。这两个能力组合起来,才真的像一个 Agent——因为真实工作不是一次性输入然后等最终答案,而是边看边改、边改边补充,做完一件接下一件。

工具触达决定 Agent 能走多远

Codex 能不能成为通用 Agent,关键看它能碰到什么。文章里把工具分了几层:$browser 适合在侧边栏里看网页、测页面、做 UI review;@chrome 适合需要用户登录态的浏览器任务;@computer 适合只能通过桌面 GUI 操作的任务;MCP 和 connectors 则适合连接 Slack、Gmail、Calendar 等系统。这一点很重要——Agent 的能力不只由模型决定,也由它能操作的世界决定。一个能读仓库、开浏览器、查 Slack、写文档、操作桌面、跑测试的 Agent,才可能把工作闭环。所以 MCP、Skill、Connector、Computer Use 这些东西,是 Agent 工程的基础设施。

Goals 的本质是验证器

\

文章里还有一个点很认同:Goals 必须有明确终点。弱目标是“帮我实现这个 Markdown 里的计划”,强目标是“把这个 Python 工具迁移到 Rust,直到单元测试全部通过”。区别在于有没有 verifier(验证器),有没有明确的终点可以让 Agent 知道目标方向和结束的时机。AI 长时间执行任务,最怕的就是看起来一直在努力,但不知道有没有接近目标。所以一个好的 Goal 必须包含:目标是什么、什么时候算完成、用什么信号验证、失败后怎么继续迭代。验证器可以是测试集、benchmark、bug 复现、校验矩阵,也可以是一个完整的端到端流程。没有验证器的自动化,本质上就是许愿,看命看运气。这也是 AI 编程从玩具到生产力工具的分界线。

共享记忆要落到文件里

文中还提到一个很实用的做法:用 Obsidian vault 这类文件夹作为长期记忆。对话记录不是最好的长期记忆,文件才是。比如一个 vault 里可以有:TODO.mdpeople/projects/agent/notes/AGENTS.md。仓库保存代码,vault 保存滚动上下文——谁参与了项目,做过什么决策,当前卡点是什么,下一步要跟进谁,哪些信息以后还会用。这些都不应该只躺在某次对话里,因为对话是过程,文件才是资产。

对程序员的启发

总结一下,这篇文章真正的价值在于提醒我们:AI 编程的下一阶段,不是让 AI 写更多代码,而是让 AI 接管更多工作流。程序员的能力也会跟着变化。以前比的是谁写代码快、谁熟悉框架、谁 debug 强;现在还要加上:谁能定义清楚目标,谁能设计可验证的工作流,谁能把重复流程沉淀成 Skill,谁能维护长期上下文,谁能调度多个 Agent 和工具完成闭环。从代码的开发者转型成 Agent 的调度和环境提供者——这已经是一个新职业了。古法程序员这个职业正在终结。

Codex 仍然从代码出发,但它已经开始往代码之外扩展。从 repo 到浏览器,从浏览器到桌面,从桌面到 Slack/Gmail/Calendar,从一次任务到长期线程和自动化。这条路走下去,Codex 会越来越像一个通用电脑工作系统。所以,如果现在还只是把 Codex 当成“帮我改代码”的工具,可能有点低估它了。更好的用法是:给它线程,给它工具,给它记忆,给它验证器。让它从写代码开始,逐步接管你电脑上的重复工作。

来源:https://cloud.tencent.com.cn/developer/article/2695139
上一篇实测比DingTalk A1更强:这款用户体验出色好用 下一篇多模型验证成本优化策略与企业级ROI下篇
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网