OpenAI 推出的 Codex 确实越来越好用,这一点已经没有什么争议了。
不久前它刚刚上线了浏览器控制功能,能够调用内置浏览器来验证前端开发效果,真正实现了开发和预览的闭环。macOS 版本还增加了“电脑使用”能力,操作起来相当顺手。
今天 Codex 又带来了一项新能力:可以直接调用本地 Chrome 浏览器了。
实际体验了一下,两个字:非常流畅。
这里有个关键点值得注意:当调用本地 Chrome 时,Codex 可以直接读取浏览器中已有的会话信息。也就是说,你无需再次登录,Chrome 里保存的账号密码、登录状态都能直接复用。
这样一来,许多需要登录才能执行的操作,都可以放心交给 Codex 来处理。用过 Claude 的朋友应该知道,这个功能 Claude 早就具备了。
Codex 这次的操作,说是“借鉴”也不算过分。但对普通用户而言,是否原创根本不重要——重要的是,Codex 终于也拥有了 Claude 同款的高效功能。
这个功能确实值得详细聊一聊,下面我把操作流程完整走一遍。
先将本地的 Codex 更新到最新版本,然后点击插件选项,就能看到一个新的 Chrome 插件入口。
点进去之后,点击右上角的“添加到 Codex”。
接着再点击“安装 Chrome”。
这样,Codex 端的插件就安装完成了。
接下来还需要安装 Chrome 浏览器侧的对应插件。
全部安装完毕后,Chrome 插件的右上角会出现一个“在对话中使用”的按钮,点击即可启用。
或者直接新建一个对话,输入 @Chrome 命令,然后就能开始使用了。举个例子,让它帮你发布一条推特。
这时你会看到一个紫色的边框。这其实是 Chrome 的分组功能,所有操作都会在一个独立的分组里进行,不会影响你原本打开的网页。
它会自动调出 X 平台的发布界面,填写好内容,然后等待你最后的“发布”指令。
从对话记录来看,确认发布后它会立即执行,发布完成还会自动把分组里的网页关掉。整个过程非常顺滑流畅。
唯一碰到的问题是,我的 Windows 版本突然无法连接任何插件,最后换成 macOS 版本才成功运行。
我怀疑是本地环境的问题,因为之前一直能用的内置浏览器调用功能也失灵了。
按理说,这次发布是同时支持 Windows 和 macOS 双端的。
测试时还发生了一个小插曲:X 平台突然显示账号被封,吓了我一跳,刷新一下又恢复正常了。
像这种低频操作其实风险不大,而且完全是模拟操作。当然,有些平台明确禁止 AI 自动操作,这一点需要留意。
有了这个功能,基本上所有需要通过浏览器完成的事情,都可以交给 Codex 来代劳了。
