OpenAI Codex全新升级:支持任务调度断点续传与Mac应用操作

智东西
编译 刘煜
编辑 陈骏达
今天,OpenAI为其AI开发助手Codex带来了一系列重磅更新。这次升级的核心,是让Codex从一个需要明确指令的“对话伙伴”,转变为一个能在后台自主工作的“智能协作者”。

▲OpenAI官宣更新(图源:X)
最引人注目的变化,莫过于专为Mac用户设计的“后台智能体”功能。简单来说,Codex现在能像一个真正的助手那样,在用户操作其他软件的同时,于后台同步处理任务。它不再需要接管整个屏幕,而是可以独立地“观看”屏幕、“思考”并执行点击、输入等操作。
正如OpenAI产品管理总监卡弗里・林奇(Ka vvy Lynch)向媒体解释的那样,Codex的新能力在于“在后台使用你电脑上的应用,而不是接管整台电脑”。这标志着AI助手与操作系统更深层次的融合,开发者可以将更多精力投入到需要创造力的核心工作中,而非被琐碎的协调与信息搜集所困。
好消息是,这些新功能已直接集成到现有的ChatGPT账户中,用户无需再为API密钥等配置问题烦恼,开箱即用。目前,更新后的Codex桌面应用已上线,支持macOS和Windows系统,但其中“后台操控”这一核心功能在初期仅面向macOS用户开放,并即将扩展至欧盟和英国地区。
一、新增Computer Use功能,Codex在后台就能帮你干完活
本次更新的技术基石是“计算机使用”(Computer Use)功能。这项功能让Codex突破了传统聊天机器人的边界,能够像人类一样,在设备的所有应用程序中进行查看、点击和输入。关键在于,这一切都在后台静默完成。
这意味着Codex获得了视觉理解和执行能力,可以同时运行多个智能体任务,且完全不影响用户在前台的其他工作。对于Windows用户,虽然可以体验到Codex应用的其他更新,并能从Windows应用中提取信息,但类似Mac平台的光标级后台交互功能,在初期暂未提供支持。
二、化身统一工作台,新增多场景功能借插件生态打通全工具链
OpenAI的野心不止于系统操控。此次更新将Codex应用塑造成了一个功能强大的统一工作台,旨在覆盖从代码审阅到远程基础设施管理的全流程工作。为了达成这一目标,Codex新增了多项关键能力:
1、内置浏览器:开发者可以直接在应用内浏览器页面上添加评论,为智能体提供更精准的指令。
2、视觉基础能力:通过集成gpt-image-1.5模型,Codex现在可以结合屏幕截图和代码,在同一工作流程中生成产品概念图、前端设计甚至游戏视觉效果。
3、扩展侧边栏:应用新增了对PDF、电子表格、幻灯片等非代码文件的丰富预览功能,并配备了摘要面板,用于追踪智能体的执行计划和信息来源。
4、终端与SSH:更新后的Codex支持多终端标签页,并上线了SSH连接远程开发环境的阿尔法测试功能。
为了串联这些分散的任务节点,OpenAI还为Codex一次性新增了超过90款插件,集成了Atlassian Rovo、CircleCI及GitLab Issues等主流开发工具。这些插件如同给Codex装备了各种“技能包”和“连接器”,使其能够跨工具收集上下文并执行复杂操作。有观点指出,用户可以通过@提及来指定Codex使用某个应用,即使不指定,Codex也能自行判断该调用哪些工具。
三、支持长期任务后台执行,增强记忆功能并可主动建议优化工作流
自动化能力的扩展是另一大亮点。Codex现在支持复用对话线程和上下文,能够自动唤醒以继续执行那些需要数天甚至数周才能完成的长期任务,并可以自主安排后续步骤。
换句话说,Codex具备了“记忆”和“排班”能力。它不再是“挤一下动一下”的简单工具,而是可以记住任务进度,在你休息时自动在后台接力工作,实现断点续传。例如,一个产品经理无需再手动在Slack、邮件和Notion之间复制粘贴信息,Codex可以自动抓取并整合这些更新,直接同步到开发流程中。
为了支撑这种自动化效率,OpenAI同步推出了记忆功能预览版。Codex会记住用户偏好、历史修正内容等关键信息,从而减少每次会话都需要重复设置指令的麻烦。
更智能的是,Codex开始学会“主动思考”。它能够结合上下文、插件能力和记忆信息,主动为用户建议后续操作。比如,它可以自动梳理出Google Docs中待处理的评论,从Slack、Notion和代码库中提取关联信息,最终生成一份按优先级排序的待办事项清单,帮你规划一天的工作起点。
结语:技术不断升级,人机协同边界持续拓展
总体来看,此次Codex的全面升级,是OpenAI在推动AI从对话交互向全流程自动化、上下文智能协同迈进的关键一步。通过深度融入操作系统,AI正逐渐承担起那些重复、低效的环节。
当然,这些新功能目前仍处于早期预览阶段,其实际体验和生态完善度还有待观察。值得注意的是,在Codex更新之前,Anthropic Claude已于今年3月在其桌面端产品中推出了类似“Computer Use”的能力体系。这预示着,让AI更深入地理解并操作数字环境,已成为行业明确的技术竞赛方向。
随着AI持续渗透操作系统与开发工具链,一个更自动化、更智能的“数字同事”时代正在开启。未来,人机协同的边界,或许将因此被重新定义。
相关攻略
龙虾之父Peter Steinberger,在社交平台X上晒出了一张自己的CodexBar后台截图。 一张相当离谱的截图—— 上面透露出的信息和数字,足以让任何一个关注AI成本的人心头一震: 过去30天,他调用的OpenAI API总费用达到了1,305,088美元,约合软妹币940万元; 同时消耗
一场围绕人工智能伦理与使命的法律大战,迎来了关键性裁决。北京时间5月19日,据路透社报道,美国加州奥克兰联邦法院陪审团就埃隆·马斯克起诉OpenAI一案作出判决,裁定马斯克败诉。 陪审团经过不到两小时的审议后一致认定,OpenAI无需为马斯克所提出的“背离造福人类创始使命”的指控承担法律责任。裁决的
苹果与OpenAI合作因商业回报未达预期出现裂痕。腾讯地图推出AI骑手模式优化配送。百度成立模型委员会强化AI布局。荣耀将发布搭载云台系统的RobotPhone。Anthropic拟以9000亿美元估值融资。阿里发布智能体开发工作台Qoder1 0。千问APP接入药监局数据。发那科与英伟达深化合作,利用AI加速机器人开发。
4月22日,路透社发布了一则引人关注的消息:佛罗里达州总检察长詹姆斯·乌特迈尔于当地时间周二(4月21日)宣布,该州将对OpenAI及其人工智能应用ChatGPT展开刑事调查。事件的起因,与去年发生在佛罗里达州立大学的一起致命枪击案有关。 回顾案情,去年4月,一名枪手在佛罗里达州立大学开枪,导致两人
4月21日,OpenAI对其图像生成能力进行了一次重要升级,正式推出了ChatGPT Images 2 0模型。这次更新并非独立发布,而是通过现有的ChatGPT及Codex平台直接向用户推送。从官方释放的信息来看,新模型在理解用户指令的精准度和生成图像的细节丰富度上,都有了肉眼可见的进步。 更值得
热门专题
热门推荐
东南亚智能手机市场第一季度平均售价同比上涨19%,达349美元。出货量虽下滑9%,但市场总规模增长8%,呈现“量减价增”态势。这表明消费者开始转向高端机型,市场增长动力正从销量扩张向价值提升转变。
代币归属期指代币在发行后按预定时间表逐步解锁的过程。该机制旨在激励项目长期发展,防止早期投资者或团队成员大量抛售导致市场波动。归属期通常包含锁定期与释放期,具体规则由项目方设定。理解此概念有助于评估代币的潜在流通量与市场风险。
近日,小鹏汽车正式宣布,基于其旗舰SUV车型GX打造的首款Robotaxi(自动驾驶出租车)量产车已成功下线。这一重要进展标志着中国L4级高阶自动驾驶技术的商业化落地,迈出了坚实而关键的一步。 根据官方披露的核心信息,这款自动驾驶车型创造了多项行业纪录:它不仅是中国首款实现全栈自研、前装量产的Rob
5月19日,一则新闻引发广泛关注与讨论:河南濮阳一位主营冷冻榴莲果肉的商家,因遭遇买家恶意发起“仅退款”操作,在沟通无果后,选择驱车数百公里前往山东进行维权。几乎在同一时间,浙江杭州萧山区盈丰街道,也因类似恶意退货退款问题频发,被部分电商商家列入“交易谨慎名单”。这两起典型事件,将长期存在于电商交易
5月19日,AMD完成了一项具有里程碑意义的战略举措:首次将其年度AI开发者大会的主会场设在中国。在上海,AMD董事会主席兼首席执行官苏姿丰博士发表了核心主题演讲,其中所传递的战略信号,其深远意义远超单纯的技术发布。 贯穿整场演讲,一个核心信息被不断强化:中国市场对于AMD的全球战略重要性,已提升至





