OpenAI又发新品了,不过这次不是语言模型,也不是更会聊天的新ChatGPT,而是一个全新的AI智能体。
当地时间1月23日,OpenAI正式发布了Operator,一个可以上网为用户执行任务的智能体。用OpenAI自己的话来说就是:“一种能够独立为你工作的AI——你给它任务,它为你执行。”

这意味着,相比以往的ChatGPT,Operator真正突破了对话框的边界。从前,ChatGPT不管怎么迭代,本质上还是个聊天机器人,靠对话给你出主意。而Operator则直接摆脱了这种束缚,可以“代劳”替你做事。
用户对此兴奋不已,在OpenAI官宣消息前的几个小时,就有Pro用户发现界面出现了Operator选项,疑似就是此前传闻的智能体。随后,ChatGPT一度宕机,很可能是短时间内涌入的用户量太大所致。
这种兴奋完全可以理解——毕竟从对话框里迈出来,就完全是另一个层级的存在了。
当然,研究这类产品的远不止OpenAI一家。几乎就在Operator发布的同时,至少有两款同类产品亮相。
一个是Perplexity推出的安卓版助手,具备多模态交互体验和跨应用任务执行能力。另一个是国内大模型公司智谱在1月23日正式上线的电脑端智能体GLM-PC,时间上甚至抢了OpenAI一步。顾名思义,这也是一个可以协助用户完成各类电脑任务的智能体。
更早一些,微软推出了Copilot Actions,用AI自动执行重复性任务。此外,在1月初,微软的研究团队还推出了一项名为“大型行动模型(Large Action Model,简称LAM)”的AI技术。
AI能做的事越来越多,一个直接的问题随之而来:替代人类的可能性是不是也更高了?
在发布Operator之前,OpenAI CEO山姆·奥特曼(Sam Altman)自己就说过:“我们相信,到2025年,我们可能会看到第一批AI袋里‘加入劳动力队伍’,并实质性地改变公司的产出。”
弗吉尼亚大学经济学教授安东·克里内克(Anton Korinek)甚至断言:“任何只能在电脑前完成的工作,在未来24个月内,都可以由人工智能袋里完成。”
我们的第一批AI同事,真的被造出来了吗?
01
先来看看OpenAI的这款新品Operator。
操作方式其实很简单——还是从对话框开始。用户先选择可能会用到的网页(比如电商网站、可以预订餐位的本地生活平台、旅行网站等),然后用自然语言描述任务,Operator就会在浏览器里“动起来”,开始执行。
例如,在直播演示中,OpenAI现场演示了这样一个场景:在Operator中选中OpenTable,然后输入“给我预订一张今晚7点Beretta餐厅的桌子。”Operator立刻开始执行,打开OpenTable的网页,找到Beretta餐厅页面,选择时间和就餐人数。

执行过程会以小窗口的形式在对话框中显示,也可以选择最大化,这时Operator会缩到侧边栏。这样一来,用户既能清楚看到Operator在浏览器里的所有行为,也能随时在对话框中输入新的指令。
如果在操作过程中需要用户登录账号、支付等环节,Operator会主动发起请求。此外,用户也可以随时接管操作。
从当地时间1月23日开始,位于美国的ChatGPT Pro用户可以使用Operator的“研究预览版”。奥特曼表示,这只是暂时的:未来会逐步拓展到更多地区,预计几个月后,会拓展到Plus用户。
从实际反馈来看,Operator的使用体验相当不错。
知名AI博主、The Rundown AI的创始人Rowan Cheung在官宣前就深度体验了一把,Operator的一些操作让他感到惊喜。当Operator执行任务时,如果指令中提到的某个网页打不开,它会自行寻找替代方案,比如改用搜索引擎检索;当任务比较复杂,Operator会不断和Cheung确认偏好,但执行流程始终没有中断;Cheung想要获取的信息并不公开,Operator尝试了各种方法之后,还是检索到了一篇可靠的博文推荐给他;甚至在被“是否是人类”的验证拦住时,Operator也会向Cheung发起确认。

换句话说,Operator在执行任务时“自主性”相当高,会做各种尝试,而且连续性很好,可以在过程中反复与用户协同,最终完成目标。
缺点当然也有。硅谷小有名气的连续创业者格雷格·伊森博格(Greg Isenberg)在X上有42万粉丝,他体验后总结:Operator有时会在执行复杂任务时卡住,并且目前每天有使用次数限制。
平心而论,同样的任务交给一个人类帮忙,可能丝滑程度都未必比得上Operator。
了解了Operator的功能和表现,就不难理解为什么ChatGPT会被汹涌而来的流量“挤爆”了。对话框里的ChatGPT已经掀起了AI巨浪,也切实地改变了很多人的生活——而走出对话框,想象空间显然更加广阔。
02
对于Operator,OpenAI的定调也很高。
Operator推出之际,奥特曼在直播中表示,Operator的发布意味着OpenAI进入了Level 3的阶段。OpenAI将AI到AGI(通用人工智能)的过程分为五个等级:聊天机器人Chatbots、推理者Reasoners、智能体Agents、创新者Innovators、组织Organizations。
而OpenAI的首席产品官Kevin Weil近期在达沃斯世界经济论坛上也说:“我认为2025年将是智能袋里真正实现的一年,我们将从现在的状态迈入一个新的阶段。”

图注:OpenAI首席产品官Kevin Weil(右)正在接受《华尔街日报》采访
正在促成“2025年智能体真正实现”的,远不止OpenAI一家,众多AI厂商已经纷纷入局。
最明显的信号之一,是Perplexity几乎在同一时间推出了安卓版“Perplexity Assistant”,同样是一个走出对话框、可以直接执行任务的工具。使用这个应用程序,用户可以基于屏幕提问,或者用摄像头让它与现实世界互动。除此之外,它还能写邮件、设置提醒、订餐、叫车等。这需要调用其他软件,目前已经支持的第三方软件包括Spotify、YouTube、Uber等。
在国内,智谱也发布了电脑智能体GLM-PC,就在OpenAI发布Operator的前一天,同时还宣布了移动端AutoGLM的最新升级。在智谱开放日上,CEO张鹏现场演示,掏出手机说了几句话,观众就收到了红包。
往前稍加回溯,智能体产品已经频繁出现在市场上。
微软有操作系统的加持,在深度集成的Copilot AI中展开了各种尝试。比如去年10月,微软一口气推出了10款AI袋里,自主执行特定任务。谷歌则在去年12月官宣了Project Mariner,和OpenAI的Operator非常相似,也是一个可以袋里控制浏览器的智能体。同时,谷歌还同步推出了帮助探索复杂内容的Deep Research、帮助完成编码任务的Jules。
早在2023年12月,比尔·盖茨就已经做出了预言,发布了一篇题为《AI将彻底改变你使用计算机的方式(并碘伏软件行业)》的文章。
如今,研究机构Gartner将AI袋里列为2025年十大技术趋势之一。“AI袋里”这个词,成了科技界名流们挂在嘴边的热门词汇。
03
普通用户在指示AI袋里帮忙点了个外卖的同时,也一定会想到一个问题:AI都能直接执行任务了,离替代我工作还有多远?
其实,发布AI袋里的公司早已盯上了企业用户——也就是打工人们的老板。
奥特曼在本月初发表了一篇博文,其中写道:“我们相信,到2025年,我们可能会看到第一批人工智能袋里‘加入劳动力大军’,并从根本上改变公司的产出。”
“并从根本上改变公司的产出”——在企业主听来,这代表着成本降低、效率提升;在打工人听来,则意味着“失业”的脚步在靠近。
这个走向并不难猜到。困在对话框和个人用户中的聊天机器人,同样也困在盈利难题中。奥特曼在一次采访中就表示,目前Plus用户背后的成本超过了每月20美元的订阅费用,Pro用户背后的成本也超过了200美元。
一方面,OpenAI们期待通过规模化效应来削薄成本。但这需要投入大量财力,而且并非一蹴而就——OpenAI在扩大算力方面的最新努力,是与甲骨文、软银合资建立星际之门公司,宣称投入金额会达到5000亿美元。
另一方面,就是拓宽赛道,在“给用户提供订阅服务”之外寻求更广阔的盈利空间。
微软、Salesforce、ServiceNow、Workday等公司在去年都推出了AI袋里,并且在宣传时强调,这些袋里可以帮助企业在招聘员工、联系潜在销售线索、创建营销和管理信息技术等方面更加省心。
《华尔街日报》在近期的报道中援引一些企业的技术高管称,这意味着可以减少员工工作时长,甚至减少招聘新员工。
研究机构Gartner预测,到2028年,至少15%的日常业务决策将通过袋里人工智能自主做出,而2024年这一比例是0%。但到那时,25%的企业违规行为也将与人工智能袋里滥用有关。
实际上,已经有不少企业率先“吃螃蟹”了。
穆迪公司过去很多研究工作,比如行业比较或查看公司提交给美国证券交易委员会的文件等,都是外包给美国之外人工成本相对较低的地区,但现在开始利用AI袋里来完成。
eBay则使用AI袋里来帮助编写代码和开展营销活动,并计划推出能帮用户寻找商品、帮卖家展示商品的袋里。
的确,目前的AI袋里还需要在人类的协作下才能完成任务。但未来真的远吗?回想一下,3年前我们还没有ChatGPT、豆包、文心一言,Siri还像个“人工智障”;而如今,它们已经成了很多人工作流中不可舍弃的一部分。
弗吉尼亚大学经济学教授科里内克在接受Axios采访时表示,虽然仍然需要人类来监督人工智能的工作,但袋里将在未来两年内开始取代人类:“任何只能在电脑前完成的工作,在未来24个月内,都可以由人工智能袋里完成。”

图源:AI制作
此外,他还透露:“从我与商业领袖的对话中得知,大多数雇用白领的大公司都在研究如何利用AI来实现自动化。”
甚至于,麦肯锡高级合伙人兼AI专家Lareina Yee认为,公司必须想办法调整运营,以适应人工智能员工。将AI袋里引入工作场所的最大挑战不是技术,而是人:“这不是一个技术战略时刻,而是一个商业战略时刻。”
打工人们能做的,恐怕只有在尽量赶上时代,熟悉最新的AI趋势,并用它来提高工作表现。很快,当我们在职场上谈到一个人的“可替代性”高不高时,将不再是指被另一个人类替代。
