游乐游手机版
首页/业界动态/文章详情

OpenAI与Anthropic找到AI付费场景用户嫌贵仍持续使用

时间:2026-05-29 08:00
编辑 | 王凤枝 不少人已经将“小龙虾”抛在脑后。 今年三月,它让许多人首次真切体会到:AI不仅能聊天,还能动手操作了。各类智能体层出不穷,人人都在热议“下一个操作系统级入口”。然而到了五月,除少数发烧友外,几乎无人再打开它。 于是,一个看似合理的结论悄然浮现:智能体也降温了。 但知名技术博主、开源

编辑 | 王凤枝

不少人已经将“小龙虾”抛在脑后。

今年三月,它让许多人首次真切体会到:AI不仅能聊天,还能动手操作了。各类智能体层出不穷,人人都在热议“下一个操作系统级入口”。然而到了五月,除少数发烧友外,几乎无人再打开它。

于是,一个看似合理的结论悄然浮现:智能体也降温了。

但知名技术博主、开源开发者兼AI工具评论者西蒙·威利森(Simon Willison)近日发表文章《OpenAI和Anthropic可能已经找到了PMF》,给出了截然不同的观点。

西蒙指出,OpenAI和Anthropic或许已经找到了产品-市场契合(PMF),使产品真正嵌入用户的工作流程。原因并非聊天机器人更擅长对话,也不是演示效果更惊艳,而是Claude Code、OpenAI Codex这类编程智能体,已让一批用户从“尝鲜试用”转向“天天使用、重度依赖、即便涨价也继续用”。

使用人数增加,用量攀升,真正有价值的AI甚至开始涨价。“小龙虾”退热,只意味着智能体叙事从喧嚣进入筛选阶段;西蒙这篇文章想说的是另一件更硬核的事:AI并未凉凉,真正具备PMF的智能体,正在进入用户的账单、预算和工作流。

西蒙的核心判断

本文的重点并非“编程智能体很强”,而是OpenAI和Anthropic可能终于找到了能转化为实际收入的PMF。西蒙给出的判断标准很简单:用户是否会反复回归?产品能否被嵌入工作流?当价格变得真实,用户是转身离开,还是开始讨论如何继续使用?

第一组证据是使用深度的变化。早期AI工具多属低频试用:问一个问题、生成一段文案、尝试一次演示,感觉新鲜,但未必次日再打开。Claude Code、Codex这类工具则不同,它们被融入每日工作流:阅读项目、修改文件、运行测试、解释报错、继续下一轮迭代。用户并非来观摩能力,而是将部分工作交给它推进。

第二组证据来自账单。西蒙用自己的使用量算了笔账:他每月付给Anthropic 100美元、OpenAI 100美元,共200美元;但过去30天,按API token价格折算,Claude Code大约消耗1199.79美元,OpenAI Codex约980.37美元,合计2180.16美元。也就是说,一个中等重度用户在个人订阅中“包住”的实际调用量,已接近订阅费的11倍。

这一反差至关重要。个人订阅用户觉得自己赚到了,而模型公司则看到另一面:编程智能体的真实使用量如此之大,不能再被当作赠品。当智能体真正开始干活,它不再是一次问答,而是一连串观察、推理、调用工具、修改、报错、再修改的高强度计算。

西蒙还提到,到2026年4月,OpenAI Codex和Anthropic的Claude Code / Cowork在企业使用中将更直接地与API价格对齐。OpenAI的Codex计价在4月从按消息转向更接近token用量;Anthropic的企业方案也从“企业订阅包含典型工作日用量”的假设,转向“订阅费之外,使用量另按API价格计费”。这意味着企业客户不再只是订阅一个AI软件,而是在为真实的推理消耗付费。

这就是西蒙认为OpenAI和Anthropic可能找到PMF的核心证据:编程智能体不仅让人觉得很酷,更开始让用户愿意为实际使用支付真金白银。真正具备PMF的产品,往往不是所有人立刻欢呼,而是客户在预算会议上讨论如何管控,而非直接取消。

为什么偏偏是编程智能体

这听起来像程序员小圈子的故事,其实不然。编程智能体率先脱颖而出,并非因为程序员最爱尝鲜,也不是因为他们最会写prompt,而是因为代码工作天然为AI提供了验收系统。

\

代码能否运行,可以验证;测试是否通过,可以验证;diff改了什么,可以检查;git能否回滚,可以控制;日志、报错、类型检查、CI,都在为智能体提供密集反馈。AI最危险之处不是不会说话,而是它很会说,但你不知道它究竟做对了没有。代码世界复杂、抽象、容易出错,却也更容易暴露错误。

这就是编程智能体与其他许多智能体的分水岭。一个会议智能体总结得好不好,往往需要人重新读一遍;一个研究智能体提供的资料是否可靠,常常要回源核对;一个销售智能体自动发邮件,出错就是品牌风险;一个金融智能体真要操作账户,误操作可能直接造成损失。越靠近真实业务,越需要权限、审批、审计、回滚和责任边界。

编程智能体当然也会犯错,但它们所处的流程更容易将风险限制在可检查的范围内。一个智能体修改代码,你可以看diff、跑测试、让它重试,再决定是否合并。换句话说,代码并非AI最简单的应用场景,却可能是最早形成可靠反馈闭环的复杂场景。

不过,这也带来了一个反向门槛:编程智能体用得越重,对用户的代码质量、架构理解和review能力要求就越高。AI帮你写出代码,不等于你能长期维护它;它降低了构建门槛,也把验收和维护的责任更清晰地推到了人面前。

真正的门槛不是会不会写prompt,而是能否为AI建立验收标准。西蒙那篇文章中的PMF判断,背后的逻辑正是这一点。

智能体开始被筛选

过去一年,“智能体”这个词被用得太泛滥了。什么都可以称为智能体:销售智能体、客服智能体、会议智能体、招聘智能体、财务智能体、个人助理智能体。很多产品在初次演示时确实有冲击力,模型会自己分步骤、调用工具、从一个网页跳到另一个网页,仿佛真的开始替人做事。

但演示不等于PMF。让AI自动运行十步,与让它每天稳定完成一项真实工作,中间隔着上下文、权限、成本、安全、审计和失败兜底。用户第一次看到它能动手会兴奋;第三次发现它会乱点、乱填、乱花token,就会开始问:它到底能接入什么系统?谁批准它行动?它出错谁负责?我能否回滚?

这并非说泛智能体没有前途。西蒙的写法更为克制:目前最清楚看到PMF的是编程智能体。其他智能体方向当然也可能成立,只是它们还需要证明自己能从“能演示”走到“能日常使用”。

会聊天的智能体不稀缺。会点按钮的智能体也不一定稀缺。真正稀缺的是那些能稳定完成高频任务、能被验证、能被纳入真实流程、出错后能缩小事故半径、变贵后用户仍愿意继续使用的智能体。

西蒙文中提到的Microsoft和Uber案例,也可以从这个角度理解。企业预算被Claude Code之类的工具提前消耗完,表面上看像是坏消息;但从产品角度看,它也说明使用需求比原先预算假设强得多。预算吃紧,不等于产品没有价值,很多时候恰恰说明产品已经从“可有可无的新玩具”变成了“财务部门必须重新核算的生产力工具”。

这也是PMF的另一种表现:不是媒体继续兴奋,不是用户继续晒图,而是采购、财务和技术团队开始认真讨论:如何限制用量、如何分配预算、如何将其纳入正式流程。

这和普通人有什么关系

对普通人而言,氛围编程(vibe coding)的价值在于,很多想法第一次可以低成本落地。一个网页、一个内部工具、一个自动化表格、一个报名系统,以前可能需要找开发、写需求、排期、外包,现在可以先做出一个粗版本,拿给真实用户或同事看。

不过,真正重要的不是“人人都能写代码”,而是“人人都要学会验收AI做出来的东西”。AI可以降低构建门槛,但不能替你承担维护责任。一个原型能跑,与一个产品能长期被使用,完全是两回事。

这也恰好回到西蒙的判断:编程智能体先接近PMF,不是因为它们会写代码,而是因为代码世界有一套更清晰的验收机制。普通人能从这件事中学到的,不是写prompt的技巧,而是如何将一个任务变成可执行、可检查、可修正的流程。

筛选开始了

智能体没有凉凉,因为账单开始说话了。西蒙文章最有趣的地方在于,它没有继续追问“模型又强了多少”,而是把问题换成了:谁已经找到了用户愿意长期使用、并持续付费的场景。Claude Code、Claude Cowork、Codex这些编程智能体,是目前最清晰的样本。

\

他顺手算了另一笔账:这些公司不仅在收钱,推理调用越频繁,算力成本越高。智能体从回答一句话变成连续执行任务,最终会同时成为供应商的收入、客户的账单和云算力的压力。

“小龙虾”热潮的降温,也并非坏事。它让讨论从“什么都能智能体化”回到更朴素的产品问题:是否存在真实痛点?是否有日常使用?是否有验收闭环?是否有价格承受力?

如果答案是肯定的,就会从玩具变成工具,从工具变成工作流,从工作流变成预算项;如果答案暂时不清楚,就需要继续等待真实使用来验证。

所以,不要问AI是不是凉了。

要问:哪些AI已经开始让人愿意付真实账单,哪些智能体还只是让人看了一眼热闹。

前者才是PMF。

后者还在接受筛选。

来源:https://www.163.com/tech/article/KU1M7L4V00097U7T.html
上一篇2026年四款小屏直屏轻薄高颜值旗舰手机横评 下一篇微博2026财年Q1归母净利润同比降67.55%至3471.5万美元
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
九号N1机甲风电动车发布 模拟声浪轻量化车架3499元起
业界动态 · 2026-05-29

九号N1机甲风电动车发布 模拟声浪轻量化车架3499元起

九号发布N1机甲风电动车系列,三款起售价3499元。N170极速47km h,轻量化车架;N185极速55km h,可选模拟声浪;旗舰N190极速60km h,标配模拟声浪及双通道ABS,7月上市。

九号2026新品发布会最强阵容连发4款新车重新定义好车标准
业界动态 · 2026-05-29

九号2026新品发布会最强阵容连发4款新车重新定义好车标准

九号公司发布2026年新品,推出N1、M1、M3及Fz5四款新车,覆盖电摩与电自领域。N1主打短轴距声光电酷玩体验,M1配备双通道ABS与100公里真续航,M3下放AXC车架技术,Fz5首搭载双向转把功能。同时推出3年原厂换新质保等用户权益。

世界超级摩托车锦标赛阿拉贡站张雪机车超级杆位赛获亚军
业界动态 · 2026-05-29

世界超级摩托车锦标赛阿拉贡站张雪机车超级杆位赛获亚军

5月29日,世界超级摩托车锦标赛(WSBK)阿拉贡站传来一则引人瞩目的消息——中国摩托车制造商“张雪机车”旗下的法国车手瓦伦丁·德比斯,在WorldSSP组别的超级杆位赛中成功夺得第二名。 先简要科普一下赛事背景:世界超级摩托车锦标赛(WSBK)是由国际摩托车联合会于1988年创立的顶级公路摩托车赛

英雄联盟海克斯大乱斗重大更新 移除羁绊新增技能符文
业界动态 · 2026-05-29

英雄联盟海克斯大乱斗重大更新 移除羁绊新增技能符文

英雄联盟海克斯大乱斗将在26 12版本移除羁绊系统,上线技能符文体系。该符文能重构技能释放逻辑,实现布里茨钩五人、拉克丝定全队等效果。部分原有羁绊效果转为独立专属符文,更新预计2026年6月中旬登陆国服。

领克10/10+正式上市限时价16.99-23.59万号称弯道之王
业界动态 · 2026-05-29

领克10/10+正式上市限时价16.99-23.59万号称弯道之王

```html 5月29日晚间,领克终于将其备受关注的中大型运动纯电轿车正式推向市场——领克10与领克10+同步上市,官方直接打出“弯道之王”的旗号。我们先不深究它是否真能“弯道超车”,单从价格来看,就已经颇具冲击力。 先奉上一张价格速览表,让大家心里有个底: 领克 10 701 长续航 Max:指